Diffusion 기반의 Text 생성 실험1차

Notice

Recent Posts

Tags more

Archives

관리 메뉴

걍블로그

인공지능/실험 해보기

애쉬용용 2023. 6. 5. 22:15

이전 시간에 구성한 Pre-Trained 모델 만들기

구성 아키텍쳐

학습 1차 : 진행중

- Endoer(BERT의 절반)는 학습을 하지 않고 고정함

- Quantization + Decoder(BERT의 나머지 절반) + lm_head(Text로 변환하기 위한 layer, ouput_dim이 Vocab과 동일해지도록 수정) 부분을 학습에 진행함

기대하는 출력 : 입력 문장과 동일한 문장이 출력으로 나오도록 기대중

작업중이 코드

Diffusion 기반의 Text 생성 실험2차 수정 (0)	2023.06.11
Diffusion 기반의 Text 생성 실험1차 수정 (0)	2023.06.09
Text 생성을 위한 Diffusion 모델 구조에 대한 고민 (0)	2023.06.02
LLAMA 모델을 활용한 문법 교정 모델 만들기 실험 1차 시도 (0)	2023.06.01
하고 싶은 실험 정하기 (1)	2023.05.30

'인공지능/실험 해보기' Related Articles