3. Seq2Seq & Beam search

NLP/1주차 2021. 9. 8. 15:15

Teacher Forcing 방식: 올바른 정보를 매 time step마다 넣어준다. 학습이 조금 더 빠르다
attention solves bottleneck problem, vanishing gradient problem, and provides interpretability

Greedy Decoding: 현재 timestep에서 가장 좋아보이는 단어 선택 -> 중간에 잘못된 단어가 생성되면 되돌릴 수 없다

아래 공식을 maximize 하는 방향으로 해결 -> 모든 경우 탐색이 불가능하다는 문제점이 존재

Beam Search: k개의 가능한 후보 중 가장 확률이 높은 경우를 선택

BLEU Score

- n-gram overlap

- precision 만 고려 (n-gram of size one to four)

- precision의 기하평균

- brevity penalty (짧은 번역에 페널티)

꾸준히 꾸준히