ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • GPT 모델 사용해보기
    NLP/KLUE 2021. 10. 12. 01:36

    자연어 생성

    • Grid Search 방식
    • model.generate를 사용하면 가장 확률 값이 높은 결과를 선택

     

    • Beam Search 방식
    • 확률의 합이 가장 커지는 방식 (문장 자체의 문법적 확률이 높아짐) 
    • 시간이 오래걸림
    • no_repeat_n_gram_size를 설정하여 결과가 반복되는 것을 막을 수 있음
      output = model.generate(
          input_ids, 
          max_length=30, 
          num_beams=5, 
          no_repeat_ngram_size=2, 
          early_stopping=True
      )​

    • Beam Search 방식은 유사한 문장을 많이 만들어냄
    • 인간이 자연어를 생성할 때, 높은 확률의 문장만 만드는 것이 아님 → temperature 설정, random sampling, top_k_sampling, top_p_sampling

    Ko-GPT를 이용하여 one-shot, few-shot, zero-shot 가능

     

    • enable_padding과 enable_truncation으로 padding, truncation 가능
    pad_id = tokenizer.token_to_id("<pad>")
    print(pad_id)
    tokenizer.enable_padding(pad_id=pad_id, pad_token="<pad>")
    tokenizer.enable_truncation(max_length=128)

     

    'NLP > KLUE' 카테고리의 다른 글

    Notes  (0) 2021.09.28
    자연어 전처리  (0) 2021.09.28
    인공지능 & 자연어 처리 타임라인  (0) 2021.09.27

    댓글

Designed by Tistory.