Philip's blog #30

p208p2002 · 2023-12-13T03:04:52Z

- tags: 論文筆記 FIM LM 預訓練 - date: 2023/12/13

Autoregressive (AR) 語言模型可以通過簡單的方式學習填充文字；作者簡單的將文章中間的段落移動到結尾來讓模型學習文字填充。

作者提供了大量的證據，表明以這種方式轉換了大部分數據的模型不會損害原始的從左到右生成能力，這主要是通過衡量困惑度和抽樣評估確認的。

Fill-in-the-middle（FIM）訓練模型的實用性、簡單性和效率，作者建議未來的 AR 語言模型應搭配FIM進行訓練。

LM架構差異

依照模型架構不同，模型在生成任務能捕捉的資訊會不一樣，這點可能會讓模型在執行任務時有不同的性能表現：

The text was updated successfully, but these errors were encountered:

p208p2002 added Gitalk fill-in-middle labels Dec 13, 2023

Provide feedback