日付入りLLM文書翻訳評価用データセット

岩月憲一; 根石将人

日付入りLLM文書翻訳評価用データセット

概要

大規模言語モデル（LLM）による翻訳の評価に際し，評価に用いるデータが LLM の事前学習データに含まれている場合，適切な評価ができない。本研究では，この問題を回避するために，頻繁に更新されるニュース系のリソースを利用して，英日の文書翻訳評価用データセットを構築した。本データセットは公開されており，不定期に更新される予定である。また，利用者が自ら更新できるよう，データ構築に用いたソースコードも合わせて公開する。

リンク

PDF