日付入りLLM文書翻訳評価用データセット
概要
大規模言語モデル(LLM)による翻訳の評価に際し,評価に用いるデータが LLM の事前学習データに含まれている場合,適切な評価ができない。本研究では,この問題を回避するために,頻繁に更新されるニュース系のリソースを利用して,英日の文書翻訳評価用データセットを構築した。本データセットは公開されており,不定期に更新される予定である。また,利用者が自ら更新できるよう,データ構築に用いたソースコードも合わせて公開する。
大規模言語モデル(LLM)による翻訳の評価に際し,評価に用いるデータが LLM の事前学習データに含まれている場合,適切な評価ができない。本研究では,この問題を回避するために,頻繁に更新されるニュース系のリソースを利用して,英日の文書翻訳評価用データセットを構築した。本データセットは公開されており,不定期に更新される予定である。また,利用者が自ら更新できるよう,データ構築に用いたソースコードも合わせて公開する。