PR

基本情報技術者試験 令和7年度 科目A 公開問題(過去問) 問1 解説

基本情報技術者試験 令和7年度 科目A 公開問題(過去問) 問1 について解説します。

問題

問1 大規模言語モデルを用いた自然言語処理において、事前学習済みのモデルに対して行う、ファインチューニングに関する記述として、最も適切なものはどれか。

ア 強化学習を行い、最適な結果が得られるようにする。
イ 事前学習と同じデータを繰り返し用いて学習を行い、モデルの精度を高めるようにする。
ウ 大量のテキストデータを用いて学習を行い、モデルの精度を高めるようにする。
エ 特定のデータを用いて追加で学習を行い、目的とするタスクに適用できるようにする。

解説・解答

ファインチューニングとは
事前学習済みの大規模言語モデル(LLM)に対して、特定の目的やタスクに合わせた追加学習を行い、そのタスクの精度を高める手法のことです。大規模言語モデルは、事前学習によって膨大な一般知識・言語理解能力を獲得しますが、そのままでは特定領域や特定タスク向けの性能が十分でないことがあります。そこで、その分野の専門データを用いて追加学習し、モデルをタスク特化型にチューニングするのがファインチューニングです。

それぞれの選択肢について確認します。

ア: 強化学習を行い、最適な結果が得られるようにする。
強化学習は報酬に基づいて行動を調整する学習手法であり、ファインチューニングではありません。
ファインチューニングは通常の教師あり学習(ラベル付きデータでの追加学習)が中心です。

イ: 事前学習と同じデータを繰り返し用いて学習を行い、モデルの精度を高めるようにする。
事前学習と同じデータを繰り返し学習させるのは事前学習の延長にすぎず、特定のタスクに適応させるというファインチューニングの目的とは異なります。ファインチューニングは「新しい目的・新しいデータ」で追加学習するのがポイントです。

ウ: 大量のテキストデータを用いて学習を行い、モデルの精度を高めるようにする。
これはファインチューニングの説明ではなく、事前学習の説明です。大量の一般的なテキスト(Web・書籍など)を使い、言語の一般的なパターンを学習させる段階が事前学習です。

エ: 特定のデータを用いて追加で学習を行い、目的とするタスクに適用できるようにする。
ここでいう「特定のデータ」とは、例えば次のようなものです。
 ・医療用文章に特化したデータ
 ・法律相談のQ&Aデータ
 ・特定の企業のマニュアルやFAQ など
こうした特定分野・特定タスク向けのデータを用いて、事前学習済みのモデルをさらに学習させることで、そのタスクでの精度が上がる、その分野に特化した回答ができる、といった効果が得られます。
この選択肢がファインチューニングの定義に最も適切に合致します。これが正解です。

以上により、この問題の解答は「エ」になります。