PR

ITパスポート 令和6年度 公開問題(過去問) 問78 解説

ITパスポート 令和6年度 公開問題(過去問) 問78 について解説します。

問題

問78 利用者がスマートスピーカーに向けて話し掛けた内容に対して、スマートスピーカーから音声で応答するための処理手順が (1) ~ (4) のとおりであるとき、音声認識に該当する処理はどれか。

(1) 利用者の音声をテキストデータに変換する。
(2) テキストデータを解析して、その意味を理解する。
(3) 応答する内容を決定して、テキストデータを生成する。
(4) 生成したテキストデータを読み上げる。

ア (1)
イ (2)
ウ (3)
エ (4)

解説・解答

この問題は、利用者がスマートスピーカーに話しかけた内容に対してスピーカーが音声で返事をするまでの一連の流れを (1)~(4) のステップで示し、音声認識に該当する処理を選択する問題です。

(1) 利用者の音声をテキストデータに変換する
この処理は、音声認識(Speech Recognition)に該当します。
音波として入力されたユーザーの声を、音響モデルや言語モデルに基づいて、テキストに変換します。
たとえば「今日の天気は?」という音声を「今日の天気は?」という文字列に変換するイメージです。
技術的には、以下の技術が関係します。
 ・音響モデル(HMMなど)
 ・辞書データ(単語・発音辞書)
 ・ディープラーニングベースのASR(Automatic Speech Recognition)
この処理が音声認識です。

(2) テキストデータを解析して、その意味を理解する
これは自然言語処理(NLP)の領域です。
入力されたテキストを「文法解析」し、「意図(インテント)抽出」や「スロットフィリング(情報抽出)」を行うステップです。たとえば、テキストが「今日の天気は?」 の場合は「天気情報取得」という意図を抽出するイメージです。

(3) 応答する内容を決定して、テキストデータを生成する
これは対話管理・応答生成に該当します。
先ほどの解析結果に基づき、何を返すかを決定します。たとえば、APIを使って天気情報を取得し、応答文「今日の天気は晴れです」を生成するイメージです。

(4) 生成したテキストデータを読み上げる
この処理は音声合成(Speech Synthesis / TTS: Text-to-Speech)です。
たとえば、応答のテキスト「今日の天気は晴れです」を機械音声として生成してスピーカーから出力するイメージです。実際には、WaveNetや音素ベースのTTSエンジンが使われることもあります。

したがって、音声認識に該当するのは、アの(1)になります。
以上により、この問題の解答は「ア」になります。