通信239 AIの音声認識と文字認識

投稿日:

【週刊ハンガンネット通信】第239号 (2017年7月31日発行)

AIの音声認識と文字認識

伊藤耕一

———-

アップルのiPhoneに搭載されている「Siri」に代表される音声認識システム、この性能の高さはスゴイと思っています。
また、マイクロソフトのWORDに代表される文書作成ソフトの文字認識システムも、同じ助詞が続いた時の注意喚起や、スペルミスの指摘など、こちらの性能も素晴らしいと思っています。

AI(artificial intelligence 人工知能)の音声認識と文字認識を比べると、どちらの性能が高いか? 皆さんはそんなことを考えたことがあるでしょうか?

個人的には「文字認識の性能の方が高い」と思い込んでいましたが、先日ある事象に出くわし、その認識が覆されてしまいました。今では「音声認識の性能の方が高い」と考えるようになりました。

どうしてそのように考えるようになったのか、今回の通信では書いてみたいと思います。

先日、仕事中に、ある文書をWORDで作成していました。内容は自分の業務を他の人に引き継ぐための説明です。

当初はこんな形で書き始めました。

○○資料作成業務について
・これは月例△△会議のために必要であり、会議の3日前までに作成し、上司に原案を提出すること。
・様式は□□ファイルに保存してあり、これを参照のこと。
・これまで作成したエクセルファイルのファイル名の先頭には20170807のように作成日を表示している。(後日の検索が容易になる)
・会議には同席し議事録を取ること。

こんな感じで「~である」体で書き始めました。箇条書きが多かったので、こちらの方が良いと思ったわけです。

数ページ書き進めて読み返してみると、「~である」体特有の「上から目線」「硬さ」「不親切さ」を強く感じたため、やっぱり「~です、~ます」体にしようと思いました。

こんな時に便利なのがWORDの文字置換機能で、次のように条件を指定して変換してみました。
「ること」⇒「てください」「のこと」⇒「してください」「なる」⇒「なります」「いる」⇒「います」「あり」⇒「あるので」
日本語の文法を考えながら、このように変換すればうまく行くはずと思ったわけです。

ところが、変換結果にとても驚くこととなりました。どんな文章になったと思いますか?

○○資料作成業務について
・これは月例△△会議のために必要であるので、会議の3日前までに作成し、上司に原案を提出すてください。
・様式は□□ファいますに保存してあるので、これを参照してください。
・これまで作成したエクセルファいますのファいます名の先頭には20170807のように作成日を表示しています。(後日の検索が容易になります。)
・会議には同席し議事録を取てください。

驚きの結果のひとつめは「提出すること」が「提出すてください」となったことです。私の置換指示に忠実に従ってはくれましたが「サ行変格活用」までは分からなかったようでした。

ふたつめは「ファイル」が「ファいます」となったことです。これには思わず笑ってしまいましたが、これも私の置換指示にある程度忠実に従ってくれた結果でした。
ひらがなの「いる」を「います」に変換したかっただけだったのですが、カタカナの「イル」まで「います」に変換してくれたのです。

これは、文字変換でありながらも「実は音声変換がAIの中で行われている」のだという発見につながりました。

みっつめっは「取ること」が「取てください」となったことです。こちらも私の置換指示に忠実に従った結果ですが、「撥音便の活用」にまでは置き換えることができなかったようです。

文字認識機能の開発の歴史の方が長いと思っていたので「こんなことが起こってしまうのか!」という驚きが大きかったのですが、これに比べると音声認識機能の方がはるかに優秀だなと私は思いました。

文字認識機能を持つ「電子辞書」、音声認識機能を持つ「スマートフォンのアプリケーション」、どちらも学習者が使うものですが、このような道具の利点と欠点を知っておくと、より効果的な学習と指導につながるのではないかと今回の体験から感じたわけです。

電子辞書をどのように使えば調べたい単語にたどり着くことができ、適切な活用方法の参考例を導き出せるか、このようなことは指導する私たちが踏まえておいた方が良いのではないかと感じました。

一方、音声認識の精度はかなり向上したとはいうものの、元々の音声の文法が正しくないと正しい翻訳結果が出なかったり、微妙な発音の違いで意図した翻訳結果が出なかったりすることがあります。

もしかしたら、今の学習者はこのような道具を駆使して宿題をこなしているのかも知れませんが、間違った翻訳結果がどのような経緯で生み出されたのか、紙の辞書で勉強した世代の私には想像も及ばない経緯があるような気がしてきました。

今回は偶然にもこのようなことを考える機会に出会いましたが、作文指導の際には答えの裏側にある経緯にも注意を払うようにしよう、そんな気持ちになる出来事でした。