人工知能のことです具体的にいう

コンピュータに行わせることはできていない

人工知能の経済効果は2045年に121兆円

「らき☆すたオモロい」
は形態素解析できない形態素解析の何が難しいか。
たとえば次の日本語を見てみよう。
風の谷のナウARこれを形態素解析すると風(名詞)の(助詞)谷(名詞)の(助詞)ナウシカ(固有名詞)となる。この場合、単なる形態素解析だけだと風の「谷のナウシカ」なのか、「風の谷のナウシカなのか解釈が分かれる余地がある。
人工知能自体に嫌気がさして

プログラムである

しかし人間なら「風の谷のナウシカ」という言葉を聞いて、自然に「風の谷」のナウシカであると解釈できる。
もうひとつ例を出すとらき☆すたオモロいというツイートがあるとする。このツイートはまったく形態素解析できない。助詞がまったくないのでひとつの単語として扱うしかなくなる。それを回避するには「らき☆すた」や「オモロいを辞書に登録する必要がある。ところがネットの世界では新語や隠語が多く登場する。たとえばlonksit」「マジ草」「おはどん」などのネットスラングを形態素解析で解決するには辞書を作って登録する必要がある。

 

人工知能が医療に本格的に関わる

インターネットコンソーシアムを設立しかし現実的にはすべての新語をリアルタイムに辞書に登録することはできず、来の自然言語解析は辞書によって最初の限界に到達する。
辞書を用いる旧形態素解析がもてはやされたのは、単語がスペースで区切られている欧文に対しては非常に強力だからだ。また、データ量も次元も少なくてすむので深層学習以前からよく用いられた。
しかしスペースで区切られない日本語の場合、どこが言葉の切れ目なのか機械的に判別するのは難しい。そして前章で指摘したように、構文解析も実は万全とは言いがたい。
従来の人工知能技術の叡智を結集した機械翻訳の例を見てみよう。
大統領が行ったスピーチの一節だ。
IoT技術が普及した未来に起こる可能性の高い出来事です

人工知能のスカイネット以下はライス大学でケネディWechoosetogotothemoon.Wechoosetogotothemooninthisdecadeanddotheotherthings,notbecausetheyareeasy,butbecausetheyarehard,becausethatgoalwillservetoorganizeandmeasurethebestofourenergiesandskills,becausethatchallengeisonethatwearewillingtoaccept,oneweareunwillingtopostpone.andonewhichweintendtowin,andtheothers,tooこれをとある機械翻訳サービスを利用して翻訳すると以下のように訳される私たちは、月に行くことを選ぶ。

プログラミング教育に携われる人材が大量に不足している事だ


私たちは、この10年で月に行き、それらが容易であるのでなく、そのゴールが、私たちのエネルギーとスキルのベストを組織し、測定するのに役立つので、それらがかたいので他のことをすることを選ぶ、その挑戦がそれである私たちが延期ししぶっていること、および私たちが勝ち取るつもりであること、およびまたその他のもののもの快く私たちが受け入れるので。
言うまでもなく、これはおよそ日本語の体をなしていない。
インターネットにつながる

人工知能未来社会経済戦略本部を発足させ

人工知能ですときには言葉を話す特に問題は2回目の「Wechoosetogotothemoon」以降で、実はこの演説ではこの部分が最後まで続くひとつの文になっているため、構文解析を元にした機械翻訳では、どうしてもひとつの文としてこれを日本語で再構築しようとする。AIが悪戦苦闘した結果、大変読みづらく、また、意味もとりづらい内容になってしまっている。
私も20年前から機械翻訳を下訳として使っているが、このレベルの機械翻訳はほとんど使い物にならないことが多い。それぞれの形容詞の意味やニュアンスについて辞書を引くよりは多少速いくらいのものである。
かなりの注目を集めたWord2Vecという技術ただ、従来の自然言語処理が全然ダメかといえば、そんなこともない。
習という手法の興味深い例のひとつとしてWord2Vecを紹介しよう。