http://www.asyura2.com/18/hasan127/msg/135.html
Tweet |
読唇術で人間に勝利! AIの恐るべき動画認識は ココまできている!
http://diamond.jp/articles/-/166087
2018.5.3 大村あつし ダイヤモンド・オンライン
東京オリンピックの喧騒が去った2020年、あなたはどんな生活をしているだろうか?
AIによってシンギュラリティは起きるか? ヒト以上にやさしいAIは登場するか? ヒトとAIはどう共存していくのか?
構想・執筆に2年、「愛」がテーマというエンターテイメント小説『マルチナ、永遠のAI。』が話題となっている。
ビットコイン、ブロックチェーン、ディープラーニング……正確な技術論と、その道の世界的権威の見解をもとに緻密に描いた作品で、SFではない、小説風の解説書というから注目だ。
実物通貨と仮想通貨、日常と非日常、ヒトとAIの境界線がどんどんなくなりつつある今、私たちはどうやって生きていけばいいのか?
AIは苦手というあなたも、これさえ覚えておけば、周囲から尊敬の眼差しを浴びるかもしれない。
2000年代中盤から「AI」と「IoT」を研究し続けてきた大村氏の特別寄稿をお送りする。
(構成・寺田庸二)
AIは画像だけでなく
動画も認識可
第12回連載では、歴史的快挙とでも言うべき「Googleの猫」を紹介しました。
これは、2012年の研究発表で、Googleの研究チームは、ディープラーニングという手法を用いて、YouTubeに投稿されたビデオの中から無作為に一千万枚の画像を取り出してAIに学習をさせたところ、「人が教えることなく、AIが自発的に猫を認識することに成功した」と発表したのです。
これは、画像認識、言い換えれば「静止画」の話ですが、実は2016年になると、CBS Interactiveが「AIが読唇術で人間に勝った」という驚きのニュースを伝えています。
この記事を読み解くと、Googleが買収した「DeepMind(ディープマインド)」が開発したAIは、読唇術で次のような結果を残しました。
ディープマインドは、BBCのテレビ番組から約5000時間の動画をAIに自己学習させたところ、唇の動きだけから約50%の単語を読み取ったそうです。
ちなみに、人間の専門家の正解率は約4分の1と、完全にAIに軍配が上がったことになります。
自動車の無人運転や嘘発見器などに
応用が期待される「動画認識」
もっとも、単語が読み取れるのと、「会話ができる」のでは雲泥の差があります。
そうした意味では、確かにAIが読唇術で人間のプロを打ち負かしたことには驚愕せざるをえませんが、まだまだ実用化には時間がかかると思われます。
ちなみに、2017年には、ポーカーで人間を破るAIまで登場し、「すでに嘘発見器程度の精度は出せる」とする専門家もいますが、そのAIが本当に人間の表情を読み取って勝利したのかは定かではなく、この結果をもってAIの動画認識を過大評価するのは危険だと個人的には感じます。
ただし、こうした動画認識のテクノロジーは、間違いなく今この瞬間も進化しており、ゆくゆくは自動車の無人運転の基幹技術になったり、AIが嘘発見器になる時代が訪れるでしょう。
また、現在、「Siri」や「OK, Google」といった音声認識ソフトを活用している人もいると思いますが、みんながみんな、スマホに向かってつぶやいている世の中はあまり想像したくないというのが私の本音です。
しかし、スマホのカメラで読唇術ができるとなると、状況は大きく変わってきます。無音でスマホに語りかけて、その回答はイヤホンで聴く。そんな時代がやって来るのかもしれません。
いずれにしても、2012年の「Googleの猫」も画期的でしたが、AIに唇の動きや表情を読み取られてしまう世界がすぐそこまで来ています。
そして、AIの「動画認識」のテクノロジーが本当に人類の幸せに寄与するのかどうか。
今後もこの分野の研究からは目が離せませんね。
さて、このAIの動画認識ですが、これは「ディープラーニング」というAIの自己学習の技術です。その中でも、とりわけ「強化学習」の成果と言えるものです。
そのディープラーニングをするAIを「子どものAI」と呼びます。
一方で、人が一から教えて丸暗記させるAIは「大人のAI」と呼びます。
同じAIといえども、両者でどれほどの違いが出るのかは、第1回連載の中で「子どものAI」である「Google翻訳」と、「大人のAI」である別の翻訳サービス(X翻訳)に同じ英文を日本語に翻訳させて、まったく異なる結果になるケースを紹介しています。現在一番人気の第2回連載「近い将来、『税理士や翻訳家は失業』という予想は大間違い」と併せてお読みいただけたら、望外の喜びです。
大村あつし IT書籍から小説まで幅広く手がける作家・ライター。エクセルのマクロ言語の解説書の売上部数は150万部を超えている。1997年に、その後国内最大規模となるマイクロソフト・オフィス製品のポータルサイト「moug」を一人で立ち上げる。2003年にはIT系資格試験の「VBAエキスパート」を中心メンバーとして創設。2007年に処女小説『エブリ リトル シング』が17万部のベストセラーとなり、中華圏や韓国での翻訳出版や2回の舞台化(2008年井上和香、2009年内山理名主演)。『エブリ リトル シング』は、第1話の「クワガタと少年」が多くの私立中学の入学試験に出題され、全国の予備校で話題となり、YouTubeで再生回数が18.5万回の人気動画に。第2弾小説の『無限ループ』も5万部に。2006年に、TOKYO MX(東京メトロポリタンテレビジョン)やテレビ神奈川など全国13の独立放送局で、AIとIoTをテーマとした90分の特別番組「IT その扉の向こうに」の司会に抜擢されたことでAIやIoTに傾倒する。著書に、ベストセラーとなった『かんたんプログラミングExcel VBA』シリーズ(全16冊)、『Excel VBA本格入門――日常業務の自動化からアプリケーション開発まで』『人生は数式で考えるとうまくいく』『仕事がうまくいく0.7の法則』など多数。静岡県富士市在住。 |
▲上へ ★阿修羅♪ > 経世済民127掲示板 次へ 前へ
投稿コメント全ログ コメント即時配信 スレ建て依頼 削除コメント確認方法
▲上へ ★阿修羅♪ > 経世済民127掲示板 次へ 前へ
スパムメールの中から見つけ出すためにメールのタイトルには必ず「阿修羅さんへ」と記述してください。
すべてのページの引用、転載、リンクを許可します。確認メールは不要です。引用元リンクを表示してください。