「マイクロソフトでは、あなたのバスケットの中の動物は何ですか?

マイクロソフトリサーチとカーネギーメロン大学のチームは、画像を調べ、人間が質問する方法に疑問に答えるために機械を訓練できるシステムを開発しました。

人工知能:エルロン・ムスクとビル・ゲイツのような恐怖を抱くべきか?ビジネスにおける人工知能:遊びの状態と将来の見通し:研究:人工知能を恐れる34%;人工知能の次のフロンティア?人間の常識を学ぶ

人工知能のためのツールを開発するためのマイクロソフトの最新の努力は、所与の画像の内容に関する自然言語の質問に自動的に答えることを目的とする、いわゆる「画像質問応答」の分野に焦点を当てている。

Skypeの共同設立者は、人工知能の存在の脅威から人類を安全にしたいと考えています。

それは自転車のバスケットに座って犬の一見単純なイメージのために、それが聞こえるよりも簡単です。その質問に答えるために、「自転車のバスケットに何が座っていますか? Carnegie MellonとMicrosoft Researchの研究者は、多段階推論が必要だと指摘した。

システムは、「問題に言及されている物体(バスケットや自転車など)やコンセプト(座っているもの)を最初に見つけ出し、無関係な物体を徐々に排除し、最終的に最も重要な領域を特定する必要があると指摘した答えを推論する(例では犬)。

研究領域は、コンピュータビジョンと自然言語処理の進歩 – Googleが最近人工ニューラルネットワークを使用して進歩を誇っている分野 – に基づいています。

イメージ質問応答におけるマルチステップ推論の課題に対するマイクロソフトの答えは、Stack Attention Networksであり、画像キャプションと機械翻訳の問題を解決するために使用されている「アテンションメカニズム」への多層アプローチを提供しています。研究者はモデルの仕組みについて深く掘り下げて説明します。

マイクロソフトでは、ヘルメット搭載カメラの自転車の警告システムなど、リアルタイムでの推奨や人間のニーズを必要とする新しいアプリケーションにつながる「画期的な」可能性を認識しています。

システムは、「私の後ろの左側に何があるの?」などの質問を継続的に求めることができます。または「他の自転車は私を左から渡すつもりですか?」 「私に見えないほど近くに走っているランナーはいますか?」とMicrosoft Researchはブログで指摘しています。

AIはスマート・アプライアンス、自律的な運転、ビッグ・データ・アナリシス、AIを使って第2アフリカの研究室で大きなデータを暴走させた。人工知能; IBM Watson:AIによって作成された映画の予告編は次のようになります

発想は、人間の行動をモデリングして問題を解決することであり、スピーチシンセサイザーを介してバイカーに提案として伝達されます。答えには、事故を避けるための指示が含まれています。

マイクロソフトは自律型車両については言及していないが、最近、ボルボ社と技術協力を行うラウンドアバウトの約束をしている。

「このシステムでは、画像は深いニューラルネットワークを通って、どの領域が質問に関連しているかを判断し、無関係の情報を抑制します。」とMicrosoft Researchの深い学術研究者、Xiaodong Heはこの論文に貢献しました。

「GoogleのDeepMindは、マシンが人間のように話すことで大きなマイルストーンを主張している

スマート・アプライアンス、自律的な運転のためにAIに投資するLG

IBMがAIを使って第2アフリカの研究室で大きなデータを暴動させる

IBM Watson:AIによって作成された映画の予告編は次のようになります

人工知能