Google DeepMindのCEO:AGIはまだ5〜10年先であり、AI開発の機会とリスクは密接に存在します

サンフランシスコで開催されたAxios主催の「AI+SFサミット」のフィナーレで、Google DeepMindのCEOであるデミス・ハッサビス氏が、DeepMindの研究方向性、マルチモーダルモデルやワールドモデルなどの技術的進歩、AIエージェントの開発および関連リスクについて説明しました。 また、米中間のAI競争を評価し、「人間の認知能力を持つAIシステム」が登場するまでに約5年から10年あると考え、AGIのタイムラインを稀有に推定しました。

ノーベルのオーラの祝福を受け、科学者の思考がDeepMindを支配しています

イベントの冒頭で、司会のマイク・アレンはハッサビスを5歳のチェスの神童であり、48歳のノーベル賞受賞者として紹介しました。 ハッサビスは、受賞したことがまだとても現実離れしていると認めていますが、実際の影響は明らかです。

なぜなら、AIに馴染みのない政府関係者や国境を越えた意思決定者と話すとき、「ノーベル賞」はどんな扉も素早く開ける鍵のようなもので、AIの安全性や責任ある利用などの問題について彼の話を聞きやすくするからです。彼は将来的により積極的にこの称号を活用するつもりです。

日々の仕事や経営スタイルに関して、ハッサビスは「科学者として常に第一であり、CEOは二の次だ」と強調しています。 彼の目には科学的方法こそが人類の最も重要な発明の一つであり、「仮説の立て、実験の設計、結果に基づく意見の更新」というプロセスを製品開発や組織管理に直接適用しています。

DeepMindの利点は、「世界水準の研究、世界水準のエンジニアリング能力、世界水準のコンピューティングインフラ」という三つの側面から同時に現れます。 彼は、これら三つのレベルが同時に実施されて初めて、DeepMindはAI開発の最前線に立つ資格があると信じています。

今後12か月のレイアウト:マルチモーダル進化、世界モデル、エージェント

今後12か月間のAIの具体的な進展について語る際、ハッサビス氏はジェミニが最初からマルチモーダルモデルとして設計されており、テキスト、画像、動画、音声を同時に処理できると指摘しました。 例えば、彼の最新の画像モデル「Nano Banana Pro」は非常に正確なインフォグラフィックを生成でき、モデルの視覚的理解能力が急速に向上していることを示しています。

第二の焦点は世界モデル(World Models)です。 DeepMindが開発したGenie 3は、ユーザーが動画を見るだけでなく、まるでゲームに入るかのように画面に入って約1分間、世界の一貫性と一貫性を保つインタラクティブな動画を生成できます。 この種のモデルは、AIが現実世界の外見やルールを理解する上で重要なステップと見なされています。

三つ目はAIエージェントです。 ハッサビス氏は、現在のAIエージェントが一からタスクを一から直接割り当ててしまわせるのは無理だと認めました。 しかし、彼は1年以内にAIエージェントへの信頼が確実に高まると予想しています。 Googleの目標は、Geminiを携帯電話やパソコンだけでなく、眼鏡などのウェアラブルデバイスを通じていつでもユーザーのそばにいられる「ユニバーサルアシスタント」にし、日常生活や仕事の常連アシスタントとなることです。

(テスト:Gemini 3 Nano Banana Proは考えた上で自動的にユーモラスな漫画を生成し、トランプを小さな新鮮な肉)に戻します

宇宙探査の未来は有望ですが、セキュリティリスクはビデオ理解と同じくらい重要です

AIがもたらす最良のシナリオについて言えば、ハッサビスはAIが原子核融合や新しいバッテリー、材料科学や半導体の新たなブレークスルー、主要な疾病の解決策など、人類がいくつかの重要なボトルネックを突破するのを助け、人類社会がより豊富な資源を持つ宇宙探査へと前進する機会を得ると仮説を立てています。

しかし彼はまた、いくつかのレベルに分かれた最悪のシナリオも指摘しました。

悪意のある行為者はAIを使って病原体を設計または強化します。

AIはエネルギーや水資源などの重要インフラに対する外国勢力によるサイバー攻撃を加速させており、こうした攻撃は今後起こる可能性が高いものの、使われているAIはまだ高度ではありません。

高度に自律的なAIエージェントは、元の指示や人間の期待から逸脱するため、それを防ぐために多大な資源と注意を投入しなければなりません。

能力の面では、外の世界で過小評価されているのはAIの映像に対する深い理解だと考えています。 ハッサビスは、かつてジェミニにシーンの分析を依頼したことがあり、モデルは絵を理解するだけでなく、表面的な行動だけでなく、象徴や感情を非常に深く解釈してくれたと語りました。

また、Gemini Liveではスマートフォンのカメラを機械設備に向けることで即座に修理支援を受けられるが、本当に理想的な車両はメガネだと考えている。なぜなら、現場作業中は手が空でなければAIとやり取りできないからだ。

アメリカと中国の間のギャップはあと数か月しかなく、AGIはまだ1、2マイル先にあります

国際競争に関しては、ハッサビスは米国と西側諸国がモデルの能力やイノベーションの面で中国全体をリードしていると考えていますが、DeepSeekのような中国の最新モデル群はすでに非常に強力であり、多くは既存技術を基に急速に追いついています。 彼は、過去にはアメリカと西側諸国が何年もリードしていたかもしれないが、今や中国に残された時間はわずかだと判断した。

ハッサビスはAGIを非常に明確に定義しています。

「長期計画、長期記憶、継続的な学習、真の推論力や創造性など、人間に共通する主要な認知能力をすべて備えている必要があります。」

彼は、現段階のLLMはすでに一部の分野でトップ医師に接近できる能力を持っているものの、多くのシナリオでミスを犯すことがあり、真のAGIと推定される5年から10年の間にはギャップがあると指摘しました。 ハッサビス氏は、既存のLLMのスケールが限界まで押し上げられても、AGIの閾値を超えるには十分ではなく、AI分野はトランスフォーマーのような能力を大幅に向上させる1つか2つの大きな技術的ブレークスルーが必要であり、それによって真にAGIを実現するチャンスはないと付け加えました。

(IBM CEO:AI業界は「回復が難しい」賭けであり、LLMがAGI )を成功させる確率はわずか1%です

この記事はChain News ABMediaに最初に掲載されました。Google DeepMind CEO:AGIは5〜10年先、AI開発の機会とリスクは密接に表れています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン