Google DeepMindはなぜAI競争で勝ち続けるのか?ハサビスが明かす研究哲学とAGIへの道筋
この記事でわかること
- 今後12ヶ月でAIが進化する3つの領域(マルチモーダル、ワールドモデル、エージェント)
- Google DeepMindがAI競争で勝ち続ける理由と「科学者CEO」ハサビスの哲学
- AGI到達に必要な「あと1〜2つのブレイクスルー」の正体
- AGI時代に人類が適応できる理由
なぜ今この話題が重要なのか
Gemini 3のリリースで注目を集めるGoogle DeepMind。そのCEOデミス・ハサビスが、アメリカのテクノロジーメディアAxiosのイベントで最新インタビューに応じました。
イーロン・マスクも「Googleが強い」と評価するように、DeepMindは激しいAI競争の中で常にトップを走り続けています。その秘密は何なのか?ノーベル賞受賞者でもあるハサビスが、自身の研究哲学とAGIへの具体的なロードマップを語りました。
興味深いのは、Anthropicのダリオ・アモデイが「スケーリングでAGIに到達できる」と主張する一方で、ハサビスはイリア・サツケバー(元OpenAI)と似た立場を取っている点です。本記事では、AIトップ研究者たちの見解の違いも含めて詳しく解説します。
今後12ヶ月でAIが進化する3つの領域
1. マルチモーダルの「異種交配」
ハサビスが最初に挙げたのは、マルチモーダル(複数の入出力形式を扱える能力)のさらなる進化です。ただし、単に画像・テキスト・音声を扱えるだけではありません。
彼が強調するのは「クロスポリネーション」(異種交配)という概念。異なるモダリティが融合することで、予想外の面白い効果が生まれることを期待しているのです。
具体例として挙げられたのがGoogleの画像モデル「Nano Banana Pro」。このモデルはビジュアルを非常に繊細に理解し、詳細まで把握した上で、めちゃくちゃ正確なインフォグラフィックを作れます。これはテキスト理解と画像生成が高度に融合しているからこそ実現できているのです。
そして、今後1年で特に注目すべきはビデオと言語モデルの融合。ハサビスの例によれば、映画「ファイトクラブ」のあるシーン(指輪を外すシーン)についてGeminiに哲学的テーマを聞いたところ、「日常生活を象徴的に捨て去る行為」という深い洞察を返してきたそうです。
YouTubeの動画を見せて「この動画の哲学的テーマは何?」と聞けるようになる時代が、もう目の前まで来ています。映画の考察コンテンツや評論が、AIによって誰でも作れるようになるかもしれません。
2. ワールドモデルの進化
ハサビスが「最も注目されていない能力」として挙げたのがワールドモデルです。これはLLMの進化の先にある、非常に重要な技術です。
Googleが開発中の「Genie3」というシステムがその具体例。通常の動画生成は「動画を作ったら終わり」ですが、Genie3は生成した動画の中をゲームやシミュレーションのように歩き回れます。
ある風景動画を生成したとして、その動画の中で「左に歩く」「前に進む」という指示を出すと、それに応じて視点が変わり、風景が更新されていく。しかも1分間ほど一貫性を保ったまま保持できるのです。ほぼゲームエンジンと言っていいレベルです。
ゲームエンジニアとしてのバックグラウンドを持つハサビスにとって、この領域は特に興味深いものなのでしょう。
3. AIエージェントシステムの信頼性向上
3つ目はAIエージェントの進化です。ハサビスは率直に「今のエージェントは、完全なタスクを確実に委任できるほど信頼性が高くない」と認めています。
しかし1年後には、タスク全体を完了できるエージェントに近づくだろうと予測。Googleが目指しているのは「ユニバーサルアシスタント」です。
これはコンピューターやスマホだけでなく、メガネなどいろんなデバイスに搭載されるエージェント。生活のあらゆる場面で生産性を上げたり、本や映画をお勧めしてくれたり、1日に何度も相談できる「生活の一部になるアシスタント」の実現です。
特に興味深かったのは「Geminiライブ」という機能の話。スマホをかざすだけで「今あなたは車の整備士です」と言えば、目の前の機械を修理する手伝いをしてくれる。ただし手が塞がっていると不便なので、メガネ型が理想的だとハサビスは語っていました。ARグラスへの投資も、この文脈で理解できます。
ユーザーインターフェースの一番ユーザーに近い部分を取れるかどうかが、次のiPhoneになるかもしれない競争なのです。
DeepMindが勝ち続ける理由
ハサビスは「科学者CEO」
ハサビスはDeepMindの強さの秘密について、自身の「科学者としての哲学」を挙げました。彼はビジネスマンでありCEOでもありますが、自分を何よりまず「科学者」だと定義しています。
科学的方法とは何か。仮説を立てて実験し、結果を見て仮説を更新するサイクルです。ハサビスはこれを「人類史上最も重要なアイデア」と呼びます。現代科学を生み出し、ひいては現代文明全体を支えている方法論だと考えているのです。
重要なのは、この科学的方法は科学の外でも使えるということ。日常生活やビジネスにも応用できる。ハサビスのデフォルトの思考アプローチが科学的検証なので、組織体制やビジネスモデルもその視点で見ているわけです。
3つの融合と柔軟な方向転換
ハサビスは「科学的方法を核に据えた厳密さと正確さがDeepMindの競争優位性だ」と語ります。
DeepMindの強みは3つの世界クラスの能力の融合です。
- 世界クラスの研究能力
- 世界クラスのエンジニアリング能力
- 世界クラスのインフラ(TPUなど)
AIの最前線に立ち続けるにはこの3つすべてが必要で、Google以外でこれを持っている組織はないとハサビスは主張します。
そして、この科学的手法の実践例として挙げられたのが「LLMへのオールイン決断」です。2017〜2018年頃のDeepMindは、独自の言語モデル、AlphaGoベースの強化学習システム、神経科学からインスピレーションを受けたアーキテクチャなど、複数の方向を探っていました。
しかしスケーリング法則の威力が実証された瞬間、迷わずLLMにリソースを集中させた。この「ピボットの速さ」がDeepMindの強さだと、イーロン・マスクの伝記を書いたウォルター・アイザックソンも指摘しているそうです。
ハサビスは「真の科学者は特定のアイデアにドグマティック(独善的)にならない」と語ります。自分の綺麗な理論を守るのではなく、実証的証拠が示す方向へ進む。AGIを誰よりも早く安全に作るというゴールに対して、最もよく動くやり方を常に選ぶ姿勢が、DeepMindの競争力の源泉なのです。
人材戦略:金ではなくミッション
人材獲得競争についても興味深い発言がありました。Metaなどが年収2億円といった高額報酬でエンジニアを引き抜いている中、ハサビスの考えは異なります。
「最もインパクトのある仕事をしたい人にとって、Google DeepMind以上の場所はない」
最高の科学者・研究者・エンジニアは常に最先端のことをやりたがる。つまりリーダーボードのトップにいれば、自然に優秀な人材が集まると考えているのです。
技術者は自分のスキルを上げたいという動機も強い。お金好きなエンジニアばかりの環境では、本当に高いレベルでチームのエンジニアリング能力を引き上げる働き方はできません。「いい研究環境があれば、いい研究者が来る」というシンプルな信念です。
AGI到達に必要な「あと1〜2つのブレイクスルー」
現在のLLMは「不均一な知性」
ハサビスは5〜10年以内にAGI到達すると明言していますが、同時に「まだ1つか2つのブレイクスルーが必要」とも語っています。
彼にとってのAGIの定義は「人間が持つ全ての認知能力を発揮するシステム」。発明的・創造的な能力も含めて、すべてができなければAGIとは呼べません。
現在のLLMについて、ハサビスは「ジャギッド・インテリジェンス」(不均一な知性)と表現しています。国際数学オリンピックで金メダルを取れるレベルの分野がある一方、他の分野では全然ダメ。このムラがあるうちは、真のAGIではないということです。
スケーリングだけでは足りない
ハサビスの見解は、スケーリングが最終的なAGIの核になることは間違いないが、それだけでは足りないというもの。現在のモデルに欠けている能力として挙げられたのは:
- 継続的学習: 今のLLMは一度訓練したら終わり。新しい情報を継続的に学んで適応していくことができない
- 長期的な計画と推論の能力: 複雑なタスクを長期的に計画し、推論する力がまだ不十分
スケーリングだけでAGIに到達できる可能性もゼロではないが、おそらくTransformerレベルやAlphaGoレベルの大きなブレイクスルーが1つか2つ必要だろうとハサビスは予測しています。
多くのAI企業のCEOが「あと少しでAGI」とハイプ(誇張)しがちな中、科学者でもあるハサビスがギャップを認めているのは誠実な姿勢と言えるでしょう。
AGI時代に人類は適応できるか
狩猟採集民の脳でも大丈夫
インタビュアーが投げかけた懸念は「我々の脳は狩猟採集民族として進化したのに、産業革命の10倍の規模と速度で変化するAI技術に対応できるのか?」というものでした。
ハサビスの答えは明快です。「人間の脳はめちゃめちゃ適応力が高い」。
狩猟採集民族の時代と同じ脳の構造のまま、スマホもパソコンも普通に使いこなしている。いろんな技術が出てきても、人間は新しい道具を使いこなす力を持っている。ハサビスは人間の創意工夫と無限の適応力を強く信じています。
「人間の脳は、知られている宇宙の中で汎用知能の唯一の存在証明だ」
つまり我々はすでに汎用知能なのだから、新しい技術にもきちんと適応できるはずだというロジックです。
最終手段としてのBCI
もう一つの選択肢として、ハサビスはブレインコンピューターインターフェース(BCI)にも言及しました。人間の脳自体をアップデートする技術を使うことも考えられる、と。
Neuralinkのような技術も含めて、人間自身がアップデートできるのが人間の適応力の高さだという主張です。AGIがどれだけ進化しても、最後には人間は適応できる。そんな前向きなメッセージでインタビューは締めくくられました。
テスラジオの考察
ハサビスのインタビューで最も印象的だったのは、「科学者CEO」という独自のポジションです。
通常、大企業のCEOは技術の詳細よりもビジネス戦略に重きを置きます。逆に優秀な研究者は、経営判断の速さに欠けることがある。ハサビスは両方の視点を持ち、実証的証拠に基づいて即座に方向転換できる。この融合がDeepMindの競争力の源泉なのでしょう。
また、ダリオ・アモデイ(Anthropic)との見解の違いも興味深いポイントです。アモデイは「スケーリングでAGI到達可能」派、ハサビスは「あと1〜2つのブレイクスルーが必要」派。どちらが正しいかはまだわかりませんが、複数のアプローチが競い合っているのはAI業界にとって健全なことです。
ワールドモデルの話も見逃せません。Genie3のようなインタラクティブな動画生成は、単なる動画生成を超えて、ゲームエンジンやシミュレーターとしての可能性を持っています。ゲームエンジニア出身のハサビスだからこそ、この領域の重要性を強調しているのかもしれません。
まとめ
- 今後1年でAIが進化する3領域: マルチモーダルの異種交配、ワールドモデル、AIエージェントの信頼性向上
- DeepMindの強さの秘密: 科学的方法に基づく厳密さと、実証的証拠に従った柔軟な方向転換
- AGIには5〜10年: スケーリングは重要だが、Transformerレベルのブレイクスルーがあと1〜2つ必要
- 人材戦略: 高額報酬より「最もインパクトのある仕事ができる環境」で優秀な人材を惹きつける
- 人類の適応力: 汎用知能である人間は、AGI時代にも適応できる
この記事の元動画: YouTube