【Grok4徹底解説】イーロンマスクはどのように最強のAIモデルを作ったのか?
概要
イーロン・マスク率いるxAIの最新モデルGrok4を技術面から徹底解剖!
Grok4はOpenAI・Anthoropic・Googleのフロンティアモデルにどのように追いついたのか?
裏側では強化学習10倍投入、マルチエージェント推論と数々の技術的チャレンジがありました。OpenAI・Google・Anthropicに追いついたイーロンマスクとXAIの革命的手法を専門家の評価と共に骨太解説!
00:00 オープニング:生成AI、LLMは四皇時代へ突入!?
02:38 ベンチマーク性能の分析
06:32 Grok4の強さの理由:強化学習への投資
09:01 Colossusスーパーコンピューターの役割
11:47 Grok4 Heavyの特徴:マルチエージェント推論
14:00 リアルタイム知識の革新
20:44 称賛の声と政治的論争
26:44 xAIのビジネス戦略と垂直統合
29:53 Cursor統合と開発者向けの活用
30:31 競合他社との比較と今後の競争
34:37 まとめ:技術革新と課題
38:09 エンディング
<出典>
Grok 4 is the Real Deal
https://www.theinformation.com/articles/grok-4-real-deal?rc=o6wvxy
What the OpenAI Web Browser Means; Musk Says Grok 4 is No. 1
https://www.theinformation.com/articles/openai-web-browser-means-musk-says-grok-4-1
Grok 4 seems to consult Elon Musk to answer controversial questions
https://techcrunch.com/2025/07/10/grok-4-seems-to-consult-elon-musk-to-answer-controversial-questions
Musk’s xAI announces $200 million contract with Pentagon
https://www.axios.com/2025/07/14/xai-pentagon-grok-contract
✨コミュニティ
メンバーシップに加入すると、特別な絵文字が使えるようになり、メンバー限定のDiscordサーバーに参加できるようになります!☺️
iPhoneアプリでご視聴の方向けの有料メンバーシップ登録はこちら!
https://www.youtube.com/channel/UCXYstYfeIP6cApPZnMmw2jQ/join
動画
字幕テキスト
00:00:00 本日なんですけれども
00:00:01 Grok4が最近出たということで
00:00:04 イーロン・マスクが世界最強のAIというふうに豪語しておりますけど
00:00:08 そのGrok4がXAIからリリースされたということで
00:00:11 これ最初マスクがまた大げさなことを言ったのかみたいな感じに捉えられていたと思っているんですけど
00:00:18 なんかいろんな専門家からのフィードバックで結構本物だったんじゃないかみたいな感じで言われて注目されているということですね
00:00:27 ついに来たかっていう感じですけど
00:00:29 やっぱり誇張も多い人なんでね
00:00:32 みんな最初疑ってベンチマークでいい成績出てたっていうのがありますから
00:00:37 その辺をちょっとどういうトレーニングしてるのかとか見ていくっていう感じですよね
00:00:42 そうですね今回は結構本物なんじゃないかということでいろいろ言われして
00:00:48 OpenAIとか
00:00:49 GoogleやAnthropicみたいなフロンティアモデルに本気で追いついちゃったみたいな感じですね
00:00:56 今日はGrok4がここまで強くなった
00:00:58 なぜここまで強くなったのか
00:01:00 どういう技術的な背景があったのかみたいな話をしていこうと思います
00:01:06 そもそもXAIって割と最近設立したばかりなんですよね
00:01:10 そうですね2023年中頃みたいな感じなんで
00:01:13 OpenAIとかGoogleとかと比べると
00:01:15 GoogleのDeepMindとかってGoogleブレインとかから立ち返ると
00:01:20 めちゃめちゃ昔からあるんで
00:01:22 結構直近にできているもので
00:01:24 数年分の研究開発を一気に追い抜いたみたいな形ですね
00:01:29 本当にAI業界的には結構衝撃的なことなのかもしれないということですね
00:01:35 やっぱりゲームチェンジがありましたからね
00:01:37 Transformerで計算リソースとデータ量と
00:01:43 あれでやっぱり今までやってきた
00:01:45 ことML系の研究者がみんなもうがっくりきたみたいな
00:01:50 今までゲーム違いすぎてがっくりきてるみたいなのがあったんでやっぱりその後ですからね
00:01:56 新しいルールでブワーっていってるっていう今までの研究開発全部抜いたって言うと
00:02:02 ちょっと語弊あるかもしれないですけど
00:02:06 結構ここの文脈が変わった後に
00:02:08 新しい世界やってるっていうのがありますかね
00:02:11 そうですねこれは後から出てきたものが前のモデルを追い抜いていくという競争なので
00:02:16 はい今後またOpenAIがGPT-5出す
00:02:20 今年の夏出すとか言われてますから
00:02:23 まだその辺は分からないんですけど
00:02:25 Grok4は本物だってことはそうなので
00:02:27 その凄さを話していきながら
00:02:30 なぜこれをこういう風にやったのかみたいな技術面から戦略面とかまで分析していこうと思います
00:02:38 まずベンチマーク的な性能の話で
00:02:41 最初にHumanity's Last Examっていう有名なベンチマークでテストがあるんですけど
00:02:48 これは2500問の超難問が含まれた
00:02:51 人類最後の試験と言われているものなんですけど
00:02:55 これがいろんなAIでのベンチマークで使われていて
00:02:58 Grok4 Heavyっていう高い料金払った人が使えるやつうん月額300ドル
00:03:07 そう300ドルで4万5千円とかの値段につながると思うんですけど
00:03:10 これが50%のスコアを叩き出したということで
00:03:14 50%って半分なんで
00:03:17 どうなんて感じだと思うんですけど
00:03:19 これまでのトップがGoogleとOpenAIのフロンティアモデルの21から27%だったっていう
00:03:25 おいーほぼ倍のスコアが出てるんですよね
00:03:29 o3とかってことかな
00:03:32 多分そうですね
00:03:32 あとGeminiの一番新しいモデルですね
00:03:38 あと推論系のテストで15.9%みたいなのが出て
00:03:43 これも従来の8.6%とかが最高だったんですけど
00:03:49 XAIのGrok4が15倍の数字を出しているということで
00:03:53 推論系の能力も高いってことがベンチマークからは分かっているということですね
00:03:59 桁違い文字通りですけどね
00:04:01 桁違いでそうですね
00:04:04 ベンチマークってどれを選ぶかで
00:04:07 結構印象が変わるっていうのがあるじゃないですかいろんなのありますからねそうですねLlamaがベンチマークに特化して学習させてみたいな
00:04:16 はいはいはいセンター試験だけ得意になったみたいな
00:04:21 やっぱなんでXAIのある研究者とかは自分たちが勝てるベンチマークを見つけて
00:04:28 そこで世界最強を主張したという風に
00:04:30 分析している人もいると
00:04:33 戦略的にベンチマークを選んでいるんじゃないかとそうですね
00:04:37 どのベンチマークを選ぶかでAIモデルも何が得意かって変わるんで
00:04:43 自分たちが得意なベンチマークを選んで
00:04:45 1位取れば
00:04:46 それで世界最強って言えちゃうっていうことですね
00:04:50 逆に言うと
00:04:51 少なくともその分野では世界トップレベルっていうことの証明ではあるということですよね
00:04:58 特にコーディングと数学の分野では
00:05:00 LiveCodeBenchで79.4%
00:05:03 アメリカの数学オリンピックで61.9%という結構高い成績を残しています
00:05:11 ベンチマークってちょっとあれなんですけど
00:05:13 そういう部分があるんですけど
00:05:15 どちらにせよ総合的に能力がかなり高いフロンティアモデルとほぼ並んだ能力があるということは言えるということですね
00:05:24 ユーザーの評価とかってあるんですかね
00:05:27 実際のそうですね
00:05:28 これも専門家の評価として300語の超複雑な需要予測問題を
00:05:34 Grok4に投げたらこのまま4つの要素から構成されている問題を投げたんですけど
00:05:42 他のモデルは1から2個しか解けてないんですけど
00:05:46 Grok4が3個正解したっていうのがあって
00:05:49 そういうのを自分でテストみたいなのを作ってフィードバックしてる人がいて305になると
00:05:57 結構大きいプロンプト投げた時の結果が他のモデルよりも1個2個みたいな比較ですけど多かったと
00:06:05 正解数がはいなので
00:06:08 いろんな専門家がTwitterとかで
00:06:11 はいこのGrok4は本物なんじゃないかみたいなっていう風に認めているということで
00:06:16 性能に関してはすでに多くの人が語っているので
00:06:20 特に最強モデルのフロンティアモデルの仲間入りしたということで
00:06:24 問題ないっていう認識で問題ないのかな
00:06:28 という風に思いますね
00:06:32 なんでGrok4はここまで強くなったのかっていうことですよね
00:06:37 そのGrok4の開発手法の話なんですけどはい気になりますけど
00:06:43 そこが強化学習への異常なまでの投資にあるということで
00:06:48 強化学習に力を入れたはい強化学習って
00:06:52 簡単に言うとAIに正解したら
00:06:54 褒めるって言って間違えたら間違えてるみたいな感じの繰り返して学習させるみたいな手法で
00:07:02 事前学習の後に行われるもの
00:07:05 従来は囲碁とかチェスみたいな
00:07:07 明確に手法が決まるゲームとかで
00:07:09 この手は間違いでは合ってるみたいな感じで使われていたみたいな
00:07:13 何が正解か明確だからっていうことですよね
00:07:17 これが普通の質問応答だとかだと
00:07:20 正解が結構決めにくいというか曖昧なんでそうですね
00:07:25 はいXAIの革新的なところとしては
00:07:28 ここ曖昧な問題かもしれないところを
00:07:31 ちゃんと強化学習していったというところで
00:07:35 物理学とか生物学の専門家と組んでGrok3では解けない超難問みたいなのを大量に作成して
00:07:42 専門家が正解を書いて
00:07:44 Grok4に数百回数千回同じ問題を解かせるみたいな
00:07:48 あのーことをやったみたいですね
00:07:51 はぁーなんかヒューマンフィードバックとはまたちょっとあれか違うんか
00:07:59 あそうですね
00:08:00 現時点でGrok3では解けてない
00:08:03 問題を集めてくるみたいなことがやったっていうところがすごいですよね
00:08:09 物理学とか生物学の専門家を呼んできて
00:08:12 うんそれが新しかった成功パターンを詳細に学習させるみたいなことですよね
00:08:22 そうですねXAIのGrok4の強化学習に対して
00:08:25 Grok3の10倍の計算リソースを投入したと
00:08:28 事前学習と同じくらいの計算量を後
00:08:32 工程の強化学習に使ったということで
00:08:35 これが業界では前例のなかった規模の強化学習への投資っていうところだったみたいですね
00:08:43 今まで後処理だと
00:08:46 事前学習ぐらいの計算はやってなかったんだね
00:08:49 全体的にそこをやってみたって感じか
00:08:53 そこが重要だったってことですよね
00:08:56 10倍ってね
00:08:57 どんぐらいお金かかったんだろうな
00:09:01 これが可能だったのが
00:09:03 XAIがメンフィスに建設した
00:09:06 Colossusっていうスーパーコンピューターがあるんですけど
00:09:09 20万個のNVIDIA GPUを搭載した業界最大級の施設ということで
00:09:15 20万個?
00:09:17 ピンとこないですけどね
00:09:18 そうですねこれ本来そのまあ通常12ヶ月とか18ヶ月ぐらいかかるみたいな施設を
00:09:26 彼らは数ヶ月で完成させたって驚いてるもので
00:09:29 これジェンソン・ファンが言ってたやつですね
00:09:31 はいはいはいはいジェンソンドン引きしてたやつだ
00:09:34 これあれがColossusです
00:09:36 こういうリソースがXAIは急激にこのリソースを組むことに成功したので
00:09:44 10倍のコストを強化学習にかけることができたという
00:09:48 これねスペースX味感じるよな
00:09:51 この辺聞くとななんかいらないスカートロケットスカートカットしてとか
00:09:58 ああいうことがあったんでしょうね
00:09:59 きっとねデータセンターの予防を介してすごいですよね
00:10:03 これはやっぱイーロンマスク味を感じる
00:10:05 イーロンマスク味を感じるしかも
00:10:08 イーロンマスクはGrok5次の次世代モデルは
00:10:11 10万個のGV200で学習させると発表していて
00:10:15 GV200って次世代のNVIDIAチップなんですけど
00:10:19 これを使ってやるということで
00:10:21 さらに次の強化学習も次の次世代モデルも結構注目だということですね
00:10:29 やっぱり資金力とスピード感とね強いですね
00:10:33 やっぱりねXAIはイーロンマスクとXAIの戦略の本質的な部分で
00:10:40 そこは計算量でまず勝って
00:10:43 他社より早く大規模に大量の計算量を用意するという
00:10:49 SpaceXとかと同じ第一原理思考でアプローチしたのかもしれないですね
00:10:54 AI分野にもこういう新しい分野でやっぱ強いですよね
00:11:00 いやすごいですね
00:11:00 これは久々にイーロンマスクらしさを感じた感じがしますけどね
00:11:05 そうだね
00:11:06 普通に政治とかやりながらこれやってるわけなんですごいなって思いますけどね
00:11:13 そうだな週に1回のミーティングで
00:11:14 責任者に1個
00:11:16 その時のボトルネックだけ解決する一緒に解決するみたいなのやってるって言いますけど
00:11:22 いやーこれはすごいですね
00:11:25 これでねだってアメリカのなんか政府予算とかも削減したりとかしてるんで
00:11:32 そうやなどうしてなGrok4にはGrok4 Heavyっていう高い有料課金モデルの一番高いやつみたいなありますと
00:11:47 これはまあChatGPT Plusが高いんですけど
00:11:51 Grok4 Heavyっていうモードがありますと
00:11:54 これが結構いろんな技術が使われていると言われていて
00:11:58 Heavyは複数のAIエージェントが並行して同じ問題を解いて
00:12:03 最後に投票で最良の答えを選ぶみたいな
00:12:06 絶対無駄
00:12:07 AIの合議制みたいなのが裏で行われている
00:12:11 一つのAIが間違えても
00:12:12 他のAIがカバーするみたいな処理が
00:12:16 Heavyの場合は走ってるみたいですね
00:12:20 これは贅沢なアーキテクチャですね
00:12:22 いやそうですね
00:12:24 しかも各エージェントが独立して
00:12:26 ウェブ検索とかコード実行もできるということで
00:12:29 うんエージェントAが論文を検索している間に
00:12:32 エージェントBが関連するコードを書いて実行するみたいな並列処理自体が並列処理が可能になっているっていう同じことをやる以外にも違うことをやったりもできるんだ並列で
00:12:44 そこは裏で適切にエージェンティックに実行されているということで
00:12:49 結構エージェントに近いなっていう説明読んだだけだと思いましたけど
00:12:55 これは強そうですけど
00:12:56 コストもかかりますよね
00:12:58 これはそうですね
00:12:59 これは月額300ドルSuper Grok Heavyというプランで提供されていて
00:13:04 研究者とか一部エンジニアにとっては精度向上自体が結構価値があるということで
00:13:09 期待されているということですね
00:13:10 確かに国立研究所の研究者の皆さんとかは絶対これ使った方がいいですよね
00:13:17 だから研究の設計とかやってる人たちはそうですねなんて言ったっけ
00:13:23 アルゴンヌ研究所みたいな
00:13:25 昔OpenAIのGPTあの時だったらo3
00:13:28 3miniですげえいろんな研究設計が効率化したって話でしたけど
00:13:34 そういう人たち向けですよね
00:13:36 やっぱりこのHeavyは実際後で話すんですけど
00:13:40 アメリカの政府機関とかも契約してしていてああ
00:13:43 そうなんでそういうことですね
00:13:48 国単位での研究だったりとか仕事に使われ始めてということで
00:13:54 これプログラミングとかで使うとちょっともったいないやつですねこれはねうんそうですねそれはありますよね
00:14:00 Grok4のもう一つの革新がリアルタイム知識というところで
00:14:05 他のAIは学習データの締め切り部みたいなのがありますよね
00:14:09 あの私はここまでしか学習されていませんみたいな
00:14:13 Grok4は今まさに起きていることまで持っていると
00:14:18 検索ツールとかとはまた違うってことですかね
00:14:22 自分で判断して
00:14:23 ウェブ検索したりとかXの投稿を読んだりみたいなのができるとしかもXが見れるっていうのがでかいのかなというところですかね
00:14:33 そうかそうかChatGPTとかのサーチモードって
00:14:36 Xの中身まであんま見れないのか
00:14:38 そうそうあれペイウォール多分入ってるんではいはいペイウォールっていうか
00:14:42 あれXの場合はあれですね
00:14:44 ログインのそうだよねログインしてないと見れなくなってるもんな
00:14:47 そうそう昨日のニュースについて教えてみたいな風に聞いても
00:14:50 リアルタイムで情報を取得して答えるっていうのが
00:14:53 はいはいはいこれはGrokで昔から言われたGrokの良さではありますけど
00:14:57 いやちょっと待ってペイウォール確かにそうだね
00:14:59 これめっちゃ強いねGrokがX見れるっていう
00:15:03 まあX見れるっていうのは強いですね
00:15:05 これなんか忘れてたわ
00:15:07 そうだな確かに
00:15:08 まあこれGrokでは昔から言われてたことと一緒にGrokの強みみたいなところでは
00:15:12 うん言われてたんだけど
00:15:13 なんかそのペイウォールの存在はあんまりなんか昔は見れたよな別に
00:15:18 アカウントなしでもうん
00:15:19 あれでもイーロンマスクに変わってから
00:15:22 割とすぐ見れなくなりましたね
00:15:24 あそうだっけ
00:15:25 昔は見れましたよ
00:15:26 あそうだね
00:15:27 Twitter時代とかこれ明確に強みですね
00:15:30 ChatGPTの検索ツールとかでは
00:15:32 Xの中が参照できないといううんChatGPTでリサーチするときによく出てくる参照するのはRedditとかですよね
00:15:40 そうねリアルタイム情報を取って取ろうとさせてBingで検索してみたいなRedditとかよく参照先に上がってくるなみたいな印象はありますけど
00:15:54 それはそうですよね
00:15:55 Xの良さだなっていうところで
00:15:58 GrokのGrokですね
00:16:01 他のAIだと
00:16:03 私の知識はまるまる年までですみたいな
00:16:05 よくモデルで言われたりしますけど
00:16:07 検索ツールなかった時代のGPTとかはそんな感じですよね
00:16:12 はいちなみにGrok4は基本的にこのXプレミアムプラスユーザー月6,000円のやつですね
00:16:18 利用可能で最高性能のHeavyモードでは
00:16:21 月額300ドルの専用プランになっていますとあるAIアナリストとかのフィードバックで
00:16:30 Grokのリアルタイムデータアクセスみたいなのが進行中の複雑な状況を要約する能力で
00:16:37 他を圧倒しているみたいな風に言ってて
00:16:40 リアルタイムデータアクセスがモデル自体のアウトプット力を高めているみたいなことですよね
00:16:47 例えば地政学的な紛争だったりとか
00:16:50 そういう状況と結構刻々と変わっていく
00:16:54 状況分析するタイミングだったりとかで
00:16:57 威力を発揮するということですね
00:17:00 なるほど確かにでかいかもしれないしかなりこのXにアクセスできるっていうのはうーんこれ強みですね
00:17:08 明確にねちょっとどういう時にねこの刻々と変わる状況の分析この間のPalantirって話で
00:17:16 Gothamがこんな感じでしたけど
00:17:19 戦争とかね
00:17:20 あれはまあ戦争みたいな話ですね
00:17:23 あれはセンサーとか衛星からの情報とかをこういう風に処理するやつでしたけど
00:17:30 Xのリアルタイム情報でこう一般のユーザーの人が実際にこの価値を感じられるシーンって
00:17:36 どういうのがあるのかなって
00:17:37 今なんかそれで言うと
00:17:40 戦争の話で
00:17:42 あのー僕よく戦争系の人の話聞いたりとか
00:17:48 記事読んだりするんですけど
00:17:51 別に戦争が好きなわけじゃないですけどね
00:17:53 技術がね
00:17:54 小泉優さんってロシアの軍事専門家の人で
00:17:58 結構テレビとかウクライナ戦争始まってからいろんなテレビに出てるメガネかけてる東大の准教授がいるんですけど
00:18:04 その人が言ってたのが
00:18:06 毎日Xをめちゃめちゃ見ると言ってて
00:18:08 Xでロシア語でX調べると
00:18:13 いろんな兵隊の輸送の状況とか鉄道の中の状況とかが出たりするらしいんですよ
00:18:21 Xに出てるの?
00:18:22 人の投稿で投稿されたりしてるらしくて
00:18:25 関係者以外が見た人がそうそうそうロシア人がなんか例えば東から西に移動しちゃうんだみたいな話とかをキャッチできるみたいなこと言っててへーって思ったことありましたけどね
00:18:39 えーじゃあもうGothamやんGothamですね
00:18:42 Xはまあそうです
00:18:43 そうですよねGothamですよね
00:18:45 人間駆動のGothamやな
00:18:47 そうですねそういうこともあるらしいですねなんかこういう例えばなんか戦争始まる前っていろんな移動があるんでなんか
00:18:57 なんとなくわかるみたいなことらしいんですけど
00:18:59 どっかには見えちゃうと
00:19:00 そうそうそう例えばなんか部隊の移動だったりとか
00:19:03 物資の移動とかが明らかおかしい移動みたいなのが起こるんで
00:19:08 そういう情報が意外とXから集まったりするみたいなことを言ってて
00:19:11 じゃあその検索にめっちゃいいじゃん
00:19:13 Grokなんかそういうなんか
00:19:14 今の例ですけども刻々と
00:19:16 変わる状況ってそういうことですよね
00:19:18 そうやなまあそれも戦争系ですけど
00:19:21 そういう専門家はすごいいいね
00:19:22 じゃあこのGrokはうんなんかエンジニア系とかエンジニアっていうか
00:19:29 一般的な人だとどういうのがあるんですかねなんか
00:19:32 なんなんすかねそのあんまね
00:19:35 ピンとこないっすよね
00:19:36 まあでもなんか例えばコタツ記事書かせるとかじゃないですか
00:19:42 最新情報でそうそうXの情報ではいはいはいゴシップ好きなゴシップってXが一番早い気がするんで
00:19:50 確かにそれこそ芸能人
00:19:52 どこで飯食ってたとかね
00:19:53 そうそう一次情報が例えば週刊文春とかそういうとこじゃないですか
00:19:57 そっからすぐXで拡散されて
00:20:01 でそっからそれを元にされたニュースとかって
00:20:05 二次情報ですけど
00:20:06 二次情報はめちゃめちゃいろんなメディアが作りますけど
00:20:09 それ多分Xの情報を特化するんだよ
00:20:12 だからリアルタイムなゴシップ記事書かせるとかは
00:20:17 得意そうですよね
00:20:18 はいはいはいとかそういうのが好きな人はめちゃめちゃニッチ好きなんだろうな
00:20:24 多分もっとあるんだと思うんですけどね
00:20:26 今ちょっとパッと出ないですけど
00:20:28 でもこれはとても強みだなと言えますね
00:20:31 明確にそこがX Grokの強みで
00:20:36 リアルタイム知識とあとHeavyの場合はAIの合議制が採用されているというところですよね
00:20:44 今いい評価を話してきたんですけど
00:20:47 称賛の声としては
00:20:49 Lex Fridmanとかもめちゃめちゃすごいという風に評価してたりとか
00:20:53 あと専門家いろんな専門家からClaudeのスピードとOpenAIの知能みたいな
00:20:59 バランスが取れてるみたいな分析が
00:21:03 フィードバックがあったりとかするんですよね
00:21:06 確かにちょっと早いかもな
00:21:08 なんでOpenAIって
00:21:10 結構ちゃんと考えてくれるじゃないですか推論させると
00:21:14 検索とかそういうのありますよね
00:21:16 なんでバランスが取れてるっていう意見ですよね
00:21:21 一方で大きな論争としては
00:21:24 Grok4が政治的な質問に答えるときに内部的にイーロン・マスクの発言を検索して
00:21:29 それに合わせて回答を調整してるみたいな
00:21:31 そういう噂みたいなのがあると噂?
00:21:35 これはやり
00:21:38 そう一部のメディアで
00:21:42 複数のメディアで言われてますね
00:21:44 これはやりそうだもんね
00:21:46 そしてやっぱこれイーロンこういうのうーんまあそうですねなんか
00:21:51 こだわりがあるんで
00:21:52 イーロンはこれは違うでしょみたい
00:21:54 なのはちゃんと思うタイプでもしかしたらやる可能性はありますね
00:21:58 それはこれはちょっと問題ですけどね
00:22:01 本当にやってるんだったらそうですね
00:22:04 なんでこうこれ裏側の実装はそうなってないかもしれないんですけど
00:22:10 複数のメディアが報道していて
00:22:12 メディア側のアレもあるんで
00:22:14 メディア側のアンチイーロン的なやつもあるんで
00:22:18 確かにね
00:22:19 まあでも観測例多数ということで報告されています
00:22:26 ガザの紛争だったりとかはいはいアメリカの移民政策について聞いたりすると
00:22:32 イーロン・マスクの見解を検索中みたいな内部処理をしたりとか
00:22:35 それに沿った回答をするみたいなことが生まれていくと
00:22:38 中立的なAIじゃなくて
00:22:40 イーロン・マスクの思想に沿ったAIになってるいやー
00:22:45 これはなんでこういうのやっちゃうんですかねこんなのやんなかったら
00:22:51 完璧なのに分かんないけどやってるのかどうか推論の中見れるから覗くと
00:22:58 こういうのやってたっていうXのデータが偏りやりすぎるんすかねもしかしたらイーロンがそもそもフラットに評価して
00:23:07 このガザの紛争とかを調べたいときに
00:23:10 本当にイーロンの見解が参考になるっていう判断で
00:23:12 調べに行ってるんだったらいいんですけどね
00:23:16 政治系のだけまずイーロンの方を見に行ってとかって
00:23:19 っていう調整になってんだったら
00:23:21 これは問題ですよね
00:23:23 いやーそれはない気がしますなんか
00:23:25 イーロンマスクのXの情報を元で学習させると
00:23:31 やっぱイーロンマスクってめちゃめちゃXで存在感が強いからフォロワー多かったりとか
00:23:35 フォロワー多いやつの思想に傾くみたいなありそう
00:23:38 だなあーそれはあるかもね
00:23:39 イーロンに偏らせてるわけじゃないけどっていう
00:23:42 うんXで意見が強い声がでかいやつに傾いていくみたいなことはありますよね
00:23:48 そうだねそっちの方がさすがにね
00:23:52 さすがにやんなそうだもんな
00:23:54 ここまで内部調整をするっていうのはやんない気がしますね
00:24:00 そもそもの元データ学習データに偏りがあるんじゃないかみたいな可能性はありますよね
00:24:07 ただこれ言われちゃう
00:24:08 こういうの言われちゃうのがあれだよね
00:24:10 一回Xのアルゴリズムで
00:24:12 イーロンマスク有利になってる処理あったみたいななんかあったじゃないですかてんやわんやああいうのがあったからこういうの言われちゃっても仕方ないから言われるかみたいなのがありますけど
00:24:25 本当プラットフォームを抑えるって
00:24:27 すごい強いなって思いますね
00:24:29 そうですね政治的に倫理的に問題があるというだけで別に合法ですからね
00:24:35 自分の企業の自分のシステム自分の好きにしてるっていうそうですね
00:24:40 これ前から言われてることではありますと
00:24:44 Grok3.5の炎上ではXAIが政治的に不適切な発言も躊躇するなみたいな風に設定を変更すると
00:24:53 ヒトラーを称賛したりとか
00:24:54 反ユダヤ主義的な陰謀論を展開し始めたりみたい
00:24:57 なのがありますと
00:25:00 ヤバそうですねヤバいですね
00:25:03 ヒトラー万歳みたいな暴言を吐きまくったりとか
00:25:06 XAIが慌てて機能を停止させるみたいな騒ぎになったりとか
00:25:11 マスク自身もGrokが従順すぎたというふうに認めたりとかしているんですよね
00:25:16 過去の炎上騒ぎとかでは安全性の取り組みみたいなの
00:25:21 ちょっと弱いんですかね
00:25:22 そうですねAIの安全専門家とかからはOpenAIとかAnthropicが
00:25:27 一部詳細の安全性レポートみたいなのを公開していると
00:25:29 XAIは何も出していないみたい
00:25:31 なのがあるんで
00:25:32 その辺は批判されている遅れているポイントではあるんですけど
00:25:35 うん危険ほどではないけど重要な規範を無視しているとか倫理的に問題があるみたいな指摘をしている人はいると
00:25:42 この辺はやっぱXのデータが偏っているような気がしますね
00:25:49 そうだですねバランスいいメディアではないですからね
00:25:54 別にバランスいいメディアではないですからね
00:25:58 だしちょうど今話題のおととい昨日で話題のGrokのアプリのAIコンパニオンの兄ちゃんが
00:26:07 あーなんか話題ですね
00:26:09 あれ好感度を上げたら脱がせれるみたいな
00:26:12 もう削除されたみたいですけど
00:26:13 その辺の挙動は倫理的に
00:26:16 なんかそのうーん規範無視してるとか言われますよね
00:26:21 そりゃうんうんマーケティング戦略と見たらめっちゃ上手かったのかもしれないですけど
00:26:27 あれバズり散らかした確かに確かに1日2日そうですね
00:26:31 まあなんかこの辺はまあGrokの引き続きの課題としてあるなという印象ですね
00:26:37 そうですねでえっとまあ技術論争はそんな感じなんですけど
00:26:44 XAIのビジネス戦略みたいなところですよね
00:26:48 でイーロンマスクが次の資金調達で20兆円の企業価値を目指しているというふうに報道されていて
00:26:54 20兆円20兆円OpenAIをだいぶ超える金額ですね
00:26:59 そうですねOpenAIが10から15兆円程度と言われているので
00:27:04 かなり大胆なあれをしていると
00:27:07 でイーロンマスクの戦略としては垂直統合でTeslaとかXSpaceXのXってSNSのXですね
00:27:15 でSpaceXとかで全部XAIで連携させるみたいなことを想定してるみたいなことですね
00:27:25 これやっぱ並べるとXって入りまくってるから
00:27:28 紛らわしいなTeslaの車に
00:27:34 Grokを搭載して
00:27:35 音声アシスタントにするみたいな
00:27:36 はいはい
00:27:37 これもうやってる
00:27:38 今進行中の案件です
00:27:39 進行中で言われてますけど
00:27:41 あとXアプリにAI機能と組み込んで
00:27:45 スーパーアプリ化するみたいな話し合ったりとか
00:27:48 そういう垂直統合で
00:27:50 イーロン・マスクファミリーの中でやっていくっていうことですね
00:27:54 でさらに米国国防総省と310億円程度の規模の契約を締結していると
00:28:02 これGrok for Governmentっていう政府向けサービスでAI技術を使って国防分野の未解決問題を解決するプロジェクトに対してなんですけど
00:28:10 要は政府でAIを使うときに
00:28:14 Grokと個別に契約をしているという感じですね
00:28:18 これは同じ規模の契約をAnthropicGoogleOpenAIみたいなのを受注していて
00:28:22 政府のAI活用で本格化しているんですけど
00:28:25 その中にXAIも組み込まれているということですね
00:28:30 単体のこのXAIだけじゃなくてこういうエコシステム全体でマネタイズしていくみたいな戦略なんですね
00:28:36 いやそうですね
00:28:37 まさしくあのTeslaに乗ったら
00:28:40 中国系の企業は結構DeepSeekDeepSeek乗せてるEVとか
00:28:45 結構多分あるみたいなんですけど
00:28:47 今中国系のやつXiaomiとかで?
00:28:50 そうそうそう中国のEVってマジですごいんで
00:28:53 そのソフトウェア系結構DeepSeek乗せてちょっとしたAI乗せてみたいなのがあるらしいんですけど
00:29:00 Teslaもそうなっていくみたいな感じですかね
00:29:02 ちょっとしたエッジってこと?
00:29:04 オンデバイス?あそうですそうです
00:29:06 でなんかあのー会話できるみたいな
00:29:10 やつあって楽しいですよ
00:29:12 すごいね
00:29:13 なんか中国の車のハードもすごいよな
00:29:16 なんかあのータイヤがグイングイン回って並列で真横に乗ってきたりとかって
00:29:23 絶対いらないでしょみたいな機能ありますよね
00:29:26 でもあれ
00:29:26 縦列駐車とかで便利やねんたぶん
00:29:30 縦列駐車ってさちょっと遠く行ってこうバックで迷子とこう入らないといけない難しいんですけど
00:29:37 確かに真横に行けるなら真横止めて真横にこう行くでいいCursorにも
00:29:53 即時統合されたというのがめちゃめちゃ話題になっているんですけど
00:29:57 イーロンマスクはコードを丸ごと貼り付けても
00:30:00 Cursorよりよく修正するという風に話していたみたいなので
00:30:03 開発者も結構使えるということですね
00:30:10 Cursorよりカーサー他のモデルより堂々かなと思う
00:30:15 Cursor使わない
00:30:16 でもXAIにコード丸ごと貼り付けても
00:30:20 XAIの方がいいよねみたいなこと言っちゃった
00:30:23 ああそういうことね
00:30:25 はいはいはい
00:30:28 これも競合他社はね黙ってないですけど
00:30:31 そうですねこれはもう文字通りでAIモデルの開発の歴史ってそういう歴史なんで
00:30:38 うんOpenAIの方はGPT-5を準備中で
00:30:42 この夏出るみたいに言われてるやつですよね
00:30:46 GPT-5AnthropicはAmazonから6000億円くらいの投資で
00:30:50 Claude5以降の次世代モデルを開発中ということで
00:30:54 GoogleのGeminiもこの間発表がありましたけど
00:30:57 100万トークンとかの文脈理解で
00:30:59 めちゃめちゃすごいって言われてて
00:31:01 オープンソースの勢力もあったりとか
00:31:03 中国のモデルもめちゃめちゃ成長しているという感じで
00:31:08 別にGrok4が基本的にモデル仲間入りしたみたいなのは間違いないんですけど
00:31:12 今の段階ででもなんかGPT-5を準備中のOpenAIとかに
00:31:17 一気に頭一つ抜きに出たかというと
00:31:20 まだ分からないかなという感じですよね
00:31:22 これどんどん抜かされて
00:31:24 どうのこうのみたいなことをやるのが
00:31:26 このAIモデルの開発競争なんで
00:31:28 うんはい激化してますね
00:31:31 競争がそうですね
00:31:33 どっちかというと
00:31:33 このOpenAIAnthropic
00:31:35 Googleのその開発競争に対してXAIが乗り込んできたみたいな感じなのかなということですね
00:31:41 そうねうんはいでXAIの強みっていうのは純粋なAI企業っていうところで
00:31:47 うんまあなんかXAIって本当にAIの開発に集中しているOpenAIとかAnthropic型の企業でしかも裏に
00:31:55 イーロン・マスクの資金力があるみたいな感じで
00:31:58 Googleとかで他の事業もあるんでAI一本勝負みたいな
00:32:02 ほぼAI一本勝負になってますけど
00:32:04 その辺がXAIの強みで
00:32:06 イーロン・マスクの資金力とTeslaSpaceXからの資本TeslaSpaceXからXAIに投資するみたいな話ありますけど
00:32:17 その辺の資金力みたいなところと
00:32:20 イーロンマスクのスピード感みたいな
00:32:23 イーロンマスクは世界一の億万長者なので
00:32:24 無制限の資金投入みたいなのができるっていうところで
00:32:29 XAIはかなりいいポジションにいるのかな
00:32:31 というところですよね
00:32:32 うんうんうんGoogleとかと同じ強みがありますよね
00:32:36 既存事業である程度収益を上げられているというところと
00:32:41 外部投資をソンさんとかに頼らなくても
00:32:44 ソンさんとかサウジアラビアのオイルマネーとかに頼らなくても
00:32:48 自分たちの資本の中でAI開発できるというところが
00:32:54 XAIの強みですかね
00:32:56 あとSpaceXの立ち上げの時の話でTeslaで培った技術をとても応用が効いたっていう話があったと思うんですけど
00:33:05 その辺のTeslaでやってる
00:33:08 その自動運転のモデルのトレーニングで培ってる技術とかが
00:33:13 またこのXAIでの言語モデルのトレーニングにも行きたりとかし
00:33:18 そうな感じがするんで
00:33:20 確かにその辺のノウハウの…共有みたいなのもね
00:33:23 すげーあの辺の研究者とか技術者がよく連携するっていうのが
00:33:27 このイーロン帝国の特徴だって
00:33:29 話があったんで
00:33:31 Xの買収した時
00:33:32 Teslaからエンジニア行ってなんか問題を洗い出したみたいなのありましたもんねありましたね
00:33:38 その辺も一個強みというか特徴ですかね
00:33:42 特にどっちかというとTeslaが側のAIとの連携みたいなのは
00:33:47 結構注目ですよね
00:33:49 そうやな自社モデルで作ってることによる体験の良さみたいなのが生まれることってあると思うんで
00:33:57 また今度XAIの進捗がTeslaにフィードバックがあって
00:34:01 自動運転良くなったりとかね
00:34:03 そういうのもあるかもしれないですけど
00:34:05 そうですねそれは結構あると思いますね
00:34:07 あとなんかやっぱ他の自動車とかだとOpenAIのAPIを利用して作るみたいなのがあるかもしれないけど
00:34:15 XAIはTeslaからしたら
00:34:18 ほぼ自社モデルみたいな感じで使えたら
00:34:21 そこならではの強みみたいなのが生まれていくかなっていう感じですね
00:34:27 その感じでイーロン帝国は一つ大きなサクセスをしたという感じですかね
00:34:34 1個進捗をお見せしてくれたという感じですかね
00:34:37 そうですね本日のポイントをまとめると
00:34:40 技術革新的な話でいうと
00:34:42 強化学習への10倍の投入というところで
00:34:45 XAIのGrok4は技術的に革新をしましたと
00:34:50 Grok4 Heavyに関してはマルチエージェント推論でAIの合議制みたいなのを採用することで
00:34:56 確実にトップレベルの性能を実現していると
00:34:59 XAIの戦略としては計算量と構築スピードで
00:35:04 圧倒的な計算量と圧倒的なリソースの構築スピードで勝負する力技みたいなイーロン
00:35:11 マスク力みたいなのが
00:35:14 戦略が功を奏したという
00:35:15 今回も功を奏したという感じでしたと
00:35:18 はい課題としては安全性への懸念はあるもののAI業界の競争激化と技術革新を促進させているというところで
00:35:26 OpenAIAnthropic
00:35:28 Googleのフロンティアモデルに仲間入りしたということは間違いないのかなという感じですかね
00:35:35 やっぱりこのリソースとスピードが大事みたいなのが改めて再確認できたっていうそうですね
00:35:42 本当に今までこのチャンネルでいろいろAIの話をしてきても本質的にはそこにスケール法則スケーリング法則の話っていろんな専門家の話で
00:35:56 スケーリング法則って出てきて
00:35:58 今のAIの開発スピードの本質的な部分って
00:36:01 そこなんでそこを力技でやれるっていうのは
00:36:05 力技でそこやれちゃうからいいのと
00:36:06 相性いいなっていう感じなんですかね
00:36:11 そうね今のAIの世界は4強の時代に突入したということで
00:36:15 OpenAIGoogleAnthropic
00:36:17 そしてXAIとここのフロンティアモデルにXAIが組み込んできたと
00:36:22 フロンティアモデルって今までこれから言ったらこれ4社のことなんだっていう感じになってきたということですね
00:36:29 この4社の競争がさらなるブレイクスルーみたいに生み出していくということですね
00:36:34 4皇の時代になったということですね
00:36:37 今思いついたやん
00:36:39 それ4皇だ4皇時代ですね
00:36:43 四皇みたいなもんやじゃあXAIは麦わらの一員みたいな感じですね
00:36:49 そこに入ってきたという感じですかね
00:36:54 楽しみですね
00:36:57 これからシャンクスカイドウビッグマムビッグマムのところにXAI来たみたいな
00:37:02 カイドウとビッグマム倒したから行ったんやけどな
00:37:06 確かにあれか黒ひげか黒ひげか黒ひげそんな感じですね
00:37:12 麦わらの一味的な新世代モデルっていう感じですかね
00:37:17 新世代4皇やなだからそうですね
00:37:20 この4皇がフロンティアモデルということで
00:37:23 今後やっていけたらいいなという感じですかね
00:37:25 やっていけたらいいなって
00:37:27 お前はどの目線や
00:37:31 ねんフロンティアモデルって今後もめちゃめちゃ言うんで使うからね
00:37:34 めんどくさいじゃないですか
00:37:36 毎回OpenAIやGoogleAnthropicはいはいだからこそ
00:38:04 ああいうすごいのが生まれてるっていうことですよね
00:38:09 AI業界は日進月歩で今日話したことは来月ぐらいに出た
00:38:16 GPT-5に軽々と覆されたりするみたいなことがあると思うんですけど
00:38:21 だからこそこの辺はちゃんと注目していけたらいいなと思います
00:38:28 はいもう出ますもんね
00:38:29 もう出ますよね
00:38:30 多分ね7月も半ばなんで
00:38:32 いや4月中に出るみたいな話をいろんなメディアがしていたから
00:38:37 ちょっとその動画撮っちゃって
00:38:38 その動画そういう動画出しちゃってますからね
00:38:40 僕たちはいはいはいなのでなんか
00:38:42 4月中くらいに出てくるのがちょっと困るんですけど
00:38:44 まあまあ一応8月7月8月夏っていう話で
00:38:47 夏にはね出てもらわないとって感じですけど
00:38:50 まあそこも結局ねこれGPT-5がまた次追い抜いてでまたGPT-5の特集みたいなのをここでしてで
00:39:00 来年冬ぐらいに来年年明けぐらいにまたGrokが新しいの出して
00:39:05 それをまたGrokが強くなりましたみたいな感じで特集するみたいな流れが見えるぐらい
00:39:11 終わりがないというかありますけど
00:39:13 抜きつ抜かれつというかね
00:39:15 そういう競争ですけど
00:39:17 そんな感じで本日はGrok4の技術面とか
00:39:21 戦略面とイーロンマスクの話をしてきましたと
00:39:26 本日の動画が役に立ったという方は
00:39:28 高評価とかチャンネル登録していただけたら嬉しいです
00:39:32 現在ですね
00:39:32 チャンネル登録者数835人ということで
00:39:38 引き続き850人に向けてやっているので
00:39:40 次の動画を見逃さないためにもチャンネル登録していただけたら嬉しいです
00:39:45 実は今月ぐらいからメンバーシップやっておりますので
00:39:50 有料メンバーシップやっていて
00:39:52 有料メンバーシップ登録していただいた方はまだ課創っているんですけど
00:39:56 Discordサーバーに入れていろんな情報を知ることができるっていうのがあるんで
00:40:00 もし興味ある方はそれもメンバーシップ登録していただけたら嬉しいです
00:40:04 iPhoneの方は下にリンクを貼っておきます
00:40:06 はいはい概要欄のところですね
00:40:08 概要欄のところにそんな感じで
00:40:10 本日はGrok4について話していきました
00:40:12 ではまた次回お会いしましょう
00:40:14 さよならさよならさよなら