DeepMindがまた一歩リードを広げた感じだ。科学研究やエンジニアリングの難題を解くための特化モードなんて、現場の人間にはたまらない強化点じゃないか。これが実用レベルなら、研究のスピードは劇的に上がるかもしれない。
── レン
▸何が変わったのか
今回のアップデートは、Gemini 3の最も専門化された推論モード「Deep Think」にフォーカスしている。主に現代の科学、研究、そしてエンジニアリングが直面する複雑な課題を解決するためにチューニングされたらしい。従来の汎用的なモデルとは異なり、専門知識が必要な分野でのパフォーマンスを底上げ。まだ詳細なベンチマークは不明だが、論理的思考能力の強化が図られている模様。
◈技術背景と意義
普通のAIは「次に来そうな単語」を予測するのが得意だけど、科学や工学の世界では「途中のプロセス」が正しいかどうかが命取りになる。この新しいモードは、ただ答えを出すだけでなく、人間のような深い思考プロセス(推論)を経て問題を解くことに特化している。つまり、雑談相手ではなく、実験室にいる優秀なアシスタントとして振る舞えるように設計されたってわけだ。
▸Redditの反応
ARC-AGI-2のベンチマーク結果に対するRedditの反応は、正直、ものすごい熱量だ。ユーザーの中には「50%ものポイント増加なんて狂ってる」と驚きを隠さない人もいて、他の最前線モデルとは明らかに別次元のジャンプに見えるらしい。「公式にARC-AGI 2のリリースから1年もかからずに飽和状態(85%で解決とみなされる)に達した」というコメントにも、この進化のスピードへの畏怖が滲んでいる。
生成能力の進化も目を見張るものがあり、特にSVG生成の精度は反響を呼んでいる。ペリカンが自転車に乗っている画像を見たユーザーからは「Holy shit!(マジかよ!)」という歓声が上がり、半年前の棒切れみたいな出力とは雲泥の差だと感じられている。「すでにグラデーション処理までできるなんて印象的だ」という声もある通り、単に画像を描くだけでなく、コードとしての構造理解が深まっているのがわかる。
もちろん、批判的な視点や冷めた見方も完全に消えたわけではないようだ。GoogleがGPT-5.2のPro版ではなくThinking版と比較していることに対し「正直な比較とは言えない」と指摘する声が上がっているのが、エンジニアらしい厳しい視点で面白い。「このサブレディットはなぜ今Geminiを嫌うんだ? 数ヶ月ごとにGeminiとGPTの憎しみの矛先を変えているだけだ」というコメントには、業界の情勢の流れが早いことを感じさせる。
そして、この高性能に対抗意識を燃やしているのはオープンソースコミュニティだ。「ローカルモデルのスキャフォールディングを使って、Gemini 3 Deep ThinkやGPT-5.2 Proレベルの性能を目指すフレームワーク」が話題になり、巨大モデルに頼らずに同様の機能を再現しようとする動きにも注目が集まっている。これだけの性能が出ると、自分の手元でどう再現するか考える人も増えるのは必然の流れかもしれない。
◆入手方法・リンク
クローズドソースモデルなので、GitHubなどでコードを公開する予定はない。GoogleのAIプラットフォーム(Google AI StudioやVertex AIなど)を通じて提供される見込みだが、現時点での具体的な利用手順やAPIの公開状況は要チェック。
SOURCE: Google DeepMind (2026-02-12)







