谷歌杀疯了！Gemini 3“一夜封神”　马斯克、奥特曼纷纷点赞

撰文：格隆汇

出版：2025-11-19 15:22更新：2025-11-20 13:55

万众期待的年度压轴之王——谷歌新一代旗舰Gemini 3正式发布。而且，一上来就是顶配的Gemini 3 Pro，也是至今推理最强、多模态理解最强的模型。

这也标志着人工智能行业正在经历一次关键的范式转移：从“对话式交互（Chatbot）”向“自主智能体（Agentic）”的全面跨越。就连OpenAI联合创始人兼CEO奥特曼、xAI创始人埃隆·马斯克也先后点赞。

能让对手折服，谷歌这次显然是有备而来的。

一出手就是王炸

今日凌晨，谷歌CEO Sundar Pichai 在社交媒体上发布了一则重要消息：Gemini 3发布，不只模型升级，这次还带来了Google Antigravity这个全新的开发平台，这就是对标Cursor类的AI IDE了。

Pichai在文中说，Gemini 3是世界上最好的多模态理解模型，也是我们目前最强大的Agent和代码生成模型。

Gemini 3可以快速理解你的想法和需求，你只需要简单描述，就能得到你想要的结果。

这一次，谷歌发布了两个版本，一个是Gemini 3 Pro，另一个是Gemini 3 Deep Think。

值得一提的是，Gemini 3 Pro的model card在发布之前就已经泄漏了，上面有Gemini 3 Pro在主流benchmark上的评测结果。

相较于Gemini 2.5 Pro，可以看到Gemini 3 Pro有显著的提升，很多指标都远远超过了Gemini 2.5 Pro。

三大核心亮点

Gemini 3的核心亮点主要包括三个方面：

一是最智能模型。

Gemini 3定位为年度最受期待的产品，强调其智能化水平，大家可以看下第五张图，基本在各个领域都是处于领先地位，谷歌出品不出可以，一出惊人。

二是生成式界面。

Gemini 3可提供设计完美的响应内容，让它生成mac os主界面，它妥妥能让前端工程师和设计师下岗。

三是Gemini Agent。

能代表用户完成复杂任务，无需多言就能把痛点说出来，它就能没日没夜的劳作，你可以安心的躺平发育。

值得一提的是，Gemini 3 Pro凭借先进的推理和多模态能力，能够将任何想法变为现实。它在所有主要的AI基准测试中都显著优于2.5 Pro。

此外，Gemini 3的深度思考模式又拓展了智能的边界，它的推理、多模态理解能力方面均实现了质的飞跃。

在测试中，Gemini 3 Deep Think在Humanity's Last Exam（不使用工具的情况下得分41.0%）和GPQA Diamond（得分93.8%）上的表现均优于Gemini 3 Pro已相当出色的成绩。

此外，它在ARC-AGI-2（代码执行，已通过ARC Prize验证）上也取得了前所未有的45.1% 的得分，展现了其解决全新挑战的能力。