谷歌杀疯了!Gemini 3“一夜封神” 马斯克、奥特曼纷纷点赞
万众期待的年度压轴之王——谷歌新一代旗舰Gemini 3正式发布。而且,一上来就是顶配的Gemini 3 Pro,也是至今推理最强、多模态理解最强的模型。
这也标志着人工智能行业正在经历一次关键的范式转移:从“对话式交互(Chatbot)”向“自主智能体(Agentic)”的全面跨越。就连OpenAI联合创始人兼CEO奥特曼、xAI创始人埃隆·马斯克也先后点赞。
能让对手折服,谷歌这次显然是有备而来的。
一出手就是王炸
今日凌晨,谷歌CEO Sundar Pichai 在社交媒体上发布了一则重要消息:Gemini 3发布,不只模型升级,这次还带来了Google Antigravity这个全新的开发平台,这就是对标Cursor类的AI IDE了。
Pichai在文中说,Gemini 3是世界上最好的多模态理解模型,也是我们目前最强大的Agent和代码生成模型。
Gemini 3可以快速理解你的想法和需求,你只需要简单描述,就能得到你想要的结果。
这一次,谷歌发布了两个版本,一个是Gemini 3 Pro,另一个是Gemini 3 Deep Think。
值得一提的是,Gemini 3 Pro的model card在发布之前就已经泄漏了,上面有Gemini 3 Pro在主流benchmark上的评测结果。
相较于Gemini 2.5 Pro,可以看到Gemini 3 Pro有显著的提升,很多指标都远远超过了Gemini 2.5 Pro。
三大核心亮点
Gemini 3的核心亮点主要包括三个方面:
一是最智能模型。
Gemini 3定位为年度最受期待的产品,强调其智能化水平,大家可以看下第五张图,基本在各个领域都是处于领先地位,谷歌出品不出可以,一出惊人。
二是生成式界面。
Gemini 3可提供设计完美的响应内容,让它生成mac os主界面,它妥妥能让前端工程师和设计师下岗。
三是Gemini Agent。
能代表用户完成复杂任务,无需多言就能把痛点说出来,它就能没日没夜的劳作,你可以安心的躺平发育。
值得一提的是,Gemini 3 Pro凭借先进的推理和多模态能力,能够将任何想法变为现实。它在所有主要的AI基准测试中都显著优于2.5 Pro。
此外,Gemini 3的深度思考模式又拓展了智能的边界,它的推理、多模态理解能力方面均实现了质的飞跃。
在测试中,Gemini 3 Deep Think在Humanity's Last Exam(不使用工具的情况下得分41.0%)和GPQA Diamond(得分93.8%)上的表现均优于Gemini 3 Pro已相当出色的成绩。
此外,它在ARC-AGI-2(代码执行,已通过ARC Prize验证)上也取得了前所未有的45.1% 的得分,展现了其解决全新挑战的能力。