AI三巨头同日上线新功能!Gemini 2.5 Pro推理性能超DeepSeek-R1!

3月25日,AI领域迎来密集更新。前脚谷歌上线了最强大的推理模型 Gemini 2.5 Pro,后脚 OpenAI 发布了 GPT-4o 图像生成功能,而中国的深度求索团队也在官网宣布 DeepSeek-V3 完成小版本的更新,版本号为 DeepSeek-V3 0324。

三大AI巨头同日交锋,各展身手,揭开2025年 AI 领域的第一轮混战?让我们一起来看看这些新版本、新功能有何亮点吧!

谷歌上线最智能的AI模型 Gemini 2.5 Pro

当地时间3月25日,谷歌宣布推出“最智能的AI模型”Gemini 2.5系列,实验版 Gemini 2.5 Pro 是该系列上线的首款推理模型。

虽然“最智能的AI模型”是谷歌 CEO Sundar Pichai 自封的,但从 Gemini 2.5 Pro 的成绩单来看,它似乎真能担得起这个名号。

Gemini 2.5 Pro 在多项测试任务中取得了优异成绩:

  • 以 18.8% 的准确率通过人类给AI的终极考验 Hunmanity’s Last Exam 基准测试,性能超过了能秒解图论难题的 OpenAI o3-mini。
神仙打架!谷歌 Gemini 2.5 Pro、GPT-4o 图像生成、DeepSeek-V3-0324接连上线!
  • 在 GPQA、AIME 2025 等模型推理能力强相关的主流基础测试中,Gemini 2.5 Pro 也斩获第一。
神仙打架!谷歌 Gemini 2.5 Pro、GPT-4o 图像生成、DeepSeek-V3-0324接连上线!
  • 在网页开发领域,WebDev Arena 测试上排名第二,超越了 DeepSeek、Grok和ChatGPT,但仍低于 Claude 3.7 Sonnet。
神仙打架!谷歌 Gemini 2.5 Pro、GPT-4o 图像生成、DeepSeek-V3-0324接连上线!

谷歌表示,Gemini 2.5 Pro 在创建具有精美视觉效果的网页应用以及操作智能体方面表现出色。从官方展示的演示示例来看,仅需输入一行提示词,Gemini 2.5 Pro 便能凭借自身的能力,一步步推理生成类似 “flappy bird” 小游戏的完整代码,而且生成的游戏可以直接运行。

Gemini 2.5 Pro 与其他推理模型不同的是,它继承了 Gemini 系列模型的关键优势,即原生多模态能力和长上下文窗口。Gemini 2.5 Pro 版本目前的上下文窗口可达 100 万个 token,并且后续还会提升至 200 万个 token,同时它支持文本、音频、图像、视频以及完整代码库等多种类型的输入。

目前,普通用户和企业可登录 Google AI Studio 体验 Gemini 2.5 Pro,在该平台输入各种问题、指令,利用其多种能力获取答案、生成内容。

在这里,小编插入一则通知:算力云平台专门为海内外高校、企业和个人用户提供GPU租用服务。有 RTX 4090/3090/Tesla T4/V100S 充足的显卡在多地域可租用,适用于视频渲染、深度学习和AI模型训练、推理等多种场景。更重要的是,有丰富的官方镜像资源和主流数据集可供用户按需调用。

神仙打架!谷歌 Gemini 2.5 Pro、GPT-4o 图像生成、DeepSeek-V3-0324接连上线!

OpenAI 上线 GPT-4o 图像生成功能

美国当地时间3月25日,OpenAI 正式宣布推出 GPT-4o 图像生成功能,此次功能升级覆盖OpenAI全生态体系,个人用户无论从付费到免费,均可在ChatGPT对话中直接生成图像,并基于对话上下文进行动态调整。

据官方介绍,GPT-4o 的图像生成功能实现四大革新

  • 精准文本渲染:GPT-4o 在图像生成时,能把复杂的文字描述变成细节度极高的图片。
神仙打架!谷歌 Gemini 2.5 Pro、GPT-4o 图像生成、DeepSeek-V3-0324接连上线!
  • 指令严格遵循:通过强化学习优化生成逻辑,确保输出的图片与用户需求高度匹配;
神仙打架!谷歌 Gemini 2.5 Pro、GPT-4o 图像生成、DeepSeek-V3-0324接连上线!
  • 深度知识调用:可无缝结合4o知识库及对话历史,生成具备上下文关联的视觉内容,意味着可以通过自然对话来优化图像。
神仙打架!谷歌 Gemini 2.5 Pro、GPT-4o 图像生成、DeepSeek-V3-0324接连上线!
  • 创意拓展能力:支持上传图片进行二次创作,或提取图像元素生成全新设计灵感。
神仙打架!谷歌 Gemini 2.5 Pro、GPT-4o 图像生成、DeepSeek-V3-0324接连上线!

DeepSeek V3 模型完成小版本升级

北京时间3月25日,DeepSeek 在官网宣布DeepSeek V3 模型完成小版本升级,用户登录官方网页、APP、小程序进入对话界面后,关闭“深度思考”即可体验。

神仙打架!谷歌 Gemini 2.5 Pro、GPT-4o 图像生成、DeepSeek-V3-0324接连上线!

推理与评测表现提升:新版V3模型借鉴了DeepSeek-R1模型训练时用的强化学习技术,这让它在推理类任务上的能力大大增强。在数学、代码相关的评测中,它的得分超过了GPT-4.5。

前端代码生成优化:在HTML等代码前端任务方面,新版V3模型有很大进步。它生成的代码可用性更高,用这些代码做出的页面视觉效果更佳,更富有设计感。

文本创作质量升级:新版V3模型在写作方面,基于R1的水平又进行了优化,尤其是中长篇文本创作的质量有了特别明显的提升。

多场景功能增强:新版V3模型在联网搜索做报告生成类任务时,输出的内容更详细准确,排版也更清晰好看。此外在工具调用、角色扮演、问答闲聊这些方面,也给用户带来更优质的体验。

值得一提的是,业内测试证实,该模型可以直接在消费级硬件上运行。DeepSeek-V3 在配备 M3 Ultra 芯片的苹果电脑上,以每秒 20 个 token 的速度运行。如果想要以更高的效率运行,可以通过在算力云等云服务平台,租用更高的云端配置运行模型。

此次谷歌、OpenAI 和 DeepSeek 在同一天的重大更新,无疑将预示着 AI 市场竞争的进一步加剧。中国 AI 新星 DeepSeek 异军突起,一直占据大头市场份额的 OpenAI、谷歌等科技企业也不甘示弱,未来 AI 市场的竞争格局将快速演变。

AI企业的领军地位将花落谁家,AI产品生态将如何构建,还是尚未解决的谜题。

以上是算力云今日内容分享,感兴趣的朋友可以关注一下。