谷歌发布新一代大模型Gemini 2.0，备战智能体时代

admin 2024年12月13日阅读数 73630

（原标题：谷歌发布新一代大模型Gemini 2.0，备战智能体时代）

谷歌发布新一代大模型Gemini 2.0，备战智能体时代
图片来源于网络，如有侵权，请联系删除

12月12日，谷歌推出大模型Gemini 2.0 ，谷歌CEO桑达尔·皮查伊（Sundar Pichai）称，这是谷歌为新智能体时代构建的下一代模型，也是谷歌迄今为止最强的大模型。

Gemini 2.0 Flash是谷歌此次发布的Gemini 2.0系列模型中的第一个模型。相比上一代模型Gemini 1.5 Flash，Gemini 2.0 Flash除了支持图片、视频和音频等多模态输入，还支持多模态输出，例如其可以直接生成图像与文本混合的内容，以及原生生成可控的多语言文本转语音（TTS）音频。Gemini 2.0 Flash还可以原生调用谷歌搜索、代码执行以及第三方用户定义的函数等工具。

皮查伊表示，如果说Gemini 1.0的作用是整合和理解信息，那么Gemini 2.0能够做到让信息更加有用。

谷歌发布新一代大模型Gemini 2.0，备战智能体时代
图片来源于网络，如有侵权，请联系删除

基于Gemini 2.0模型，谷歌能够构建新的AI智能体，从而离构建通用助手的愿景更进一步。智能体（Agent）是指能够感知环境并采取行动以实现特定目标的代理体，也被视为大模型落地的“最后一公里”。

过去一年里，谷歌持续开发了更多智能体模型。在发布Gemini 2.0的同时，谷歌也介绍了多个智能体。例如，Project Astra是通过多模态理解现实世界的智能体，它可以在多种语言和混合语言之间进行对话，能够理解不同口音和生僻单词，并以接近人类对话的延迟来理解语言。Project Astra最多可以记住长达10分钟的会话内容，并且可以回忆起过去与它进行的多轮对话，以便为用户提供更好的个性化服务。Project Astra还能使用谷歌搜索、谷歌地图等工具。 Project Astra被应用于谷歌的AI助手Gemini app以及智能眼镜等其他设备及产品中。

谷歌发布新一代大模型Gemini 2.0，备战智能体时代
图片来源于网络，如有侵权，请联系删除

除此之外，谷歌还开发了可以帮助用户完成复杂任务的智能体、面向开发者的智能体，以及面向游戏和其他领域的智能体。

在Gemini 2.0发布当天，新加坡科研局资深科研工程师黄佳就体验了该模型，并将其与OpenAI最新发布的o1模型进行对比。他的测试方式是提供一系列参考文档，给出复杂逻辑，让大模型进行自主编程，并提供详细文案解释。

黄佳表示，在一般情况下，ChatGPT o1的逻辑推理还是更强。具体而言，两个模型都体现出了很强的分析推理能力，但ChatGPT o1可以接受的文档输入长度较长，Gemini 2.0会截断部分太长的参考文档；此外，ChatGPT o1给出的代码，质量较高，缺陷（bug）较少，ChatGPT o1的代码解释更详尽，更接近黄佳想要的写作风格，Gemini 2.0的解释文案较为简略。

黄佳感觉到，虽然目前大模型仍不可能仅靠简单的提示词，就自主干活，满足需求，还需要在人的驱动之下，在精准的业务场景中，经过设计、编程、整合等过程，才能够成为智能体，但是大模型能力在进步，人们对大模型能力边界的认识也越来越清晰，这带来了智能体发展的加速，周围同事也在更多地用智能体做实际项目。

推荐阅读：
践行听障人士友好理念，霸王茶姬首家“无声门店”亮相杭州
实地调查丨董事长配偶股价高位减持，金龙羽固态电池投入几何
这个报告一出，美降息预期降温，3月还有戏吗？
以平台聚产业，海垦集团、微医集团、江东新区签约国际数字健康港
龙年投资大趋势丨中信证券明明：关注未来三个优势产业投资机会
走过20年！QFII发展壮大超700家机构生根发芽金融市场对外开放不断
连续六年增长！基民转投这一赛道……
头部私募2023年成绩单揭晓期货及衍生品策略领域表现出色
开年11家基金公司高管变更！4家董事长换新，涉及两家千亿级“保险系”公募
江苏2023年GDP增长5.8% 今年持续壮大先进制造业集群

专题推荐：

版权声明

本文仅代表作者观点，不代表xx立场。
本文系作者授权xx发表，未经许可，不得转载。

上一篇：国足原主教练李铁案：法院通知将在12月13日一审宣判下一篇：5G进入“下半场” 业绩高增公司受关注

谷歌发布新一代大模型Gemini 2.0，备战智能体时代

版权声明

作者文章