谷歌宣布推出其迄今为止最先进的 AI 模型 Gemini 2.0,旨在迎接科技巨头所称的 '代理时代'。据 blog.google 报道,Gemini 2.0 引入了一系列新功能,包括具有本地图像和音频生成的多模式输出,以及与谷歌搜索和地图等工具的无缝集成。
Gemini 2.0 的特性和功能
最新版本的 Gemini 2.0 提供了改进的功能,既赋予开发人员,也赋予用户更大的能力。它支持多模态输出,允许用户体验更具动态性和互动性的体验。此外,该模型配备了本地图像生成和音频输出,拓宽了 AI 应用和交互的范围。
除了这些增强功能外,Gemini 2.0 还与谷歌既有平台如搜索和地图集成,方便更直观的导航和信息检索。这种集成旨在提升谷歌各项服务的功能和用户体验。
实验模型和研究原型
谷歌正在发布一款实验版的 Gemini 2.0 Flash,承诺低延迟和增强性能。开发人员可以通过 Google AI Studio 和 Vertex AI 访问此模型。同时,Gemini 和 Gemini Advanced 用户全球可用的聊天优化版 Gemini 2.0,也可以通过桌面上的模型下拉菜单探索其功能。
公司还在试验新的研究原型,包括调查全能 AI 助手潜力的项目 Astra。另一个原型项目 Mariner 在 Chrome 内探索 AI 驱动的操作,作为试验性扩展,而 Jules 则作为 AI 驱动的代码代理。谷歌强调对这些发展采取谨慎负责的态度,与可信的测试者合作确保安全性和有效性。
未来的集成和扩展
Gemini 2.0 在谷歌搜索中的 AI 概览测试已经开始,计划明年初将其集成扩展到更多谷歌产品中。这种扩展反映了谷歌增强其整个产品生态系统中 AI 用户交互的承诺。
随着 AI 的不断发展,谷歌的 Gemini 2.0 标志着智能、响应系统开发的重要一步,这些系统能够支持从日常任务到复杂研究和开发项目的广泛应用。
Image source: Shutterstock