Anthropic发布Claude 3.5 Sonnet和Haiku模型,新增计算机使用功能
据anthropic.com报道,知名AI公司Anthropic宣布发布其升级版Claude 3.5 Sonnet和新模型Claude 3.5 Haiku。Claude 3.5 Sonnet在编程方面表现出显著改进,而Claude 3.5 Haiku在多个基准测试中表现与其前一个最大模型Claude 3 Opus相当。
AI能力的进步
Claude 3.5 Sonnet模型在多个方面进行了全面升级,特别是在编程任务中表现突出。它在SWE-bench Verified等行业基准测试中的性能得到提升,从33.4%提高到49.0%,超过了其他公开可用的模型。该模型在代理工具使用任务中也表现出改进,在零售和航空领域取得了显著进步。
同样,Claude 3.5 Haiku被定位为一种经济实惠且速度快的替代方案,在各种智能基准测试中超过了Claude 3 Opus。它在编程任务中表现尤为出色,在SWE-bench Verified中的得分为40.6%,优于若干最先进的模型。
首次公测的计算机使用功能
Anthropic还在公测中引入了一种名为“计算机使用”的新功能。这个功能允许开发者指示Claude像人类一样与计算机互动,包括移动光标和点击按钮等动作。虽然目前仍处于实验阶段,但它为自动化多步骤复杂任务开辟了新可能。像Replit和The Browser Company这样的公司已经在探索这些应用能力。
计算机使用功能通过Anthropic API、亚马逊Bedrock和谷歌云的Vertex AI提供。这为开发者提供了一种新的方法来自动化重复性流程和执行开放性任务,尽管目前在滚动和缩放等基本动作上还面临挑战。
确保负责任的部署
为确保这些新功能的安全部署,Anthropic已与美国AI安全研究所和英国安全研究所合作进行预部署测试。他们还开发了分类器以检测计算机使用功能的滥用,致力于降低垃圾邮件和错误信息等风险。
Anthropic致力于持续改进这些模型和功能,预计在接下来的几个月中将迅速进步。Claude 3.5 Haiku的发布定于本月晚些时候,最初作为一个仅文本模型,计划未来增加图像输入能力。
展望未来
这些发展有望提升用户与AI互动的方式,在多个领域提供新的自动化和个性化可能性。Anthropic邀请开发者的反馈以进一步完善这些功能。
Read More
Operation Shamrock's Role in Combating Crypto Crimes and Pig Butchering Scams
Oct 22, 2024 1 Min Read
Exploring Crypto's Strategic Role in the AI Revolution
Oct 22, 2024 1 Min Read
New AI Tool Enhances Research Efficiency at Institut Curie
Oct 22, 2024 1 Min Read
Agentic AI: The Next Frontier in Artificial Intelligence
Oct 22, 2024 1 Min Read
BitMEX Introduces SCRUSDT Perpetual Swap with 50x Leverage
Oct 22, 2024 1 Min Read