今天凌晨,Anthropic 推出迄今为止最强模型:Claude 3.5 Sonnet。作为 Claude 3.5 系列的排头兵,Claude 3.5 Sonnet各项评估指数力压 Claude 3 Opus 和 GPT-4o。更厉害的是:它免费可用!今年的 AI 行业,真是太精彩了!OpenAI 不再一家独大,Anthropic接连推出 Claude 3.0、Claude 3.5 系列模型,力压之前的 GPT-4,以及现在的 GPT-4o。GPT-5 如果再不出来,OpenAI 最强大模型的王座,将岌岌可危。 言归正传。 Claude 3.5 Sonnet 是 Claude 3.5 系列的首个模型,今年晚些时候,Anthropic 还会陆续推出 Claude 3.5 Haiku 和 Claude 3.5 Opus 等版本。
免费体验链接:http://claude.ai Claude 3.5 Sonnet 在哪些方面做了升级?
▶ 更强的指令理解、内容创作能力(可以理解为——更通人性); ▶ 基准测试全面碾压 Gemini 1.5 Pro、Llama-400b,大部分优于 GPT-4o; ▶ 输出速度更快(是 Claude 3 Opus 的两倍); ▶ 成本更低(API 成本是 Claude 3 Opus 的五分之一); ▶ 在编码、视觉处理等复杂任务中表现出色。
拿视觉处理能力来说:Claude 3.5 Sonnet 在所有标准视觉基准上都超过了 Claude 3 Opus。甚至几乎全面强于,GPT-4o。下图为 Claude 3.5 Sonnet 与 Claude 3 Opus、GPT-4o、Gemini 1.5 Pro 在视觉数学推理、科学图表、视觉问答、图表 QA、文件视觉 QA 任务中的性能比较。编码能力是 Claude 3.5 Sonnet 进化的重点之一,在内部编码评估中,Claude 3.5 Sonnet 解决了 64% 的问题。相比之下,Claude 3 Opus 只解决了 38%,差距不止一点点。新功能——Artifacts。Artifacts 是一项扩展用户与 Claude 交互方式的新功能。当用户要求 Claude 生成代码片段、文本文档或网站设计等内容时,这些工具会出现在他们的对话旁边的专用窗口中。Artifacts创建了一个动态工作空间,用户可以在其中实时查看、编辑和构建 Claude 的创作,将人工智能生成的内容无缝集成到用户的项目和工作流当中。Artifacts 将很快扩展到支持团队协作。在不久的将来,团队将能够安全地将他们的知识、文档和正在进行的工作集中在一个共享空间中,而 Claude 则将充当我们的最强 AI 队友。OK,今天的分享就到这里。