Anthropic 的 Claude 3 聊天机器人声称其表现优于 ChatGPT 和 Gemini

Anthropic的 Claude AI 的第三版于周一发布,被吹捧为比 OpenAI 的ChatGPT和谷歌的Gemini AI更熟练、知识更丰富、推理能力更强。

尽管 Claude 3 是一款单一产品,但它提供了三种不同的模型。Opus 和 Sonnet 模型现在可通过 Claude 3 网站和开发人员 API 使用。据 Anthropic 称,更快的 Haiku 模型将很快推出。

根据 Anthropic 的研究,在这三个模型中,Opus 在几个关键领域的得分超过了 GPT-3.5、GPT-4 和谷歌的 Gemini。测试的技能包括常识、本科水平的知识、研究生水平的专家推理、基础数学、数学问题解决和编码等。

据 Anthropic 称,凭借更先进的训练和知识,Claude 3 表现出“接近人类水平的理解力和对复杂任务的流畅性”。

Claude 3 也有望比过去的 AI 版本有所改进。

测试显示,新版本的响应时间更快,Sonnet 的速度是 Claude 2 和 Claude 2.1 的两倍,而且更加智能。因此,Anthropic 将此型号宣传为检索信息或自动化销售的理想之选。Haiku 是三者中速度最快的,能够在三秒内阅读包含图表的密集研究论文。

Anthropic 还指出,Claude 3 比之前的版本更准确,出错率更低。为了测试这一点,该公司向不同的模型提出了大量复杂且符合事实的问题。使用 Opus 模型,Claude 3 的正确答案数量是 Claude 2.1 的两倍,错误答案或幻觉更少。

为了避免提供有害信息,人工智能通常会拒绝回答被认为不适当的问题。但有时它们会错误地将无害的提示解释为有害的。在 Anthropic 的测试中,Claude 3 比以前的版本更不容易拒绝回答无害的提示。在这方面,三个 Claude 3 模型表现出对请求的更好理解,并且能够更好地区分有害和无害的问题。

Anthropic 还宣称 Claude 3 更易于使用,能够接受更长的提示,并且能够更好地保留以前提示中的信息。

Claude 的一项重大改进是它能够接受上传的文件。现在您可以向其发送各种类型的文件,包括图像、PDF、文本文件、Microsoft Office 文件、CSV 文件和 HTML 文件。作为回应,Claude 将分析、总结并回答有关文件内容的问题。

要试用 Claude 3,请访问其网站。该网站的免费版本使用 Sonnet 模型来回答您的问题。每月 20 美元,Claude Pro 使用更先进的 Opus 模型以及某些特权,例如在高峰时段优先访问和提前使用新功能。

标签



热门标签