Anthropic 发布更快、更智能、更便宜的 AI 模型

自从 OpenAI 发布ChatGPT以来,许多公司都尝试创建自己的 AI 模型,但只有少数公司能够脱颖而出。Anthropic 就是其中之一。

这家人工智能初创公司于 3 月发布了自己的人工智能模型 Claude。事实证明,它是 OpenAI 的 GPT-3.5 和GPT-4 的有力竞争对手。据 Anthropic 称,在首次发布之后,Anthropic 还发布了 Claude Instant,这是 Claude 的更轻、更便宜、更快的版本。现在,它正在升级。

周三,Anthropic发布了Claude Instant 1.2,这是该模型的改进版本,它利用了Claude 2.0(7 月份发布的最新版本 Claude)。

新闻稿称,由于采用了 Claude 2.0 的先进功能,Claude Instant 1.2 在数学、编码、推理和安全性方面有了显著提升,并能生成更长、更结构化的响应。

为了对该模型进行测试,Anthropic 比较了 Claude Instant 1.1 和 1.2 在标准基准评估中的表现,包括 Codex 评估和小学数学问题基准(GSM8k),这些都是数学和编码能力的良好基准。

在这两种情况下,1.2 的表现均优于 1.1,在 Codex 评估中得分为 58.7%,而原始得分为 52.8%,在 GSM8k 中得分为 86.7%,而原始得分为 80.9%。

对于其余的基准测试,新型号的表现略低于或高于旧型号,差异很小。

答案输出的质量也得到了改善,幻觉减少,对越狱企图的抵抗力增强。红队评估发现,Claude 1.2 是最安全的模型。

企业可以通过填写兴趣表来获取新模型 ,开发人员可以使用 API,这 比 Claude 2 便宜得多。

标签



热门标签