AI 文摘

Anthropic推出Claude2,能够输出更长、更新的内容





作者: AI范儿  来源: [AI范儿](https://mp.weixin.qq.com/s/HdbJT_eeYeOpnbYWTED3Lw)

图|匡萃彪
文|匡萃彪

前OpenAI研究人员创立的AI公司Anthropic,推出了其更新版聊天机器人Claude 2,目标直指ChatGPT和Google Bard。

在Claude首次亮相仅五个月后,其继任者拥有更长的回答、细致入微的推理能力以及卓越的表现,在GRE阅读和写作考试中取得了令人印象深刻的成绩。

Claude 2被认为是一个AI强大的力量,能够在一次提示中处理多达100,000个标记,大约相当于75,000个单词。这与Claude之前的9,000个标记限制相比是一个巨大的飞跃,带来了独特的优势:AI能够以更具上下文和改进的方式提供回答。

新模型在多个领域取得了显著进展,包括法律、数学和编码,在标准化测试中进行评估。根据Anthropic公司的数据,Claude 2在律师考试中选择题部分得分76.5%(GPT-3.5只有50.3%),并且在GRE阅读和写作考试中超过90%的研究生申请者。

此外,Claude 2还在Codex HumanEval Python编码测试中获得71.2%的分数,并且在GSM8k小学数学问题上获得88.0% 的高分,显示出其先进的计算能力。以下为对比分析:

在标准考试中,与GPT-4相比,它还没有完全赶上 ,但与v1.3相比迎头赶上:

  • GRE口语:165对169(GPT-4获胜)

  • GRE写作:5对4(Claude获胜)

  • GRE定量:154对163(GPT-4获胜)

  • USMLE医学考试:约67对约85(GPT-4获胜)

在推理基准测试中:

  • HumanEval编码能力:71.2%对67%(Claude获胜)。同时,GPT-3.5只得到48%的分数。Claude的编码能力有了显著提高。

  • GSM-8K小学数学水平测试成绩:88%对92% (GPT-4获胜)。Claude从85.2提升至88%,超过了之前版本。

Anthropic的Claude拥有独特的“宪法”,这套规则受到《世界人权宣言》的启发,使其能够在没有人类反馈的情况下自我改进、识别不当行为并调整自己的行为。

但是,与ChatGPT和谷歌新推出的Bard相比,它表现如何呢?让我们从规格方面来看一下它们之间的对比。

价格:

  • ChatGPT:对于使用GPT-3.5版本的用户免费。想要使用更强大的运行GPT-4版本的用户需要支付每月20美元以获取ChatGPT Plus版本。

  • Claude:免费

  • Bard:免费

可用性:

  • ChatGPT:是三者中最广泛可用的。

  • Bard:在比ChatGPT更少的国家可用。

  • Claude:暂时只在美国和英国可用。

支持的语言:

  • ChatGPT:支持80多种语言。

  • Bard:支持英语、日语和韩语。

  • Claude:支持多种广泛使用的语言,如英语、西班牙语、葡萄牙语、法语、普通话和德语等。如果无法识别一种语言(或输入有许多语法错误),它会提供一个介绍性短句,然后用英文回答。

上下文处理:

  • ChatGPT:免费版本支持7,096个标记的上下文,ChatGPT Plus(GPT-4)支持8,192个标记。OpenAI还提供了一个支持32K标记的版本,但ChatGPT不使用该版本。

  • Bard:支持8,196个标记的上下文。

  • Claude:可以在每个提示中输入最多100K标记,这意味着可以处理数百页的文档甚至一本书。

知识截止日期:

  • GPT-4 是 2021 年 9 月

  • Bard:也是2021 年 9 月

  • Claude-2 的知识截止日期是 2023 年初,所以它的记忆要新鲜得多。

功能:

  • ChatGPT:免费版没有额外功能。GPT Plus提供插件商店、代码解释器以及由Microsoft Bing提供技术驱动的临时暂停网页浏览功能。提供API支持。

  • Bard:聊天机器人仍处于实验阶段,但将拥有插件商店和Google Suite集成。对其API只有有限访问权限。

  • Claude: 可将聊天机器人添加到Slack,并处理不同任务,如总结线程、提供建议、进行头脑风暴等。提供API支持。

关于Anthropic

Anthropic 由前 OpenAI 研究高管 Dario Amodei、Daniela Amodei(兄妹俩因对OpenAI的发展路径不满而另起炉灶)、Jack Clark、Sam McCandlish 和 Tom Brown 于 2021 年创立,其使命是打造人们可以依赖的 AI 产品,并开展有关 AI 机遇和风险的研究。

迄今为止,该公司已从 Google、Salesforce Ventures、Spark Capital、Sound Ventures、Zoom Ventures 等投资者筹集了 15 亿美元资金。估值为数十亿美元。虽然这听起来可能很多,但远远低于该公司估计的创建其设想的聊天机器人所需的资金(未来两年 50 亿美元)。

Anthropic 还发表了超过 15 篇安全研究论文,主题包括人工智能宪法、社会影响、可解释性、红队和扩展法等。

总结

现在,AI聊天机器人领域有更多的选择,我们不一定需要成为ChatGPT的粉丝或者仅使用某个产品。

每个产品都有其优点和缺点,使得每个机器人在特定需求下更具吸引力。Claude处理大量数据但可能不适合需要实时数据的任务。ChatGPT更富创造性,非常适合需要特定语言支持的任务(如果你愿意付出代价,它的Plugin真是太棒了)。另一方面,Bard更加客观、准确,并利用其互联网连接性能力强大,但对于创造性任务可能并不是最佳选择。

最后,为什么要做选择了?小孩子才做选择,成年人全要。

END

扫码加入读者群,

和作者及时互动,

和同行学习交流。

点这里 👇关注我,记得标星哦~‍‍‍

可关注我们的公众号:每天AI新工具