Anthropic推出Claude2,能够输出更长、更新的内容
作者: AI范儿 来源: [AI范儿](https://mp.weixin.qq.com/s/HdbJT_eeYeOpnbYWTED3Lw)
图|匡萃彪
文|匡萃彪
前OpenAI研究人员创立的AI公司Anthropic,推出了其更新版聊天机器人Claude 2,目标直指ChatGPT和Google Bard。
在Claude首次亮相仅五个月后,其继任者拥有更长的回答、细致入微的推理能力以及卓越的表现,在GRE阅读和写作考试中取得了令人印象深刻的成绩。
Claude 2被认为是一个AI强大的力量,能够在一次提示中处理多达100,000个标记,大约相当于75,000个单词。这与Claude之前的9,000个标记限制相比是一个巨大的飞跃,带来了独特的优势:AI能够以更具上下文和改进的方式提供回答。
新模型在多个领域取得了显著进展,包括法律、数学和编码,在标准化测试中进行评估。根据Anthropic公司的数据,Claude 2在律师考试中选择题部分得分76.5%(GPT-3.5只有50.3%),并且在GRE阅读和写作考试中超过90%的研究生申请者。
此外,Claude 2还在Codex HumanEval Python编码测试中获得71.2%的分数,并且在GSM8k小学数学问题上获得88.0% 的高分,显示出其先进的计算能力。以下为对比分析:
在标准考试中,与GPT-4相比,它还没有完全赶上 ,但与v1.3相比迎头赶上:
-
GRE口语:165对169(GPT-4获胜)
-
GRE写作:5对4(Claude获胜)
-
GRE定量:154对163(GPT-4获胜)
-
USMLE医学考试:约67对约85(GPT-4获胜)
在推理基准测试中:
-
HumanEval编码能力:71.2%对67%(Claude获胜)。同时,GPT-3.5只得到48%的分数。Claude的编码能力有了显著提高。
-
GSM-8K小学数学水平测试成绩:88%对92% (GPT-4获胜)。Claude从85.2提升至88%,超过了之前版本。
Anthropic的Claude拥有独特的“宪法”,这套规则受到《世界人权宣言》的启发,使其能够在没有人类反馈的情况下自我改进、识别不当行为并调整自己的行为。
但是,与ChatGPT和谷歌新推出的Bard相比,它表现如何呢?让我们从规格方面来看一下它们之间的对比。
价格:
-
ChatGPT:对于使用GPT-3.5版本的用户免费。想要使用更强大的运行GPT-4版本的用户需要支付每月20美元以获取ChatGPT Plus版本。
-
Claude:免费
-
Bard:免费
可用性:
-
ChatGPT:是三者中最广泛可用的。
-
Bard:在比ChatGPT更少的国家可用。
-
Claude:暂时只在美国和英国可用。
支持的语言:
-
ChatGPT:支持80多种语言。
-
Bard:支持英语、日语和韩语。
-
Claude:支持多种广泛使用的语言,如英语、西班牙语、葡萄牙语、法语、普通话和德语等。如果无法识别一种语言(或输入有许多语法错误),它会提供一个介绍性短句,然后用英文回答。
上下文处理:
-
ChatGPT:免费版本支持7,096个标记的上下文,ChatGPT Plus(GPT-4)支持8,192个标记。OpenAI还提供了一个支持32K标记的版本,但ChatGPT不使用该版本。
-
Bard:支持8,196个标记的上下文。
-
Claude:可以在每个提示中输入最多100K标记,这意味着可以处理数百页的文档甚至一本书。
知识截止日期:
-
GPT-4 是 2021 年 9 月
-
Bard:也是2021 年 9 月
-
Claude-2 的知识截止日期是 2023 年初,所以它的记忆要新鲜得多。
功能:
-
ChatGPT:免费版没有额外功能。GPT Plus提供插件商店、代码解释器以及由Microsoft Bing提供技术驱动的临时暂停网页浏览功能。提供API支持。
-
Bard:聊天机器人仍处于实验阶段,但将拥有插件商店和Google Suite集成。对其API只有有限访问权限。
-
Claude: 可将聊天机器人添加到Slack,并处理不同任务,如总结线程、提供建议、进行头脑风暴等。提供API支持。
关于Anthropic
Anthropic 由前 OpenAI 研究高管 Dario Amodei、Daniela Amodei(兄妹俩因对OpenAI的发展路径不满而另起炉灶)、Jack Clark、Sam McCandlish 和 Tom Brown 于 2021 年创立,其使命是打造人们可以依赖的 AI 产品,并开展有关 AI 机遇和风险的研究。
迄今为止,该公司已从 Google、Salesforce Ventures、Spark Capital、Sound Ventures、Zoom Ventures 等投资者筹集了 15 亿美元资金。估值为数十亿美元。虽然这听起来可能很多,但远远低于该公司估计的创建其设想的聊天机器人所需的资金(未来两年 50 亿美元)。
Anthropic 还发表了超过 15 篇安全研究论文,主题包括人工智能宪法、社会影响、可解释性、红队和扩展法等。
总结
现在,AI聊天机器人领域有更多的选择,我们不一定需要成为ChatGPT的粉丝或者仅使用某个产品。
每个产品都有其优点和缺点,使得每个机器人在特定需求下更具吸引力。Claude处理大量数据但可能不适合需要实时数据的任务。ChatGPT更富创造性,非常适合需要特定语言支持的任务(如果你愿意付出代价,它的Plugin真是太棒了)。另一方面,Bard更加客观、准确,并利用其互联网连接性能力强大,但对于创造性任务可能并不是最佳选择。
最后,为什么要做选择了?小孩子才做选择,成年人全要。
END
扫码加入读者群,
和作者及时互动,
和同行学习交流。
点这里 👇关注我,记得标星哦~