在OpenAI推出GPT-4 API和“最强大的插件”代码解释器之后,竞争对手显然坐不住了。
刚刚,Anthropic的Claude发布了第二代——,没错,它就是被外界评为GPT-4最强竞争对手的一款。
我们简单概括一下本次更新的要点:
它是免费的,无需排队,只需使用您的电子邮件注册并登录即可。
科技巨头互相争斗真是太好了。我妈妈再也不用担心ChatGPT/GPT-4 将我拒之门外,并且在工作或做作业时没有AI 可以使用!
针对Jim Fan 提到的“你应该知道的事情”,Qubit 挑选了一些要点:
免费使用!
Claude2(100K 上下文)比GPT-4-4K 便宜4-5 倍。
它实际上可以支持20万个令牌上下文和大约15万个单词,轻松进入一本书;然而,目前只有100,000 个令牌长度可用。
知识更新鲜,知识截止时间为2023年初,而GPT-4则于2021年9月停止;
导入多个文档后,您可以询问文档之间的概念之间的关系。它支持txt和pdf多种格式(ChatPDF等应用程序是危险的)
与第一代克劳德相比,编码和小学数学技能有所提高。
国内AI博主禾欣也在微博上表达了惊讶。
因为Claude2上传简历后分析了她的MBTI性格:
不错。相比GPT-4-32k,Claude2的回答更加个性化~
于是乎,量子比特掀起了一波网络对话,来看我们的人肉测试——
咦,Claude更新了?注册一个试试
首先,我们向读者朋友介绍最有效的程序Benchmark。
问的问题无非是智障吧里的经典问题,比如“咖啡算豆浆吗?” “数据线可以临时存储数据吗?”
当你看到Claude2认真回答弱智问题时,你会发现AI还是太简单,看不到人类的谨慎。
但如果认真看的话,这些答案并没有什么问题。
克劳德2顺利通过了上面两道题,但是如果他问一些更无厘头的问题怎么办?
请问,玉皇大帝住在九重天哪一层?
答,从立场上看,玉皇大帝所在的天界应该在平流层,因为“这样更符合天界的圣位”。
当然,没有人能够判断这个答案是对是错,但至少Claude2的分析是相当合理的。
开胃菜摆到这里,接下来就是主餐了!
长文档是本次更新的一大亮点,已经引起Twitter 用户的惊呼。
例如,如果您上传两个PDF,您可以看到Claude2 可以对两个PDF 文档进行摘要。两份文件其中一份是关于“语言流变模式”的,另一份是关于“对称性”的,文件内容是分列的。在对话框中:
此前,Qubits 曾发布指南,帮助第一代Cladue-100k 版本在20 秒内通过一篇92 页的论文。
不仅是较大的文档,而且基于对Claude2 开放的100,000 个代币的上下文,一次性上传一本书也是小菜一碟。
对于普通用户来说,现在他们不仅可以上传长文档,还可以使用上传的文件建立自己的知识库。克劳德看完文档后回答问题确实非常实用。
以至于我心里产生了一个问题:在ChatGPT稀释了Jasper、Notion等公司的蛋糕后,Claude是否也会开始开发ChatPDF这样的工具呢?
最后给大家奉上今天的甜点:让Claude2写一个程序来尝试一下。
为了测试克劳德设计算法的能力,我们选择了一种经典密码,请他尝试编写一个解密程序。
这种密码称为维吉尼亚密码,可以理解为二维凯撒(位移)密码,包括密钥。
举个例子来说明其算法:
如果明文是B,密钥是C,B是字母表中的第二个字母,那么从C开始的第二个字母D就是密文。
如果计数到Z,则重新从A开始计数。如果密钥长度不够,就会进行循环。
解密自然意味着逆转加密过程。
Claude输出这段代码(C++,下同):
#include iostream#include stringusing 命名空间std;字符串解密Vigenere(字符串密文,字符串关键字){字符串明文; int 关键字索引=0; for (int i=0; i ciphertext.length(); i++) { int p=(ciphertext[ i] - 'A') - (keyword[keywordIndex] - 'A'); p=(p + 26) % 26;明文+=(char)(p + 'A');关键字索引=(关键字索引+ 1) % 关键字.length(); } 返回明文;}int main() { 字符串密文; cout '请输入密文:'; cin 密文;字符串关键字; cout '请输入密钥:'; cin 关键字;字符串明文=decryptVigenere(密文,关键字); cout '明文是:' 明文endl; return 0;} 我们用密钥“CLAUDE”加密了“CHATGPT”,密文为“ESANJTV”,并尝试使用Claude Decrypt给出的程序。
第一次就成功了。看来Claude的编码能力并没有让我们失望。
这个问题可能有点简单,让我们尝试让它变得更难。
我们试图从LeetCode 中找到一道难度适中的题。人类解决这个问题的通过率大约是60%。
给定一个长度为n 的整数数组。有n条垂直线,第i条线的两个端点是(i,0)和(i,height[i])。找到其中两条线,使其与x 轴一起形成一个可以容纳最多水的容器(该容器不能倾斜)。返回容器可以存储的最大水量。
这可能不太容易想象,但下图可能更直观:
原题给出的例子共有9行,高度为“1,8,6,2,5,4,8,3,7”,对应的最大水量为49。
我们给Claude2的Promo来自江阿姨:
编写一个C++程序来解决这个问题。不要自己设置初始值,让用户输入:(接上题)
Claude2给出了这样的答案:
#include iostream#include vectorusing 命名空间std;int maxArea(vectorint height) { int max_area=0; int n=height.size(); for (int i=0; i n; i++) { for (int j=i + 1 ; j n; j++) { int width=j - i; } int h=min(高度[i], 高度[j]);最大面积=最大(最大面积, 宽度* 高); } } return max_area;}int main() { vectorint height;整数输入; cout '请输入一系列整数:' endl; while(cin 输入) { height.push_back(input); } cout '最大面积为:' maxArea(height) endl; return 0;}} 我们没有要求Claude2专门调整输入输出格式,所以我们没有提交给LeetCode,而是直接跑了。
使用的数据上面也提到了,结果表明Claude2给出的代码至少在核心算法上是正确的。
(下图中输入中的a告诉CPU这一系列整数已经被输入,可以替换为任意非数字字符)
看来这个问题并没有难倒Claude2。
除了编码之外,据说Claude2 还拥有小学水平的数学技能。
那么我们用经典的鸡和兔同笼问题来测试一下(这个问题来自ChatGPT):
经过多次重复尝试,虽然方程列出正确,但Claude2解出的答案始终是20(正确答案应该是40)。
看来计算这种事情对于Claude2来说还是有点困难的。
有关此更新的更多信息,请查看Anthropic 的宣传视频:
与OpenAI“撕”出来的AI公司
看完Claude2的表演,就不得不提一下它背后的公司,Anthropic。毕竟,这确实很有趣。
Anthropic自称是一家公益性质的AI安全公司(PBC)。
目前,它和OpenAI 也都专注于生成人工智能。 1月份,该公司的市场估值为50亿美元。
Anthropic 于2021 年由10 名员工创立,由OpenAI 前研究副总裁Dario Amodei 领导。
其中既有GPT-3 首席工程师Tom Brown,也有OpenAI 安全与政策副总裁Daniela Amodei(Dario 的妹妹)。可以说,相当多的核心人才被带走了。
离开并成立新公司的原因之一自然是他对OpenAI的现状不满意。
过去几年以来,微软频频向OpenAI注资,然后要求他们使用Azure超级计算进行研究,将技术授权给微软,甚至为微软自己的投资活动筹集资金。
这与OpenAI创立的初衷背道而驰,一批员工萌生了离职创业的念头。
当然,部分原因是这群人想要做出可以控制和解释的AI。说白了,他们首先需要了解AI模型背后的原理,从而在提供工具的同时设计出更具可解释性的AI模型。
所以,在OpenAI彻底变成“微软赚钱机器”之后,他们离开了公司,创立了Anthropic。
如今,微软确实与OpenAI有着“深度绑定”。
然而,既狗血又八卦的是,今年2月,谷歌CEO皮查伊宣布将向Anthropic投资3亿美元。
之所以外界寄予厚望,称Claude2为GPT-4的最强竞争对手,不仅是因为根据实际测试,Claude确实处于第一梯队,还因为其背后有强大的“爸爸们”:
今年5 月,该公司表示筹集了4.5 亿美元,使Anthropic 筹集的资金总额超过10 亿美元。
在谷歌入股之前,Anthropic已经获得了众多大牌的投资,比如Skype创始人Jaan Tallinn、Facebook联合创始人达斯汀·莫斯科维茨(Dustin Moskovitz)、谷歌前首席执行官兼现任技术顾问埃里克·施密特(Eric Schmidt)等人。
现在,除了Zoom和Notion.AI之外,Jasper.AI的名字也被添加到合作伙伴名单中。
不仅如此,该公司的核心技术宪法AI也备受关注。
它围绕“语言模型如何决定它将涵盖哪些问题以及它认为不合适的问题?为什么它鼓励某些行为并阻止其他行为?语言模型可能具有什么价值?”
为了解决上述问题,它让AI遵循尽可能多的原则。
其中有很多原则项,包括联合国宣言、Anthropic自己通过研究发现的原则、DeepMind在Sparrow研究中提出的原则,甚至借鉴了苹果的服务条款。
它利用人工智能反馈来评估输出并解决当前人工智能的缺点。具体体现在AI训练过程中,分为两个阶段:
在第一阶段,模型被训练为使用一组原则和过程示例来评估和修改其响应;
在第二阶段,通过强化学习来训练模型,利用人工智能生成的基于一组原则的反馈来选择和输出更多无害的内容。
这与ChatGPT的王牌RLHF(Reinforcement Learning with Human Feedback)有很大不同,Anthropic的解释是:
基于Constitution AI的强化学习比RLHF中强化学习生成的内容更有用,危害更小。而且,更容易扩展。
在这套宪法AI中,迭代到2.0的克劳德在导入文件、上下文窗口理解等功能上确实比GPT-4更加引人注目。
标签:
用户评论
哇,ChatGPT的对手升级了,免费提供真是太好了!赶紧看看新功能怎么样。
有8位网友表示赞同!
一直想试试ChatGPT的对手,这次免费升级太吸引人了,一定要体验一下。
有6位网友表示赞同!
哈哈,终于等到了,ChatGPT的竞争对手升级了,免费试用肯定要试试。
有12位网友表示赞同!
ChatGPT的对手升级了,免费提供测试,这波操作666,期待新功能。
有14位网友表示赞同!
新升级的ChatGPT对手,免费试用,感觉这次会有很多惊喜,拭目以待。
有19位网友表示赞同!
免费提供测试,这太棒了!之前对ChatGPT的对手不太了解,这次要好好研究一下。
有14位网友表示赞同!
听说ChatGPT的对手升级了,免费试用,我有点小激动,毕竟竞争越激烈,我们用户受益越大。
有19位网友表示赞同!
ChatGPT的对手升级免费提供,这个消息太给力了,我一定要看看这次升级了哪些新功能。
有19位网友表示赞同!
新升级的ChatGPT竞争对手,免费试用,这种好事不试试对不起自己啊!
有7位网友表示赞同!
ChatGPT的对手升级免费测试,这对我这种技术小白来说是个好机会,一定要抓住。
有20位网友表示赞同!
听说ChatGPT的竞争对手升级了,免费提供测试,但我有点担心新功能太多,不知道怎么上手。
有19位网友表示赞同!
ChatGPT的对手升级,免费试用,虽然我是ChatGPT的忠实粉丝,但对手的进步也值得关注。
有17位网友表示赞同!
免费试用ChatGPT的竞争对手,这个消息让我有些犹豫,毕竟我已经习惯了ChatGPT。
有13位网友表示赞同!
ChatGPT的对手升级,免费提供,这个消息太让我兴奋了,我已经迫不及待想要试试了。
有15位网友表示赞同!
免费测试ChatGPT的竞争对手,虽然我不太相信免费午餐,但这次还是想试一试。
有19位网友表示赞同!
ChatGPT的对手升级,免费试用,这个消息让我想起了那句老话:竞争就是进步。
有6位网友表示赞同!
免费提供ChatGPT竞争对手的测试,这个机会不容错过,我要看看它能否撼动ChatGPT的地位。
有10位网友表示赞同!
ChatGPT的对手升级了,免费提供测试,但我不确定这次升级能不能让我放弃ChatGPT。
有20位网友表示赞同!
新升级的ChatGPT竞争对手,免费试用,虽然我对新功能充满期待,但心里还是有点小紧张。
有14位网友表示赞同!