对面是AI还是人类呢?史上最大图灵测试实验完成

随着计算机技术的不断进步,人工智能的应用范围和水平也在不断提高,人工智能在语音识别、图像处理、自然语言处理、机器学习、深度学习等方面,都展现出了惊人的能力和潜力。但是,人工智能究竟能否达到或超越人类智能的水平呢?

为了回答这个问题,1950年,计算机科学之父阿兰·图灵提出了一个著名的试验,即图灵测试。图灵测试的目的是测试某机器是否能表现出与人等价或无法区分的智能。图灵测试的方法很简单,就是让测试者与被测试者(一个人和一台机器)隔开,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人工智能。

今年4月中旬,AI 21实验室推出了一个好玩的社交图灵游戏——“人类还是机器人?”

到目前为止,全球已经有150多万名参与者,在这个游戏中进行了超过1000万次对话,还纷纷在Reddit和Twitter上po出自己的经验和策略。

沟通交流了2分钟之后,游戏就需要参与者猜测,聊天的究竟是人类或是AI。


游戏中一些是真人版,另外一些,自然主要是基于现在最领跑大语言模型的AI智能机器人,例如Jurassic-2和GPT-4。

分析了前两百万次对话和猜测之后,可以从实验中得出以下结论——

猜测对面是人还是AI时,有68%的人猜对了。

对人类来说,识别自己的人类同胞更容易。与人类交谈时,被试猜对的准确率有73%。与AI交谈时,被试猜对的准确率有60%。

法国的网民猜想的正确率最大,为71.3%(远远高于68%的一般平均),而印度网友的正确率最少,为63.5%。

男女猜想的正确率类似,总体来说女人的正确率要更高一些。相比年龄偏大被试对比,更年轻的被试猜想的正确率更高一些。

图灵测试是一个经典而富有挑战性的试验,它不仅可以检验机器是否具有智能,还可以探索人类智慧的独特性和价值。通过这场测试,我们不仅可以深入了解人工智能的发展状况,还可以更好地理解人类智慧的无限潜力。

猜你喜欢

转载自blog.csdn.net/haisendashuju/article/details/131821599