有望超越人类？GPT-4已正式通过图灵测试，比普通成年人还懂讽刺暗示_

回顾苹果在全球开发者大会的亮相， Apple Intelligence（苹果智能）无疑是其中的重点。据苹果CEO库克介绍，他们将会和OpenAI合作，下一代iOS将整合GPT的部分功能。虽然短时间股价有所下跌，但AI大模型的魔力依旧在第二天将苹果的股价推向历史新高，一夜大增2142亿美元。

自从今年5月，OpenAI发布新一代旗舰生成模型GPT-4o后，就不断有好消息传出。来自加利福尼亚大学圣迭戈分校的研究证实，GPT-4已经可以轻松通过图灵测试，在实验中人类无法区分AI大模型和人类之间的区别。无独有偶，谷歌DeepMind和牛津进一步研究，证实GPT-4在心智方面的能力和普通成年人相比相差无几。在更复杂的推理能力、理解讽刺、暗示能力层面，更是大幅超越人类。

这是怎么回事？AI大模型真要超越人类了？

图片来源：今日头条

有望超越人类

GPT-4已正式通过图灵测试

计算机领域大名鼎鼎的图灵测试，起源于业界大佬艾伦·麦席森·图灵。这个测试希望能够探究出机器能否模拟出乃至于超越人类的智能，也被认为是检验机器能否像人类一样产生感情的工具。在各类科幻作品中，图灵测试广泛出现，满足了人类畅享AI智能发展的美梦。

目前图灵测试测试时长通常为5分钟，如果电脑能回答由人类测试者提出的一系列问题，且超过30%的回答让测试者误认为是人类所答，则电脑通过测试。早在2014年，一款名叫Eugene Goostman的聊天程序成功地被33%的评委判定为人类，首次“通过”了图灵测试，让世界为之一惊。

33%的通过率放在10年前算是奇迹，但在今天似乎已经不值一提。据悉，加利福尼亚大学圣迭戈分校在实验过程中招募了近500名志愿者，通过对话的方式判断屏幕另一端对话的对象是人类还是人工智能。在这次实验中，GPT-4有54%的情况下，被判定为人类。

图片来源：arxiv

更加值得注意的是，许多人类在测试中根本无法准确区分人类和人工智能。在隐藏自己身份并且假装拥有人类情感这件事上，GPT-4展现惊人的天赋。不过研究人员也指出，GPT4表现出色当然离不开其出色的模仿人类功能，但也有可能是判断者在此过程中不够专注，没有识破人工智能的语言陷阱。

而GPT-4的能力显然不仅局限于模仿人类情感。在谷歌和牛津联名发布的一项研究显示，GPT4在心智方面的表现已经超越了人类。简单来说，得益于庞大的数据库， GPT4能够比普通成年人更快发现对话中的情绪暗示、讽刺挖苦等一系列明显带有人类情感特征的语言方式。

以上多项研究似乎证明， GPT4已经发展出理解人类心理的能力，能够理解人类提出的要求和目标，甚至可以涉及人类道德冲突的复杂问题上进行判断，就像真正的人类一样。

图片来源：pixabay

难怪最近被称为“AI教父”Geoffrey Hinton也闲不住了，在公开采访中表示目前的AI大语言模型已经具备了理解能力，在国外论坛引发了广泛讨论。他甚至更进一步谈到了人工智能取代人类的可能性。他大胆预言如果AI开始进化，那么人类就会被抛弃，甚至会被碾压进尘土。科幻电影《终结者》的场景似乎有可能照进现实。

坏消息接踵而至

GPT-4未来在何方

不过一向和OpenAI过不去的特斯拉创始人马斯克，这次也没忘记给苹果和OpenAI的合作泼冷水。据悉，在苹果发布会后不久，他就连发多条推文，称苹果接入GPT会在用户隐私方面带来意想不到的巨大漏洞。强调苹果在“贩卖客户隐私”，并威胁会在公司内禁止使用苹果设备。而马斯克的观点似乎也代表了西方社会对AI技术快速发展的共同担忧。

图片来源：x

事实上，的确有很多人不满意GPT-4的发展方向。悉尼大学的Marcel Scharth教授发文指出，GPT-4现在更加会假装人类情感了，而这种假装可能让用户在使用过程中被蒙骗、被“欺骗感情”。不仅如此， GPT-4o还在努力延长和用户的对话时间，从而积累自己的训练素材，进而改进自己拟人化能力，但本质上也是在欺骗用户的情感。

从现实来看，GPT-4o并非一款完美产品。虽然在人机交互层面取得显著进步，GPT-4的延迟约5.4秒，而GPT-4o的语音平均响应时间只有0.3秒。但其背后运行逻辑依然不够清晰。面对同一个问题，哪怕只是更换中英文提问，也可能会得到迥然不同的答案。这意味它仍然没能解决许多AI大语言模型“胡说八道”的问题。在可靠性上存在难以愈合的漏洞。

而OpenAI面临的道德困境和法律风险更加复杂。今年5月，著名演员嘉丽·约翰逊就OpenAI聊天机器人使用酷似她声音的Sky语音一事发表声明，还向OpenAI正式发送了律师函，随后他们不得不宣布暂停使用Sky语音以平息事态。但AI技术滥用带来的“诈骗频发”问题却依旧困扰着OpenAI这家宣称公共利益之上的企业。

OpenAI内部同样风波不断。今年5月，其团队创始成员首席科学家Ilya Sutskever、超对齐项目负责人Jan Leike多位大佬相继宣布退出。他们表示现在的管理层更加在意“流量”和“商业变现”，言外之意似乎已经溢于言表——在安全可靠性上，当前的OpenAI做出的努力远远不够。

图片来源：x

企业内部纷争不断，来自企业外部的强敌虎视眈眈。据悉，在6月18日超越微软苹果成为全球市值最高的公司英伟达，已经发布了开源模型Nemotron-4 340B，其性能已经可以和GPT-4相抗衡；放眼国内，来自复旦和上海AI实验室的研究团队研发出的MCTSr模型具有超强数学能力。它只用少量数据，就能在奥数题目上和GPT-4实现相同的效果。来自全球各地的大语言模型，都在向GPT-4发起新的挑战。

在美国，一项来自皮尤研究中心（Pew）的数据显示，52% 的美国人表示对人工智能的担忧多于兴奋。虽然大家对人工智能的理解更加深刻，但不安的感觉也在增加。面对人工智能，在可预见的未来，还有很多政策、社会共识、心理建设需要完善。

图片来源：Google

GPT-4的突破性进展无疑为我们打开了全新的科技视野。随着人工智能技术的不断进步，我们不禁开始想象未来可能呈现的图景：与人类相媲美的AI大模型将如何重塑我们的工作、学习和生活方式？大模型全方面超越人类可能究竟是一句戏言还是可能发生的未来？

这一进步引发了我们对技术伦理和责任的深刻思考。我们如何确保这些高度智能化的前沿技术被用于正当目的，而非造成潜在的社会风险？我们如何教育公众理解并适应与AI共存的未来？

展望未来，我们期待科学家们能够继续探索AI的边界，同时也呼吁社会各界共同关注并参与到这场科技革命中来，共同构建一个既安全又繁荣的未来。在人工智能的引领下，我们或许能够揭开更多未知的奥秘，为人类的进步和发展开辟新的道路。

资料来源：新智元、太平洋科技、量子位、澎湃新闻等

头条号入驻

胡润百富全球最大的财富榜排榜机构

财经自媒体联盟更多自媒体作者

今日推荐优秀作者看点月榜

新浪财经头条意见反馈留言板

4000520066 欢迎批评指正

有望超越人类？GPT-4已正式通过图灵测试，比普通成年人还懂讽刺暗示

头条号入驻

财经自媒体联盟更多自媒体作者

热文排行榜