有望超越人类?GPT-4已正式通过图灵测试,比普通成年人还懂讽刺暗示

有望超越人类?GPT-4已正式通过图灵测试,比普通成年人还懂讽刺暗示
2024年06月19日 18:04 胡润百富

回顾苹果在全球开发者大会的亮相, Apple Intelligence(苹果智能)无疑是其中的重点。据苹果CEO库克介绍,他们将会和OpenAI合作,下一代iOS将整合GPT的部分功能。虽然短时间股价有所下跌,但AI大模型的魔力依旧在第二天将苹果的股价推向历史新高,一夜大增2142亿美元。

自从今年5月,OpenAI发布新一代旗舰生成模型GPT-4o后,就不断有好消息传出。来自加利福尼亚大学圣迭戈分校的研究证实,GPT-4已经可以轻松通过图灵测试,在实验中人类无法区分AI大模型和人类之间的区别。无独有偶,谷歌DeepMind和牛津进一步研究,证实GPT-4在心智方面的能力和普通成年人相比相差无几。在更复杂的推理能力、理解讽刺、暗示能力层面,更是大幅超越人类。

这是怎么回事?AI大模型真要超越人类了?

图片来源:今日头条

01

有望超越人类

GPT-4已正式通过图灵测试

计算机领域大名鼎鼎的图灵测试,起源于业界大佬艾伦·麦席森·图灵。这个测试希望能够探究出机器能否模拟出乃至于超越人类的智能,也被认为是检验机器能否像人类一样产生感情的工具。在各类科幻作品中,图灵测试广泛出现,满足了人类畅享AI智能发展的美梦。

目前图灵测试测试时长通常为5分钟,如果电脑能回答由人类测试者提出的一系列问题,且超过30%的回答让测试者误认为是人类所答,则电脑通过测试。早在2014年,一款名叫Eugene Goostman的聊天程序成功地被33%的评委判定为人类,首次“通过”了图灵测试,让世界为之一惊。

33%的通过率放在10年前算是奇迹,但在今天似乎已经不值一提。据悉,加利福尼亚大学圣迭戈分校在实验过程中招募了近500名志愿者,通过对话的方式判断屏幕另一端对话的对象是人类还是人工智能。在这次实验中,GPT-4有54%的情况下,被判定为人类。

图片来源:arxiv

更加值得注意的是,许多人类在测试中根本无法准确区分人类和人工智能。在隐藏自己身份并且假装拥有人类情感这件事上,GPT-4展现惊人的天赋。不过研究人员也指出,GPT4表现出色当然离不开其出色的模仿人类功能,但也有可能是判断者在此过程中不够专注,没有识破人工智能的语言陷阱。

而GPT-4的能力显然不仅局限于模仿人类情感。在谷歌和牛津联名发布的一项研究显示,GPT4在心智方面的表现已经超越了人类。简单来说,得益于庞大的数据库, GPT4能够比普通成年人更快发现对话中的情绪暗示、讽刺挖苦等一系列明显带有人类情感特征的语言方式。

以上多项研究似乎证明, GPT4已经发展出理解人类心理的能力,能够理解人类提出的要求和目标,甚至可以涉及人类道德冲突的复杂问题上进行判断,就像真正的人类一样。

图片来源:pixabay

难怪最近被称为“AI教父”Geoffrey Hinton也闲不住了,在公开采访中表示目前的AI大语言模型已经具备了理解能力,在国外论坛引发了广泛讨论。他甚至更进一步谈到了人工智能取代人类的可能性。他大胆预言如果AI开始进化,那么人类就会被抛弃,甚至会被碾压进尘土。科幻电影《终结者》的场景似乎有可能照进现实。

02

坏消息接踵而至

GPT-4未来在何方

不过一向和OpenAI过不去的特斯拉创始人马斯克,这次也没忘记给苹果和OpenAI的合作泼冷水。据悉,在苹果发布会后不久,他就连发多条推文,称苹果接入GPT会在用户隐私方面带来意想不到的巨大漏洞。强调苹果在“贩卖客户隐私”,并威胁会在公司内禁止使用苹果设备。而马斯克的观点似乎也代表了西方社会对AI技术快速发展的共同担忧。

图片来源:x

事实上,的确有很多人不满意GPT-4的发展方向。悉尼大学的Marcel Scharth教授发文指出,GPT-4现在更加会假装人类情感了,而这种假装可能让用户在使用过程中被蒙骗、被“欺骗感情”。不仅如此, GPT-4o还在努力延长和用户的对话时间,从而积累自己的训练素材,进而改进自己拟人化能力,但本质上也是在欺骗用户的情感。

从现实来看,GPT-4o并非一款完美产品。虽然在人机交互层面取得显著进步,GPT-4的延迟约5.4秒,而GPT-4o的语音平均响应时间只有0.3秒。但其背后运行逻辑依然不够清晰。面对同一个问题,哪怕只是更换中英文提问,也可能会得到迥然不同的答案。这意味它仍然没能解决许多AI大语言模型“胡说八道”的问题。在可靠性上存在难以愈合的漏洞。

而OpenAI面临的道德困境和法律风险更加复杂。今年5月,著名演员嘉丽·约翰逊就OpenAI聊天机器人使用酷似她声音的Sky语音一事发表声明,还向OpenAI正式发送了律师函,随后他们不得不宣布暂停使用Sky语音以平息事态。但AI技术滥用带来的“诈骗频发”问题却依旧困扰着OpenAI这家宣称公共利益之上的企业。

OpenAI内部同样风波不断。今年5月,其团队创始成员首席科学家Ilya Sutskever、超对齐项目负责人Jan Leike多位大佬相继宣布退出。他们表示现在的管理层更加在意“流量”和“商业变现”,言外之意似乎已经溢于言表——在安全可靠性上,当前的OpenAI做出的努力远远不够。

图片来源:x

企业内部纷争不断,来自企业外部的强敌虎视眈眈。据悉,在6月18日超越微软苹果成为全球市值最高的公司英伟达,已经发布了开源模型Nemotron-4 340B,其性能已经可以和GPT-4相抗衡;放眼国内,来自复旦和上海AI实验室的研究团队研发出的MCTSr模型具有超强数学能力。它只用少量数据,就能在奥数题目上和GPT-4实现相同的效果。来自全球各地的大语言模型,都在向GPT-4发起新的挑战。

在美国,一项来自皮尤研究中心(Pew)的数据显示,52% 的美国人表示对人工智能的担忧多于兴奋。虽然大家对人工智能的理解更加深刻,但不安的感觉也在增加。面对人工智能,在可预见的未来,还有很多政策、社会共识、心理建设需要完善。

图片来源:Google

GPT-4的突破性进展无疑为我们打开了全新的科技视野。随着人工智能技术的不断进步,我们不禁开始想象未来可能呈现的图景:与人类相媲美的AI大模型将如何重塑我们的工作、学习和生活方式?大模型全方面超越人类可能究竟是一句戏言还是可能发生的未来?

这一进步引发了我们对技术伦理和责任的深刻思考。我们如何确保这些高度智能化的前沿技术被用于正当目的,而非造成潜在的社会风险?我们如何教育公众理解并适应与AI共存的未来?

展望未来,我们期待科学家们能够继续探索AI的边界,同时也呼吁社会各界共同关注并参与到这场科技革命中来,共同构建一个既安全又繁荣的未来。在人工智能的引领下,我们或许能够揭开更多未知的奥秘,为人类的进步和发展开辟新的道路。

资料来源:新智元、太平洋科技、量子位、澎湃新闻等

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部