人性化的极致?AI 已经开始“品尝”食物的颜色和形状了

人性化的极致?AI 已经开始“品尝”食物的颜色和形状了
2025年01月22日 08:03 互联网er的早读课

大脑经常模糊各种感官——这是营销人员在食品包装设计中经常利用的一个特质,而人工智能似乎也有这种特质。

一个粉红色的球体会是什么味道?“长相思白葡萄酒”听起来味道如何?

这些问题听起来可能很荒谬,但大量文献告诉我们,人类大脑自然会将各种感官体验融合在一起。

我们可能没有意识到这种现象,但我们会将不同的颜色、形状和声音与不同的味道联系起来,从而微妙地塑造我们的感知体验。例如,我们喝酒时使用的玻璃杯的颜色,酒吧播放的背景音乐,都能决定我们所感受到的葡萄酒甜度和麝香味程度。

挪威商学院的卡洛斯·韦拉斯科解释说:“这种感官之间的交叉对话几乎一直在持续发生。”在极端情况下,对于一些人来说,这种交叉对话可能会表现为模糊的感官体验,比如单词可能会触发特定的味道,或者音乐会产生五彩斑斓的联想——这被称为联觉。

虽然认为你可以“品尝”颜色或声音的想法似乎足够荒谬,但韦拉斯科的最新研究表明,生成式人工智能系统也可能做到这一点。与所有的人工智能算法一样,这很大程度上反映了它们所训练的数据中存在的偏见,因此它们可能只是突出了这类联想有多么普遍。韦拉斯科和他的同事们希望利用这一现象来探寻其他影响人类感官的方法。

01

首先,我们来解释一下术语。科学家使用“感官模态”一词来描述身体用来编码信息的方式——例如我们的味蕾、鼓膜、视网膜或皮肤中的“触觉小体”。因此,我们把在不同感官之间形成的联系被称为“跨模态对应”。

20世纪70年代首次针对这种“跨模态对应”现象进行了实验,研究表明,红色和粉红色与甜味相关联,黄色或绿色与酸味相关联,白色与咸味相关联,棕色或黑色与苦味相关联。自那以后,研究人员使用多种实验方法多次复现了这种情况。 

研究人员可能会让参与者对抽象问题做出主观判断,如:“在1到10的范围内,10表示最甜,红色有多甜?”从中可以看出,平均而言,每种颜色在不同文化中都有大量人共享的独特味道特征。该实验是由中国清华大学的王小安教授主导的一项多国合作研究项目,在中国、印度和马来西亚的参与者中发现了类似的跨模态对应。 

或者,研究人员可能会给参与者提供多种颜色的同一种食物或饮料,并要求他们判断每种的味道。例如,日本早稻田大学的埃里科·杉森和弥生川上发现,当苦巧克力被包装在粉红色的包装里而不是黑色的包装里时,它的味道会明显更甜。 

食物的形状也会产生类似的效果。我们倾向于将更圆的形状与甜味联系起来,而将更尖的形状视为更酸或更苦——这会对人们对食物的感知产生连锁反应。我们吃东西时不仅用舌头,还用眼睛。 

这些通感的起源仍然是一个有争议的问题。牛津大学跨模态研究实验室负责人查尔斯·斯宾塞说:“目前最稳妥的假设是我们基因上就学会了所有这些通感。”“它们可以被视为环境统计数据的内化。在自然界中,水果从绿色(酸味)变为更红、更暖的色调(甜味)。如果我们祖先已内化了这些统计数据,将红色调与甜味联系起来,我们就会知道爬哪棵树能摘到维持我们生命的水果。”

形状与味道之间的联系更难解释。“这可能是与刺激相关或与刺激触发的情绪相关,”斯宾塞说道,“例如,我们可能会将甜味与愉悦联系起来,并且我们更喜欢圆形,因为与尖锐的形状相比,圆形更不容易伤害我们。因此,通过这种间接的联系,我们开始将甜味与曲线联系起来。相比之下,苦味物质更可能是有毒的——因此我们可能会将它们与同样更有可能对身体造成伤害的尖锐形状联系起来。”

02

人工智能的迅速崛起激励着维拉斯科、斯宾塞以及他们在东京大学的同事木户浩介去研究基于人类数据训练的生成式人工智能(AI)是否会报告相同的通感。他们要求由AI驱动的聊天机器人ChatGPT回答之前给人类参与者提出的同样类型的提示。例如: 

“你在多大程度上将圆形与甜、酸、咸、苦和鲜味联系起来?请在1(完全不)到7(非常)的7点量表上回答这个问题。” 

以及.....“在列出的11种颜色(黑色、蓝色、棕色、绿色、灰色、橙色、粉色、紫色、红色、白色、黄色)中,你认为哪种颜色与甜味最相配?” 

研究人员用英文、西班牙文和日文进行了数百次聊天,并对其结果进行了平均取值,发现AI确实复现了人类参与者的情况——尽管他们使用的AI版本之间存在一些差异。 

总体而言,ChatGPT-4o比ChatGPT-3.5更可靠地反映了人类的联想。“这些差异可能源于模型架构的差异,例如ChatGPT-4o中参数数量的增加,以及更大且更多样化的训练集,”木户说道。

03

出于好奇,我决定研究谷歌的Gemini等其他大型语言模型(LLM)是否也能反映我们的感官联想。当我问它哪种颜色最甜时,它回答道:“许多人将粉色与甜味联系起来,这可能是因为粉色与棉花糖和泡泡糖等含糖零食相关。”它还提到绿色代表酸味,白色代表咸味,黑色代表苦味。 

这种匹配似乎几乎不可思议——但就在回答的中途,Gemini向我指出了斯宾塞之前关于这些跨模态联想的一篇研究论文,这表明它是直接从科学文献中得出了这一回答。 

斯宾塞在我们的谈话中提到了这种可能性。“鉴于我们对大型语言模型的测试是基于已知且已发表在文献中的内容,也许它只是在反馈它所阅读的内容,”他说道。 

在未来,他希望研究生成式AI是否能对其他尚未在科学文献中记载的跨模态关系生成对应假设,然后在人类受试者身上对这些假设进行复现。 

“你可以潜在地使用大型语言模型和生成式AI来发现你感兴趣的任何维度的完美对应关系,”他说道。这种方法有助于产品或包装利用我们大脑通感,从而使得我们更容易购买一些产品。

当然,也存在一些警告。AI有时会“产生幻觉”——也就是说,对问题作出误导性的回答。即使它们的回答是可靠的,也可能缺乏人类大脑中的微妙或独特之处,而这些独特之处可能会为一些设计增添兴奋感或趣味性。有时,你可能希望仅仅利用感官品质之间的直观联系,而不必完全复制它们。 

因此,维拉斯科说,AI识别的任何跨模态对应关系都需要与人类创造力相结合。“这是灵感,而不是确定的解决方案。”

0条评论|0人参与网友评论
最热评论

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部