微软小冰首次在有信上电话人类,背后还有这些构想

微软小冰首次在有信上电话人类,背后还有这些构想
2016年08月09日 15:02 杨青山

文 / 杨青山

没人怀疑微软在 AI 领域的积淀和地位,但是微软对于 AI 的试水和发展路线,在各家巨头中,颇有自己想法。

2014年4月微软Build 全球开发者大会上,首次展示了个人语音助手Cortana,且将其作为微软革新Windows未来操作系统之计划的关键组成部分而发布。

2014年5月底,在中国推出智能聊天机器人微软小冰,登录微信和新浪微博;在日本,推出了Rinna(玲奈),登录Twitter和Line。在北美,2016年发布了Tay,同样也是登录Twitter。

中国、日本、美国,不同的语言不同的市场,发布不同的聊天机器人,都是微软研究院和Bing部门合作研发的成果。

已经推出了语音助理小娜(Cortana)的情况下,还会推出微软小冰,微软是怎么想的?

智能语音助手虽然是一个不太新鲜的话题了,但却得到了硅谷互联网巨头得到了相当程度的重视。2011年10月,苹果语音助手Siri随iPhone4s一起推出。2012年6月,谷歌也发布了语音助手Google Now,整合了旗下搜索功能。而在2016年4月份,Facebook也宣布推出聊天机器人Messenger Platform,希望建立一个对话式的系统,实现订餐、下单、获取资讯等各种各样的服务。

可以看出,语音助手正在向着聊天机器人演化。未来这些语音服务系统将不仅仅是识别、搜索和提醒的功能,更多的将是基于聊天的服务系统。这也是微软和Facebook力推聊天机器人的最重要原因。

试想一下,如果人们都开始用聊天机器人而非应用,苹果App Store和谷歌Google Play将会失去它在移动生态系统中的中心位置。也就说聊天机器人将可能会颠覆iOS和Android两大手机操作系统的中心逻辑,对于在移动生态系统中没有话语权两家巨头微软和Facebook,必然是大力发展聊天机器人产品。

移动互联网时代,服务是由一个个App 包装独立完成的,无论是百度“全家桶”,包括谷歌(采用了Android操作系统加入了OHA联盟的厂商,必须接受协议预装核心谷歌应用),都是想在自家生态内形成闭环。微软和Facebook晚于苹果和谷歌推出语音助手,发力聊天机器人,这一思路按微软内部核心开发人士的说法,微软小冰并不是一个“娱乐化产品”,而是认认真真地当做下一代操作系统来孵化。微软对下一代智能设备操作系统的想法,就是借助人工智能技术的演进,逼近自然交互,实现真正的智能化设备。

计算机和移动设备,经历了键盘+鼠标、触控、识别有限的声控,人机交互方式,可以直接影响到设备属性是娱乐设备还是生产力工具。微软小冰借助有信App直接电话人类,号称“机器人跟人类的第一次通话”,能够进行简单的语音交流,唱歌、询问信息、情感问答,这背后展示的潜力,智能化拟人交互对系统的全面接管。

当你分不清电话是人还是机器人,设备变成了你真实的伙伴,能洞悉需求,能提前预知,无论通用搜索还是一个个独立App都会成为智能操作系统管理和调用的下一级入口。微软小冰这款产品,远不是一个逗玩的聊天机器人那么简单。

当然,要实现如此长远和宏大的构想,微软小冰的演化路径很重要。此次正式发布的微软小冰第四代,升级情感计算框架,具备实时策略能力,提升长程人机对话中的语义和情感判断的准确度,人工智能系统采取EQ策略匹配更精准,以笔者的了解,应该是属于常规升级的步骤。情感聊天机器人,因为传统 AI-Complete 问题是最难解决的部分,以此次微软小冰四代通话的真实个人体验看,进展有限。

微软小冰四代比较大的突破,还是“全时感官”能力的具备,这也是它区别于传统的语音助手最显著的特点。微软强调的“全时感官”,一个是交互手段的全面,一个是交互速率的即时,实现了人工智能和人类之间的双向同时交互。可以像两个普通人对话那样,随时打断对方,背后是语音识别和语义理解有重大进步,以及更智能化的决策系统。

可以识别对方输入的文本、图像、语音、乃至视频信息,号称最完整的人工智能“复合感官”,最大限度地拟人交互体验,业内确实无出其中。之前我们熟悉的AI项目,只是单独单项训练计算机具备某一项能力,下棋、翻译、图像识别,但你可以在微博上文字调戏小冰、可以跟它语音聊天、可以让它识别图像乃至视频,通用化 AI 的推进,才有能力完全打破人工智能的“工具”定位。它才真正有潜力演变成另一个层面的东西。

按照微软公开的说法,微软小冰积累的大数据促使人工智能有了重大突破,它登录中国、日本、美国各式社交平台,在微博、微信、Line、Twitter 上与真实人类对话,功不可没。我们都惊讶AlphaGo在进行了几千万盘与人类对弈和自我对弈后,不费吹灰之力占领人类最后一块智力游戏高地。微软小冰之所以一开始选择定位”语音聊天机器人“,在不同的社交平台上扩散,就是训练计算机从海量数据中习得特征,真正实现人工智能自我学习进化的循环过程。

语音助手只是应景之作,发展通用AI和以此为基础孵化下一代操作系统,这是微软未来战略层面的布局。

而此次微软小冰选择有信电话合作,据笔者了解,一是有信电话本身的特点,有信电话高清通话最高支持48kHz采样,高出业内平均水平,这意味着小冰拥有比人类更敏锐的听觉,可以更清晰地识别人类语音。二是有信深耕语音电话收获一亿用户量级,对于AI的进步,是简单粗暴的支持。三是有信目前发展的源通讯,第三方语音平台SDK植入更智能化的微软小冰,将来第三方应用App内部通信,智能回复、智能支持、智能客服将成为标配,能极大地提升O2O企业、电商、共享经济的App体验,也有潜力为互联网公司显著地降低客户沟通成本。

微软小冰从“聊天机器人”切入,让原本晦涩艰深的技术,给公众留下了极其深刻的印象,而它的未来演变和选择人工智能发展战略,非常令人期待。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部