阿里AI布局“一小步”:这不是智能音箱

阿里AI布局“一小步”:这不是智能音箱
2017年07月07日 19:20 懂懂笔记

“你可以说它是一款智能音箱,但是了解得越多,你越会发现,这绝不仅仅是一个智能音箱。”阿里人工智能实验室(A.I. Labs)负责人浅雪在7月5日“天猫精灵X1”发布现场,着重强调了这一句。

当天正式发布的天猫精灵X1,在一周前就已经被嗅觉灵敏的外媒曝光,文章中还着重强调了这是一款中文语音交互系统,并暗示这是阿里巴巴在智能家庭入口迎击Ehco的一道武器。

而外媒曝光的同一天,马云正好出息天津“世界智能大会”,尽管当天满脸疲惫,但是当马云说到“现在对人工智能这个词一听就生气”时,声音却明显大了很多。他所谓的生气,是对智能前面冠以人工一词“感到可笑”,并描述了自己对AI内涵的看法。

“人类生命质量会因为智能时代的到来,具有更高的水平。以前的工业革命,是让人变得更像是机器;而未来的数据化和智能化,会让机器越来越像机器,而让人活得越来越像人。”马云同时强调,面对智能化时代,现在一切都像是万米长跑才刚刚开始。“我们不要刚跑几十米就去找身边的竞争对手是谁?你要跑了3000米以后,再去看看自己的对手是谁?要看看前面更远的谷歌、IBM跑到哪里了。”

不仅仅是跟随

尽管马云当天没有提到过一句关于阿里巴巴未来在智能家庭场景下的战略和构想,但是他为几天后阿里首款智能语音终端发布留下了潜台词:让人活得更像人;真正的对手是已经领跑的谷歌和亚马逊。

很显然,当7月5日浅雪如数家珍般悉数天猫精灵X1强大有趣的功能时,潜台词同样是用户体验和完备的生态体系:“语言应该是人与另外一种智能进行交流的主要方式。”未来这种智能交互将会让使用者的体验更自然、方便、简单和愉悦;而通过云端一体化的AliGenie引擎的打磨,先将电商应用融入到使用者的购物场景中,未来再与其他生态伙伴共同打造更广泛的应用场景。

有舆论曾经在天猫精灵X1发布后提出,阿里巴巴在支付、电商、云平台和大数据方面已经对标亚马逊、谷歌这样的企业,没必要再去做一个类似的智能音箱,亦步亦趋跟在别人身后。

实际上,从马云在世界智能大会上的发言,再到浅雪在发布会上对于这款产品的描述,我们能够看到,如果只是把它当做一款硬件产品,那似乎是在效仿别人;但是如果把它放到阿里“NASA”计划中来分析,它确实已经不是简单的一个硬件产品,而是阿里希望将技术运用到整个生态体系中的战术,即通过良好的AI技术、开放的平台以及生态协同优势,让大多数人能够愉悦、实惠地去使用。

如果说智能语音交互是现阶段人与AI最好的交流方式,没有人会质疑。而国际市场已经有亚马逊Echo、谷歌Home和苹果HomePod等强者面世,国内腾讯云“小微”、百度“小鱼在家”以及京东“叮咚”也都先后亮相,那么阿里的AliGenie+天猫精灵的机会在哪里?

从声纹和语义切入

回到阿里“NASA”的核心,一切还是以掌握核心技术为核心。马云曾强调,“nasa计划将是面向机器学习、芯片、IoT、操作系统、生物识别等核心技术,要组建全新团队、建立崭新机制,全力以赴。要为解决10年、20年后的困难去储备核心科技。”

在阿里三大智能事业部中,浅雪负责的A.I. Labs肩负着让NASA的AI应用在To C市场普及的责任。目前国内外同行都在推动相关的产品,天猫精灵能否成功,关键是如何给使用者最佳的使用体验。

语言作为智慧生物最为主要的交流方式,其方便性和易用性成为目前智能家庭终端的“标配”。既然整个市场都已经迈入了智能语音交互时代,那么迈出第一步的AliGenie+天猫精灵,必须要有让使用者在交互方面获得独特的感受。

浅雪表示,AliGenie目前对用户的声纹识别,能够做到专人专用和千人千面。她在和自媒体达人王自如的远程互动中,展示了天猫精灵对于声纹的识别能力,比如能够对王自如的声音进行识别和确认,并且根据识别后的结果向其进行了个性化内容(歌曲、电影等)的设定和推荐。

更重要的是:另外当王自如发出语音购物的要求后,还通过声纹鉴别真伪,保证购物时的安全性和私密性。浅雪介绍,这种通过声纹购物的功能是首个实现商用化的声纹购物系统,而通过声纹购功能,用户未来还可以应用到更多的支付场景中。

除了声纹识别,浅雪也指出,中文语音交互的难点更在于语义理解。她以提问“西藏天气如何”,得到关于拉萨的实时气象预报这个例子,强调目前语义理解引擎对于天气预报已经能够明白超过780种的中文提问方式。“这个系统兼容了20个领域的自然语义理解。而且我们的引擎针对于用户常用的天气、定时、休闲、娱乐、家点控制,生活助手等很多方面都进行了专门的优化。”

个体进化和生态进化

通过深度机器学习以及不断地训练,AliGenie+天猫精灵作为一个消费级产品,在软硬一体结合程度,语音语义的能力和交互易用性等方面都在进行突破。

浅雪最后强调,阿里更为看重语音助手高度可扩展性的特点,作为一个具备进化能力的智能化设备,随着开发者的入驻,天猫精灵X1能够实现的功能还将不断地增加。

实际上,业界对于真正意义上AI都有共识,即语义交互加上学习理解能力。简单的语音识别功能,势必在将来AI入口的争夺中失去意义。浅雪总结天猫精灵X1的三大AI能力,分别是理解、执行和进化。我们也认为,对于阿里的NASA来说,未来不断进化中的“智慧终端群体”,才是最具有威力的“导弹”。

这样说的原因是,这个“进化”未来不仅仅是来自于产品本身经过大数据和AI技术的训练、实践、进化。它还包括了每个终端产品+云端智能引擎与阿里周边生态的共同进化。从当天发布的阿里精灵开放平台来看,其将领先的技术与商业形态、生态合作伙伴紧密结合,直接面向商用落地的战术已经十分明显。

将AI融入阿里 DT 大商业体系中,配合云计算、大数据强化阿里的电商物流甚至物联网体系如果被视为“登月”,那么这个迷你的天猫精灵,则是很有意义的“一小步”。

懂懂笔记

懂懂工作室,成立于2016年。

冷眼旁观,麻辣点评,深入分析,帮助你用新的视角了解快速变化的产业。

创始人懂懂于2014年、2015年分别参与了《微信思维》、《微信力量》两本畅销书的撰写。于2016-2017年独立撰写《小米生态链战地笔记》。

【懂懂笔记】是全平台自媒体,团队原创内容发布在微信公号、百家号、新浪创世纪、网易、雪球、企鹅号、界面、今日头条、一点资讯、蓝鲸、UC头条、北京时间、虎嗅、钛媒体等十几个科技类主流平台。

END

往期精彩内容推荐

无论接盘侠是谁 易到“坡起”依旧难见动力

共享单车加紧攻城 城市已经气喘吁吁

携程、饿了么怼上美团:不关乎真理,只因为利益

张老板,比起排队的人群,我更想在销量榜上看到你

【直播江湖素描之四】ME直播:早退的迟到者

【直播江湖素描之三】自带IP未能带红熊猫直播 移情泛娱乐仍难扭转颓势

【直播江湖素描之二】花椒直播:富二代的努力与挣扎

【直播江湖素描之一】映客:崛起、式微、卖身,“孤胆英雄”折射直播战事巨变

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部