再也不用学外语!?人工智能如何推倒文化间语言障碍

再也不用学外语!?人工智能如何推倒文化间语言障碍
2017年09月11日 09:31 凤凰文创

全文总计2231字,阅读时间大约为5分钟

语言是文化产业进行国际拓展中最大的障碍,如今,这堵横在不同文化间的“墙”在人工智能的推动下,正岌岌可危。

9月8日,谷歌在欧洲举行了开发者日活动,展示了“谷歌语音助手”的许多新功能,其中最重要的是谷歌助手的翻译模式。例如,用户可说:“OK,Google,当我西班牙语的翻译。”随后,谷歌助手就会把用户说的话翻译成西班牙语,直到要求停止。

而号称打败谷歌翻译的对手,本周也高调上线,来自德国的 DeepL,号称打造出了“世界上最精确、语言组织最自然的机器翻译系统”,已支持英德法西等 42 门欧洲语言。并宣布在盲测中,打败了谷歌翻译以及微软与 Facebook 的NMT(神经机器翻译)系统,挑衅意味十足。

现在人们已经习惯了日常生活中用智能翻译软件,但基于工业的智能语音和翻译服务,是一项全新的热点。因此人工智能深度嵌入产业底层架构和商业服务,开始于近两年席卷全球。在这波AI的热潮下,包括百度、腾讯、阿里、有道、科大讯飞在内,都在AI+语音产业展开布局、战火猛烈。

人工智能挑战传统翻译,AI+语音率先斩获民用市场

现在,人工智能+语音相关的民用产业的很大一部分重心转向了翻译,语言文字的生产和翻译在很久以前就是机器学习的一大障碍。早在上个世纪50年代,IBM就已经对机器翻译进行了深入的探索与研究,但直到90年代,这类翻译工具才进入大众的视野。

进化到现在,为应对市场对于精准翻译的需求,以Google为代表的一票科技企业已经推出了神经机器翻译(NMT)。神经机器翻译技术在翻译文本时让机器更关注整个句子而不是其中的一些成分,通过把这些成分用最自然的方式组合起来,从而得出最佳的翻译结果。当人工智能技术应用到这个过程中时,神经机器翻译就可以从其他已完成的翻译中分析学习它们的结构,学习它们在语序等细微问题上如何做出调整。

当前,神经机器翻译系统翻译出的文字有90%都有语法上的小错误,但这些错误不明显,不足以让受过教育的翻译者感到紧张。许多语言学家和翻译人员都可以松一口气了。但不可避免的是,随着神经机器翻译系统的进一步发展,技术性的内容,那些有着严格标准和术语使用规范的内容,可能更容易被机器完美地翻译出来,并且不需要太多后期的人工编辑。人工智能在产业上的巨大效应和对于人类一些职业的替代性作用已经开始爆发性显现。

智能语音市场规模达百万亿,高价值导致行业垄断严重

据工业和信息化部电子科技信息情报研究所数据显示,2012年以来,全球智能语音产业规模持续快速增长。2013年,全球智能语音产业规模整体达33.7亿美元,同比增长38.1%;2014年较2013年同比增长41.0%,产业规模大幅提升。预计到2017年,全球智能语音规模将达112.4亿美元。

但智能语音市场在带来高价值的同时,也将导致行业的垄断。从全球范围来看,仅有少数厂商在语音市场具有竞争力,一类是传统语音技术厂商,拥有长期技术和用户积累,如美国的Nuance公司,但近年逐渐衰落,而让位给互联网巨头。另一类是以IBM、微软、谷歌、苹果等为代表的IT巨头,凭借在互联网端的优势迅速抢占语音信息流入口。

早在2009年,Nuance公司占有全球语音识别市场约69%的市场份额。在2012年,Nuance的市场份额下降到62%,Nuance、谷歌、微软、苹果、IBM、科大讯飞五家企业占据市场份额超95%。2013年,Nuance市场份额下降到51%,而谷歌依靠其在互联网和移动互联网领域的优势,市场份额由16.9%上升至28%;苹果、微软、科大讯飞以4.7%、4.4%、4.3%的市场份额分列第三、第四、第五位。可见智能语音行业的寡头垄断特征十分明显。

此外,随着智能家居已从概念向商业化阶段发展,语音控制和交互将是智能家庭的一大趋势。根据市场研究公司Juniper发布的数据,2018年全球智能家居市场规模将达710亿美元。以苹果、三星、海尔为代表的消费电子厂商和以谷歌、小米、乐视等为代表的互联网企业开始纷纷推出智能家电产品,为智能家居市场打前站。而智能家居的发展也将带动智能语音服务的快速增长。

AI+语音技术产业链时代,商业创新如何实现?

随着人工智能时代来临,语音技术公司的春天又来了。围绕 AI 的公司战略如雨后春笋,智能语音技术的应用成为它们打开市场的首要选择,几乎每个月都会有数款语音交互机器人发布。除了硬件,语音服务平台也迅速被建立。而在这个产业领域中,在产业链的各个层级都有着商业创新的机会。

从产业链上游来看,芯片一直都是一个高度利润化的产业。在语音识别这一块,可以做做语音的处理芯片。比如iPhone使用的Cirrus Logic在语音处理这一块的算法做得非常好,它解决了语音降噪、方位识别上的关键问题。有了芯片作为载体,就可以基于传统芯片的商业模式去挣钱。Cirrus Logic 推出的 CS44130 可以为整个音频信号链提供芯片,包括模拟或、数字输入和扬声器喇叭输出之间的各个部分。它精小的设计可以大大简化产品的设计。

往产业链下游走,在芯片下游的语言服务模块也有赚钱的机会。如今的产业链分工是非常细的,很难再有像过去的飞利浦、西门子这样的大公司,核心的部件、全器件的研发,一直到最终的产品都是由一家公司来做。在分工很细的情况下,芯片公司不可能再去做一个产品,也很难再去做一个模块,中间其实需要的是一个做阵列的公司:把产品以一个模块的形式提供,同时不仅仅做一个 PCB 板把芯片放上去,而是把算法结合在里面,体现出附加值。

最后,语音终端产品也有赚钱的机会。比如类似亚马逊Echo这样的语音终端产品,以国内来讲目前京东和讯飞正在做。不过,真正有机会的创业公司是能够去开拓一个新的市场领域的。就智能语音音箱来说,这是一个长期存在的行业和产品。在这方面,创业公司往往拥有更大的机会,因为初创企业可以开辟新的产品品类。

文:王晗 编辑:轩辕镜

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部