语言和语音是人类获得的第一种通讯手段,也是人类进化的主要动力之一。因此,语音识别一直是计算机领域的圣杯,人们希望语音激活电脑,以获得信息、建议、交易等等,但是过去语音识别一直更多是幻想而非现实。

现在,语音的时代终于到来了,因为深度神经网络等人工智能技术的进步,以及图形处理单元(GPU)硬件的成熟,使得通过大量语音数据来训练语音引擎达到更高精度成为可能。

语音识别在印度可能尤为重要,早在《摩柯婆罗多》时代印度就一直是一个口头社会,信息一直是靠口耳相传,没有使用电脑打字搜索的历史,个人电脑推动了在线革命:文盲、多语言都意味着除了文字还需要有其他与数字世界互动的方式。廉价的智能手机和数据流量让印度在移动时代发展迅速,手机正是作为语音交互的完美载体。

2017年,印度30%的搜索是用语音发起的。印地语搜索一年内增长了400%,这证明了人们对于当地语言的在线工具和内容有着巨大的需求。

认识到语音技术在印度的巨大潜力,全球最重要的语音研究会议——Interspeech于今年9月首次在印度召开,主题就是新兴市场多语言社会的语言研究,数百名研究人员展示了他们对深度神经网络、激活唤醒功能和超参数模型研究获得的进展。印度众多的语言、方言、口音是研究人员挑战语音识别的理想试验场。无论是百度还是谷歌,或者脸书和微软都认为本地语言的语音识别对于触达另外的3亿使用其他语言印度人的重要性,亚马逊和沃尔玛等商业巨头已经认识到要发掘出印度市场的潜力,仅仅针对英语水平最高的那10%的印度人是远远不够的。

使用当地语言的印度读者才是真正的市场,而通向多语种印度的竞赛已经开始,上个月Flipkart收购了Liv.ai,一个语音技术领域的初创企业要叫板亚马逊的Alexa,亚马逊上周发布了一个印地语网站,谷歌和微软也正式推出了自己的印度语项目。不管怎样,印度消费者都将是这场竞争的赢家,印度有着丰富的多样性用户,将成为研究人员、企业家的温室,资本也将协助共同打造一个全球语音技术的巨头和语音互联网。【环球网科技报道 记者 张阳】

推荐内容

热点新闻