中科院声学所所长助理颜永红:从业人员都知道,从90年代开始,语音产业每五年就会火一次,每次都有新的特征涌现出来,资本开始进入,过几年就会退出。这次比以往高潮来讲更为真实,因为这次它的影响面,像谷歌和苹果带起的热潮,国内政府重视,中国移动重量级企业对这个行业的开始投入,确实这次高潮比以前力度大很多。这种时候我们还是需要一个比较清醒的头脑。
我们跟国际上的先行国家相比,我们在研究技术原创性,应用引领性等方面实际上我们还是存在一定的差距,我们虽然有很多有特色的东西,虽然我们已经很好了,这个时候我们理智看待行业,对行业长远健康发展更为重要。因为我们可以看一下像机器翻译领域,谷歌可以达到70多种语音的互译(数据不一定准确)。在这些数字的背后有更深层次的东西,如果看一下美国他是怎么发展起来,70年代开始政府非常系统地在引导研发,实际上我们知道的苹果的这个很热,他是美国军方政府支持项目的副产品,在民用上的使用。这些东西的背后,我在想我今天来的路上想,中国互联网企业就有做的非常成功,腾讯、百度、阿里,他们开始也跟美国学,最后找到一个跟国家结合一个办法。我们语音行业能不能做到这一条,这实际上是考验我们这个行业,无论领导还是从业人员智慧的地方。
我们国家在语音技术起步并不晚,国家从1958年开始中科院声学所开始研究,中国第一个做语音识别的单位,停止多年以后,10年左右,无论龙头企业科大讯飞推出的语音云,灵犀,互联网巨头们投入确确实实让普通用户、移动用户、其他方面用户都知道语音其实有用了。
但是我们要看到,虽然我们实际上是在不停推动,但差距还是存在的,2005年以前语音识别这个市场是百分之百被美国公司垄断。
我们现在前面的报告都讲了语音行业有那些应用,可以用语音地方很多,有人地方可以用语音,实际上对从业人员来讲,到底别人什么东西真正让用户能够愿意出钱来用这个服务的,即便在今天依旧是一个极大的挑战。人语音识别,是人几亿年发展的一个东西,是人诸多属性的一个方面,在这些里面,应用方面如果逻辑不完备的话,是否能发挥他的潜力,依旧是研究领域困扰大家的问题。
下面汇报一下中科院声学所在语音方面所做的工作,中科院声学所目前试验室,正研究员9个人,副研究员19个人;成立时5人,现总人数130个人。这是试验室的一些学术成果,这个试验室在2004年跟夏新工程师一起合作推出第一款嵌入式语音识别方案,2009年在诺亚舟的产品,这个技术在咱们国家运营商市场曾经占领23%的市场份额,2005年到2007年期间我们基本上把他赶出去。我们联手百度,在百度语音团队起步时我们跟他一起共同努力推出第一个语音服务。
前段时间跟阿里巴巴一起合作推出第一个电信级语音客服系统,如果昨天大家买东西的话你打电话就是我们双方做的事情在接,目前淘宝和支付宝完全用机器在接电话。
我们也是做了第一个通过咱们国家广电总局主管音质损伤音频技术,大家听中央台的技术就有我们的音频水印。我们在广电多媒体检索领域把多媒体的内容识别,然后相当于内容提供公司做拆条的工具,现在国内的前三大广电领域系统集成商是我们共同合作伙伴,语音识别核心技术是产品的一个标配。
在移动互联网方面我们跟国内诸多一些企业也是合作的,科学院更多专注与研究,我们中科院声学所旗下也有自己的企业,中科信力,我们是跟产业界朋友们一起探讨怎么把行业做起来,我们合作企业也是比较多的,我们自己本身并不面对最终用户。
作为行业一个从业近28年的老兵,我想有几个呼吁,一个呼吁领导加强国家基础研究,特别是交叉学科的投入,美国人做的很多东西非常好,看看他的历史怎么来的,就知道我们这里缺了一大块。第二个我呼吁产业界的朋友,特别是无论是我们像科大讯飞龙头企业,包括想做语音的这些企业们,大佬们用更大胸怀推动这个行业,这次浪潮会不会真的让企业成功现在下结论都很早,这个时候大家用更大一个胸怀形成一个良性公平的竞合关系对推动这个行业是非常重要的,这个行业从业人员并不多,语音每次火的时候领导很着急,企业领导压力很大,业绩压力大,底下员工大家互相挖,我们怎么样用更大胸怀把行业真正做起来,共创语音的明天。(计算机世界报记者赵海军整理)
重点报道领域:产业政策、地方经信委、高新区、经济技术开发区,大公司分公司总经理的成功故事。欢迎提供采访线索至2673111783@qq.com
阅读和此文章类似的: 全球云计算