您当前的位置: 首页 > 养生

国内智能语音技术发展趋势初探附国内知名的

2019-03-12 01:36:39

智能语音技术又名语音识别技术,它的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等,语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

(图一:语音交互是人机交互自然的方式)

国内智能语音技术的发展历程

我国语音识别研究工作起步于五十年代,但近年来发展很快,研究水平也从实验室逐步走向实用;从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。

清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。

中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。

语音识别技术分类

语音识别系统可以根据对输入语音的限制加以分类,从说话者与识别系统的相关性考虑可以将识别系统分为三类:一是特定人语音识别系统:仅考虑对于专人的话音进行识别;二是非特定人语音系统:识别的语音与人无关,通常要用大量不同人的语音数据库对识别系统进行学习;三是多人的识别系统:通常能识别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对要识别的那组人的语音进行训练。

探究国内语音技术未来的发展趋势

语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

(图二:语音技术应用领域广泛)

智能语音的技术一直呈现茁壮成长的欣欣之态,美国权威杂志《麻省理工科技评论》还将其评为2016年十大突破技术。随着智能语音与移动端、社会信息服务、络信息搜索等产业方向越来越好的融合步伐,智能语音成为人工智能领域“接地气”一族。

市场驱动下的语音技术:国内众多厂商借助语音技术为产品增光添彩

智能语音产业规模的大幅度提升除了是技术快速发展,突破了瓶颈之外,更重要的是离不开市场需求驱动。从智能语音现在落地到的应用领域就可知道,各行各业对智能语音的需求有多大。据统计,2013年智能语音的产业规模达33.7亿美元,同比增长38.1%,2014年同比增长35.3%,2015年规模达61.9亿美元。今年中国语音技术市场份额占世界12%,实现了很大的市场突破!

(图三:中国智能语音产业市场规模增长条形图)

除了日常使用,如上语音拨号、语音操控、语音查找,导航仪语音设置目的地,电子词典、MP3的语音搜索等功能,智能语音还多出现在智能家居、智能车载系统、智能安防以及人工智能等多领域。

据了解,智能语音技术对于很多创业型企业并非遥不可及,虽然他们没有核心的语音技术,但往往希望借助外部的技术团队,帮助自己实现某个有创意的定制化需求,以达到为产品增光添彩,满足市场的多样化需求,增强市场竞争力。“近,我们有一个做智能灯具的客户,他想设计一款可以用自然语音(普通话)进行交互的智能灯具,实现开关灯,调亮度和调色温等功能,但无奈自身的开发技术有限,无法实现这些功能,因为非常看好语音技术为灯具带来的市场影响力,遂愿意花很高的价钱将它们外包出去,快速开发出来抢占市场。类似于这样的客户在我们平台还有很多。”一家专注于智能硬件外包的平台快包工作人员介绍道。

中国的智能语音厂商动态:互联+智能语音推动产业发展

国内智能语音的高速发展,离不开互联的强势推动,近几年,BAT是中国智能语音市场活跃的企业之一。

百度在2014年从谷歌挖来了人工智能泰斗吴恩达,辅以重金做研发,在2016年斩获了中国语音产业13%的市场份额。

阿里的语音识别技术在2015年开始就已经渗透到客服所接听的每一个中去,应用的场景还包括有阿里的YunOS、虚拟客服阿里小蜜等。

腾讯AI团队自主研发出的语音技术,在2016年5月搭载腾讯云正式上线。

除了这三家互联龙头企业之外,据我爱方案了解,目前我国的语音技术厂商大致可分为三类:一类是传统语音技术厂商,包括像科大讯飞、小i机器人、捷通华声等它们拥有自己的核心智能语音芯片以及语音相关软件系统;第二类是互联厂商,包括百度、腾讯、搜狗等,普遍采用战略合作或者收购等方式,掌握智能语音技术,推广语音服务;第三类是创业企业,像云知声、思必驰、中科信利、中科模识等,它们专注于某些行业领域,比如汽车、家电,来推广自己的语音技术和产品。

(图四:国内主要智能语音厂商市场份额)

国内知名的语音技术厂商名录

一、科大讯飞

科大讯飞股份有限公司,前身安徽中科大讯飞信息科技有限公司,成立于1999年12月30日,2014年4月18日变更为科大讯飞股份有限公司,专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成。科大讯飞信息科技股份有限公司现任董事长兼总裁为刘庆峰先生,是一家专业从事智能语音及语音技术研究、软件及芯片产品开发、语音信息服务的骨干软件企业,主要股东包括:中国移动、中科大资产经营有限公司、上海广信、联想投资、盈富泰克等。在语音技术领域是基础研究时间长、资产规模、历届评测成绩、专业人才多及市场占有率的公司,其智能语音核心技术代表了世界的水平。

二、小i机器人

小i机器人成立于2001年,是全球的智能机器人技术提供和平台运营商,拥有全球的智能机器人云服务平台,其直接和间接服务的用户在全球超过2亿;小i机器人专注于智能机器人核心交互技术的研发,并在大量的商业化应用中推动了该技术的产业化进程;在自然语言处理、语义分析和理解、知识工程和智能大数据等方面,小i走在行业的前列,获得了多项国家发明专利授权,并参与国际和国内的智能人机交互标准建设。

三、捷通华声

北京捷通华声语音技术有限公司成立于2000年10月,是一家立足语音、手写识别等智能人机交互(简称:HCI)技术的研究与应用,全面发展电信增值服务的高新技术企业;2005年,捷通华声首批获得国家信息产业部颁发的“全国电信业务经营许可证”。小i机器人不但已经实现了智能人机交互(文本、语音等)的全渠道多媒体整合应用,而且凭借大数据、深度语义理解等前沿技术上的研究与积累,以及商用领域的不断拓展,小i机器人正朝着未来十亿级企业和用户规模的智能云服务平台迈进。

四、百度

百度语音搜索,基于强大的语音识别能力,支持通过语音命令快速发起搜索,让搜索更快捷、更智能,对比端的文本键盘输入,百度语音搜索是更自然的,符合移动设备的交互方式;在百度强大的人工智能技术支持下,语音搜索前景广阔;语音等现代搜索引擎要做的是连接人与信息及服务,它不仅会倾听,更懂得理解与思考,未来将更好地造福人类。

五、腾讯

当百度公司专注于语音技术服务,腾讯云技术团队联合AI团队,开放语音处理技术,推出智能语音服务,在语音处理基础功能上,结合云端能力,腾讯云智能语音服务支持云端+嵌入式,可以覆盖更多应用场景,满足各行业开发者的需求;这也是腾讯云继支付提速、公众号安全护航等动作后的又一重大举措。

六、搜狗

搜狗语音助手是一款智能语音对话软件,从本地生活信息、地图,到百科知识、便民工具查询,再到、图片等传统搜索内容,搜狗语音助手将这些都整合到自己的智能检索库中。用户可以通过语音——就像与朋友说话一样——轻松自然地向搜狗语音助手提问,眨眼之间便可得到的回答,不仅如此,他还能像一个私人助理一样为你管理生活日程,也能为你发短信、拨打,在你无聊的时候,还能与他聊聊天。

七、云知声

北京云知声信息技术有限公司,是专注于语音识别及语言处理技术的移动互联公司,拥有完全自主知识产权的世界的智能语音识别和语义理解技术,借助云计算平台和移动互联技术,云知声已推出了一系列语音识别和语义理解的中间件及服务云平台,为互联企业和用户提供专业的智能语音服务。北京云知声的核心技术团队来自国内外知名企业、高校和研究所,80%以上拥有博士学位,并具有超过十年的语音识别研发和应用经验。

八、思必驰

苏州思必驰信息科技有限公司是一家语音技术公司,2007年,思必驰创立在英国剑桥高新区,思必驰专注于将的系列智能语音技术应用于移动互联、智能设备、客户联络中心等行业。公司的中文名字是思必驰,思想必将驰骋,寓意着公司孤立自由的思想,以创新为本。同时这个名字还是英文单词Speech的音译,同样代表了公司立足智能语音技术行业的决心。思必驰总部设立于北京,并在苏州和上海设立了分公司和联合实验室,思必驰有近百人的产品和研发团队,

国内智能语音技术发展趋势初探附国内知名的

成员来自于百度、腾讯、阿里等知名互联公司,及微软、IBM等知名高科技公司,同时,公司与上海交大建立了联合实验室,并与剑桥大学、清华大学等知名科研机构有着战略研发合作。

九、中科信利

中科信利语音实验室于2002年在中国科学院知识创新工程的支持下成立,隶属于中国科学院声学研究所。同年入选中科院百人计划的颜永红博士加盟实验室,凝聚并形成了具有规模的核心研发团队,有副研究员以上的专职高级研究人员9人,助理研究员1人,硕士博士研究生近30名,主要研究人员都拥有在海外大学、研究机构和外企研究院的研发经验。主要研究方向包括:语音信号处理、语音识别、语种识别、说话人识别/确认(声纹识别/确认)、关键词检测、以音频为载体的信息掩蔽(水印)、目标音频检索、基于内容的音乐检索、目标人变声、数字化家庭等。

十、中科模识

北京中科模识科技有限公司是中国科学院自动化研究所为适应新时期国家和社会对智能语音处理技术与应用不断增长的需求,于2000年成立的高新技术企业,模识科技专业从事语音识别技术研究、产品开发与成果转化,为拥有自主知识产权的创新型企业。公司为中关村科技园区高新技术企业和软件企业,并通过ISO质量管理的论证。公司的主创人员主要由归国学者和模式识别国家重点实验室的骨干精英组成,他们既是国内模式识别行业领域的有权威的技术专家,又有丰富的企业管理和市场运作经验。(排名不分先后)

语音技术发展迅猛、前景可观,随着巨头级的企业纷纷花人力物力投入其中,相信在不久的将来,国内语音技术市场份额远不止12%,只要我们给他们一些耐心,多一些包容,国内厂商掌握语音核心技术,引领世界语音技术发展,指日可待。

推荐阅读
图文聚焦