2013年8月22日百度世界大会上,百度宣布语音识别技术及能力全面开放。此举为开发者提供了多层次的语音接口,将催生这一领域的蓬勃发展。在百度的引领下,围绕语音识别的全新体系和大数据生态将在不久的未来初露峥嵘。
过去的一年时间里,语音交互类应用并未像触控、手势识别等一样得到广泛的普及和应用,根本的原因有两个:一是语音识别准确率有待提升,尤其是技术对不同语言的支持,存在较大的差别;二是语音识别技术门槛较高,有一定的授权费用,阻碍了技术在应用端的落地。种种难题使得国内开发者在语音识别领域步履维艰,只有百度、腾讯等巨头互联网公司在相关的研发方面有所建树。
近一年来,百度在语音识别领域不断取得突破性进展,早已确立了其行业领先的地位,2013年百度世界大会上语音识别技术及能力的开放,更是实现了百度从“行业领跑者”到“生态构建者”的转型。
突破语音识别的瓶颈
百度云语音技术负责人贾磊在百度世界大会上表示,百度语音识别技术、引擎在识别准确率上获得了突破性进展,运用深度神经网络(DNN:Deep Neural Network)技术和自然语言处理技术NLP,使语音技术准确率提升了25%,用户体验得到大幅度优化。除了降低了错误率,百度语音助手在速度上也有大幅提升。不考虑网络环境,识别和响应速度提高了30%。
百度语音助手团队获得2013年百度Summer Party最高奖
目前,DNN技术已成为新一代语音识别的“主导者”。正因为这一点,百度语音助手开发团队在今年的百度最高奖角逐中脱颖而出,打破了该奖项始终被商业营销产品“垄断”的惯例。
三个层次,全面开放
与同类语音识别技术以授权费方式获取收入的传统方式不同,百度将面向开发者无条件开放整个语音生态系统。
而语音生态系统的开放包括三个层次,一是最底层的语音识别技术API的开放,囊括了合成技术、理解技术、认证技术、指纹技术等,开发者可以调用API接口实现语音识别功能;二是百度语音助手SDK,提供开发工具包,实际上是对语音识别标准化服务进行封装,识别结果做关键词抽取,搜索结果进行结构化数据返回,最终对接服务和应用。这一点是对应用开发者最具诱惑力的;第三点则是面向能力弱的开发者,百度语音助手直接安装在硬件上即可。
底层语音识别API,只有实力强的开发者具备。相比,第二层所释放的能量会更大,因为涵盖的范围更广泛,周边信息分类查询和导航功能,公交路线查询和导航,到站提醒、自动报站、盲人步行路线自定义、管理和导航,以及外部的旅游、餐饮、购物等几乎能想象到的场景,都可以封装成模块、组件,让开发者轻松调取,百度语音技术开放的原则,也从一个技术、工具真正过渡到包罗万象的语音识别应用生态,未来会接入更多的第三方应用,实现能够容纳从衣食住行到人的生活方方面面真正的助手。
自流量竞争升级到平台竞争开始,小程序也成为互联网巨头战略布局的重点。在此背景下,各具特色的小程序开始出现。11月25日,百度披露智能小程序月活..
网站作为企业在互联网上最直观的展示名片,已经被越来越多的企业接受和推广。就连众多传统企业、政府机关、事业单位等,也一并被时代的浪潮冲到了线..
随着智能手机、ipad等智能移动设备的普及,推动了网站风格样式的更新迭代。为解决PC端和移动端不同访客的用户体验问题,众多的建站产品供应商分别提..
输入您的电话号码,点击通话,稍后您将接到我们的电话,该通话对您 完全免费 ,请放心接听!
恭喜您!
抽到 竞网建站
发出的红包