转自灵云平台,灵云科技12月25日消息:最近一段时间,捷通华声在清华大学科技力量的支持下,以“眼见为实”的新颖发布方式,旋风般相继推出灵云远场语音识别、语音唤醒、声源定向等关键技术,引发了产业界的广泛关注。12月16日捷通华声宣布面向车载、家居、家电、机器人等领域推出完整的灵云远场语音识别解决方案。
灵云远场语音识别解决方案全面整合了最新灵云远场语音识别、语音唤醒、声源定向、降噪、回声消除、端点检测等实用化语音、信号处理技术,是迄今为止国内市场上推出的最完整、实用化程度最高的远场智能语音交互解决方案。灵云远场语音识别解决方案的推出,彻底打破了车载、家居、家电等各种设备应用自然语音交互技术的产业瓶颈,让每个人都能实现通过话语轻松操作各种设备的科幻梦想,全力推动智能语音交互在车载、家居、机器人等领域进入实用化阶段,这也标志着智能化生活从此距离中国亿万家庭不再遥远!
灵云远场语音识别 开启智能生活新时代
很长一段时间以来,国内外语音技术公司都在努力开拓智能终端设备市场,但智能终端设备在很多场景下因语音交互体验不如人意而难以满足市场的需求,今年春节期间风靡媒体的山东大哥开车应用语音打电话的视频,就是一个语音识别在车载噪音情况下无法实现准确语音识别的典型案例。车载、家居等环境下语音识别准确率低,主要原因还是因为语音识别受限于不同场景中的背景噪音、回声、混响等多重复杂因素,进而造成必须要近距离对讲而且识别率低的明显痛点,远场语音识别效果也因此成为制约语音识别技术在各种终端设备中应用的瓶颈。
捷通华声顺应产业的强烈需求,在清华大学的鼎力支持下,凭借多年潜心研究与市场积累,通过与华为、小米、乐视、海尔、长安、吉利、比亚迪、众鸿、航盛、日产、现代、新松、科沃斯等众多智能家居、家电、车载、机器人厂商的设备与技术的磨合,终于推出了全面整合语音识别、语音唤醒、声源定向、降噪、回声消除、端点检测等技术的灵云远场语音交互解决方案,并在实际应用中取得了非常好的效果。
在电视等家电设备的实际应用中,首先通过遥控器或者电视机中麦克风,由灵云语音唤醒“叫醒”电视机,当电视机被叫醒,灵云声源定向技术将指令麦克风始终指向说话人,减少外界噪音的录入,并对获取到的声音进行降噪及回声消除的处理,使获取到的声音清晰纯净;当说话人停止说话时,灵云端点检测技术将自动停止语音收集,所获取的清晰语音通过灵云语音识别转换成准确指令,实现语音操作。例如,当电视机处于待机状态时,对着遥控器或者电视机讲一声“小灵,打开电视”,电视机就会立即启动并开始播放节目,此时,电视所播放的节目声音会与语音操控指令发生冲突,而有了灵云回声消除技术,电视节目声音将自动被“屏蔽”,麦克风只接收说话人的语音命令,因此如果想换频道,只要再讲一声“我想看某某台”,电视就会自动切换到所要看的频道。
可以想象,基于灵云远场语音识别技术解决方案,用户在以家庭为单位的活动范围内,几乎可以通过语音轻松操控家里的电视、空调、冰箱等所有设备,让电影中的语音智能化生活变成现实。
在智能车载领域,灵云远场语音识别技术解决方案一样可以大显身手。当汽车在路上行驶,司机想通过语音控制打电话、听音乐时,无论是汽车行驶过程中产生的胎噪,还是车外噪音都会严重影响语音识别准确率,而灵云降噪技术通过对汽车内外环境噪音进行处理,能够准确识别司机的语音命令,从而帮助司机实现对车载智能终端的语音控制,可以轻松通过语音命令打电话、发信息,也可以自动接听电话、通过语音播报收听手机短信;如果想缓解一下驾驶疲劳,只要随口说出想听的音乐、歌曲,电台频道就可以完成操作,而不需要一手把握方向盘,一手高举手机,或者“手忙脚乱”的一手把握方向盘,一手操作选台按钮“找啊找”。据交通事故分析统计,相当多的交通事故原因都是由于司机开车过程中接听电话、或因操作车内各种设备分散注意力所造成的,灵云远场语音交互技术解决方案能够帮助司机专心驾驶,保证行车安全。
伴随近一两年机器人产业的高速成长,大众对机器人走进日常生活充满幻想与期待,虽然机器人制造水平相比过去有非常大的进步,机器人生产成本的降低也能够让更多机器人走进大众工作、生活场景,但实际上与家电、车载设备语音控制不同,机器人将面对更加复杂多样的声音环境,因此,机器人能否与人轻松、准确进行语音交流将决定机器人的实用化程度。灵云远场语音识别解决方案通过与国内机器人厂商的合作,语音交流效果已得到了很好的验证,国内有一家已经引进机器人并安排在营业大厅的金融客户,一直为语音识别效果不佳而感到“痛苦”,在体验到灵云远场语音识别技术之后,决定采用灵云远场识别技术解决方案对引进机器人进行重新设计。
捷通华声在此次推出灵云远场语音识别解决方案的同时,向产业界开放了灵云内容平台(hcicloud.com),人们可以通过与各种设备的语音交互,轻松并免费获取灵云内容平台所提供的天气、交通、列车、航班、音乐、视频、餐饮等日常生活常用的30多种信息与内容服务,使应用效果与体验更加丰富多彩。
相信随着车载、家电、家居、机器人等智能终端设备的普及,灵云远场语音交互解决方案将会得到更广泛的应用,一个曾经充满神奇与幻想的智能生活时代,从此距离我们将不再遥远!
灵云平台坚持合作共赢 与产业界携手共创未来
灵云平台(hcicloud.com)是捷通华声于2011年推出的首个全方位人工智能开放平台。历经四年发展,已成为国内提供人工智能能力最多、服务用户最广的人工智能开放平台。灵云平台自推出以来面向产业全面开放,包括个人开发者在内的所有合作伙伴,都可以通过灵云平台获取智能语音、智能图像、智能语义、生物特征等技术能力。
2014年,为让国内车载、家居、家电、机器人等智能终端设备厂商、集成商、开发商更方便地使用灵云平台(hcicloud.com)全方位人工智能能力,捷通华声推出了企业级开发商专用的灵云智能终端交互方案:灵云种子。灵云种子全面整合了灵云平台多项人工智能技术能力,包括灵云语音识别、语音合成、语义理解、声纹识别、人脸识别、指纹识别、光学字符识别等能力,并为开发商提供简单易用的开发接口。开发商通过应用灵云种子,可以轻松实现智能语音交互、语音唤醒、语音导航、文字与证照图像识别、声纹解锁、人脸识别等多种人机交互功能,全方位、多角度满足家居、车载、家电、机器人对人工智能技术能力多样化的市场需求。
一花开放不是春,捷通华声将坚持 “合作共赢”的发展理念,与广大合作伙伴共同分享人工智能产业机遇,共同创建良好的人工智能产业生态。为更好服务全国智能终端设备合作伙伴,捷通华声将进一步加快在全国各地建立分公司与办事处的进程,比如在中国华南地区,智能车载、智能家居、机器人开发与生产厂商云集,并拥有创新力强、科技水平高等独特优势。为做好合作伙伴的技术支持,2015年捷通华声相继在深圳、厦门等地成立了分公司,为合作伙伴提供更及时、更完善的技术支持。
未来发展,捷通华声将继续以清华大学人工智能研究力量为依托,更加专注智能语音等人工智能技术研究与产业化的推广与应用,通过与产业内合作伙伴的精诚合作,共同推动中国智能终端设备全面服务社会大众,共同加快智能化生活时代到来的步伐!