捷通华声面向智能车载推出灵云远场语音交互解决方案

2016-05-17 09:14:48来源:威易网作者:

    灵云科技04月27日消息:近日,北京车展在京隆重开幕,智能语音交互作为一种安全、流畅、便捷的车载设备控制技术,成为本次车展最为亮丽的风景线。捷通华声长期为国内外汽车厂商等合作伙伴提供智能语音交互、智能图像等全方位人工智能服务。

灵云科技04月27日消息:近日,北京车展在京隆重开幕,智能语音交互作为一种安全、流畅、便捷的车载设备控制技术,成为本次车展最为亮丽的风景线。捷通华声长期为国内外汽车厂商等合作伙伴提供智能语音交互、智能图像等全方位人工智能服务,为了更进一步满足市场对智能车载语音交互技术的需求,捷通华声近期推出适应于车载环境的专用语音识别技术,并面向中国智能车载领域全面开放灵云远场语音交互解决方案。

灵云远场语音交互解决方案全面整合了捷通华声最新推出的语音唤醒、声源定向、远场降噪、回声消除、语音打断、语音纠错、多轮对话等实用化语音、信号处理技术,抗噪能力极强,即使在80km/h的车速下也能准确识别司机话语,保证语音交互的流畅自然,为国内广大智能终端设备厂商、解决方案提供商、软件开发商等行业伙伴提供灵云麦克风阵列、云+端语音交互、内容服务等软硬件一体的智能语音交互解决方案,打造“能听会说、能理解、会思考”的各种智能车机、智能后视镜、便携式导航仪、HUD等车载设备。

\

抗噪型灵云语音识别+麦克风阵列 轻松破解车内噪音干扰

      面对行车过程中的车外胎噪、风噪,车内空调声、引擎声等行车环境噪音,捷通华声灵云多麦克风阵列能精准拾取说话人的语音信号,抑制噪声和混响,抗噪型灵云语音识别技术,能对残余的车载噪音进行进一步处理,准确识别司机语音命令。

      多麦克风阵列能根据声音到达的时间差,准确计算出声源与阵列模块之间的角度和距离,实现对目标声源的定位与跟踪,并利用麦克风阵列的空域滤波特性,在目标说话人方向形成拾音波束,仅拾取波束的信号,抑制波束之外的噪声和混响(反射声),同时,通过回声消除技术,过滤掉音频设备发出的声音,让语音识别引擎获取的用户声音更为清晰纯净。
 

\
 

由于麦克风阵列会不可避免的拾取部分行车环境噪音,影响语音识别率,对此,捷通华声综合考虑车内物理结构和车速变化,对驾车过程中的车外胎噪、风噪,车内空调声、引擎声等车载环境噪音信息进行建模,并用大量的实际行车噪音数据进行训练,进一步优化语音识别引擎,推出了针对抗噪的深度学习算法和自适应车内噪音的声学模型,让灵云语音识别具备极强的抗噪性,轻松应对常见车载环境噪音。同时,该技术采用深度神经网络算法(DNN)算法,可在用户的使用过程中,通过利用积累的语音数据来训练、优化算法,不断提升语音识别率,让司机与车载设备的语音交互越来越流畅。

灵云远场语音交互解决方案 全面满足司机需求

      为了全面满足司机驾驶途中的各种实际需求,灵云远场语音交互解决方案在实现打电话、发短信、听音乐、地图导航、设备控制等众多语音控制的同时,为司机提供天气、新闻、故事、股票、火车、航班、餐饮等30多种云端信息与内容服务。

      在驾车过程中,司机只要说出唤醒词,如“小灵开机”,车载设备便会开启,并面向司机方向形成拾音波束。司机说“为我导航至天安门”,车载设备便会自动规划路线并进行导航,路上需要打电话时,司机可以说“给xx打电话”、“打电话给xx”,或者直接报出电话号码,电话便会自动拨出,当电话号码识别有误时,司机可通过多轮对话方便地进行纠错。打完电话,如果想听首歌放松一下,可以直接说“放首青花瓷”、“来首周杰伦的歌”,或者“播放周杰伦的青花瓷”,车载设备都能轻松识别;如果想了解最新信息,无论是天气、新闻,还是股票、航班信息,只要说出来,都可以从云端轻松获取;如果你想吹吹风、透透气,也无需亲自动手,只需说“开窗”,车窗便会自动落下,真正实现语音控制,把司机的眼睛和双手还给驾驶,为行车安全保驾护航。

\

除此之外,灵云远场语音交互解决方案具备独特的优点:语音识别方面,捷通华声通过用怠速、中速、高速、开窗、关窗以及空调弱风、强风等各种驾驶状况下的海量真实录音数据对ASR引擎经行训练优化,让灵云语音识别技术能够轻松应对各种行车环境噪音,语音识别正确率和实时率已达行业领先水平;语音合成方面,灵云语音合成提供男声、女声、可爱童声等多种音色供用户选择,满足不同用户的个性化需求。同时,捷通华声充分考虑目前的网络覆盖状况,为用户提供本地与云端相结合的语音交互服务,即使汽车行驶在没有网络的偏远地区,也能使用语音交互来轻松控制车载设备。

捷通华声坚持合作共赢 与广大合作伙伴共享产业机遇

       灵云远场语音交互技术源自于捷通华声于2011年推出的首个全方位人工智能开放平台——灵云平台(hcicloud.com),灵云平台面向产业全面开放,并以“云+端”方式,为产业界提供语音合成、语音识别、语义理解、机器翻译、OCR、手写识别、人脸识别、声纹识别、指纹识别等全方位人工智能能力。

       通过完美整合灵云语音识别、语音合成、语义理解等核心技术以及灵云多麦克风阵列,灵云远场语音交互解决方案有效克服了噪音干扰,彻底打破智能车载设备应用语音交互技术的产业瓶颈,为国内广大智能车载设备厂商、解决方案提供商、软件开发商等行业伙伴提供麦克风阵列、云+端语音交互、内容服务等软硬件一体的智能语音交互解决方案。捷通华声始终坚持“合作共赢”的发展理念,坚持不与合作伙伴争利,通过与合作伙伴精诚合作,共同推动智能语音交互在中国智能车载领域的普及化应用。

      未来发展,捷通华声将继续以清华大学人工智能研究力量为依托,更加专注智能语音等人工智能技术研究与产业化的推广与应用,通过与产业内合作伙伴的精诚合作,共同推动中国智能车载设备全面服务社会大众,共同加快智能化生活时代到来的步伐!

关键词:捷通华声