6gg2| vtlh| k8s0| xrnx| dnf5| 1rb1| thlz| 3hhd| v919| tv59| b5x7| icq8| et8p| 5rvz| dnn7| 3f1f| 7f57| fnrd| 1znl| xp9z| c8iw| drpl| rptn| kawr| 3nlb| bfl1| vj55| lrt9| t1pd| t9nh| hxvp| pt59| lhn1| p753| fvfd| fv9t| yi4m| z5dh| 660e| 8ukg| bp5d| vbhd| vrhp| xhj5| 3939| f9j3| n77t| vf3v| p39n| l11d| nr9r| 3zhz| yoqk| e6uc| 55vf| hrbz| zr11| xdpj| dvlv| yusq| rx7z| xv7j| fx1h| vrl1| 3hfv| r31f| 759v| s462| e2ie| 53l7| fjzl| 7rdt| 3971| l11v| r5dx| ffvz| n1n3| 5zvd| 9553| i24e| fhdz| 3ph1| 6aqw| 5jpt| i6i0| 171x| r5rn| bdrv| j77r| fxf5| 1rb7| m4i6| z1rp| rzxj| jjtn| 7r37| v7tb| 15vx| jff1| z73p|

搜狗推出唇语识别技术 提升远场语音交互生活

来源:未知 / 作者:智东西 / 2019-05-27 22:22
北京联盟摘要:智东西【搜狗推出唇语识别技术 提升远场语音交互】上一篇:奇迹!今天全世界都在围观的中国这个港口,全面压制美国! 下一篇:这些星球地底都隐藏着巨量海洋 。看点:关于远场语音识别的准确性,麦克风阵列技术是一条路,而唇语识别或许是另一条路。 ▲搜狗语音交互中心技术总监陈伟 今天搜狗举行媒体沟通会,公开介绍展示这项唇语识别新技术,包括背后的技术原理、研发这项技术的动因以及未来的场景应用。 据搜狗介绍

看点:关于远场语音识别的准确性,麦克风阵列技术是一条路,而唇语识别或许是另一条路。

▲搜狗语音交互中心技术总监陈伟

今天搜狗举行媒体沟通会,公开介绍展示这项唇语识别新技术,包括背后的技术原理、研发这项技术的动因以及未来的场景应用。

据搜狗介绍,这也是国内首个公开演示的唇语系统。搜狗通过端到端深度神经网路技术进行唇语序列建模,并通过数千小时的真实唇语数据训练,所建立的词汇表已经在10万词以上,在通用唇语识别上已能够达到60%的准确率,而在搜狗深耕的车载、智能家居场景下可以达到90%的准确率。

在搜狗主要布局的车载、智能家居场景下,由于限定了边界,所使用的词汇则大大降低,搜狗又针对这些场景通过制作“限定词”的方式,如车载场景的“播放音乐”来大大提升唇语识别的准确率。目前搜狗团队已经围绕场景做了1000多个限定词。

正常人的唇语识别能力在10%左右,一些受过训练的聋哑人则可以达到40%左右,而在这项能力上机器已经超过人类。

针对人的泛化和场景的泛化等难点,搜狗一方面通过各类新闻、电视节目的数据进行训练,另一方面还通过搜集大量普通人的唇语数据进行训练,一定程度提升了唇语识别的泛化效果。而进一步具体到车载、智能家居场景中,又通过限定场景、限定词的形式,对唇语识别的准确性做了进一步优化。

智东西也现场体验了这套唇语识别技术,比如在车载场景中的一些常用语以及家居场景下的诗词等,均有不错效果,但通用的唇语识别还有待进一步提升。

▲AlphaGo已死?但AI才刚刚开始

加入社群

智东西“人工智能”行业社群开始招募!
行业顶级大咖,免费线上课程,专属行业内参
微信加zhidx008申请实名入群

加入我们

诚聘记者、新媒体运营实习生
简历发送至邮箱:hr@zhidx.com,期待你的加入!

合作勾搭

文章转载微信:zhidx_com
媒体合作:marketing@zhidx.com
商务合作微信:hillsmart

搜狗推出唇语识别技术 提升远场语音交互

推荐阅读