华体会官网_作为搜狗语音交互补充的唇语识别发展到哪一步了

作者:华体会官网发布时间:2021-03-09 00:11

本文摘要:另外,搜索狗的唇语识别还可以为听力障碍、心理障碍者等服务。综上所述,陈伟回答说,目前搜索狗唇语识别主要应用于两个场景:一是在大多数语言场景下,相机的覆盖率低于麦克风,但通过相机获得的图像数据主要用于监控非常简单和不道德的场景,很难在安全等场景中准确理解图中的人物在说什么,但通过嘴唇识别技术可以通过嘴唇的动作提供大量内容信息。其次,嘴唇识别可以作为辅助技术,提高语音识别技术现阶段的准确性。

华体会官网

另外,搜索狗的唇语识别还可以为听力障碍、心理障碍者等服务。综上所述,陈伟回答说,目前搜索狗唇语识别主要应用于两个场景:一是在大多数语言场景下,相机的覆盖率低于麦克风,但通过相机获得的图像数据主要用于监控非常简单和不道德的场景,很难在安全等场景中准确理解图中的人物在说什么,但通过嘴唇识别技术可以通过嘴唇的动作提供大量内容信息。其次,嘴唇识别可以作为辅助技术,提高语音识别技术现阶段的准确性。搜狗唇语识别技术目前对外开放的口语测试水平可超过50%-60%的精度,限定版场景可超过90%。

二、发展情况与难题相比,使用传统模型研究唇语识别技术的英国东英吉利大学,搜索犬自由选择使用深度自学的方式,主要包括:一、使用了多少数据二、算法复杂度有多低储藏能力有多强三、场景有多强第一,陈伟回答说,语音对话精度低的问题还没有解决。相当大的原因是语音噪音问题无法解决问题,再次加入到安静的场景中,精度可以提高到97%的高度。与近场的语音问答过程相同,但这种理想状态很难构筑。

为了解决问题,陈伟明确提出了两种方法:一种是通过硬件方式,例如团队实现的麦克风阵列,通过加强语音信号,切断噪音,提高语音识别的精度。其次,绕过噪音,可动性地添加多模式信息,即唇语识别加上视觉信息,现在的人工智能多是机器模仿人,但弱的人工智能很难打破人类。

华体会官网

也就是说,只看嘴唇的动作,不是非常明显的特征,而是依赖上下语言的信息。另外,陈伟对普通话有4个调整,但英语没有征集。

英语的基本发音单元在50个左右,中文如何缝合声韵母,详细建模至少在200个左右,发音单元之间有很大差异。仅次于的难题是一般化能力的训练。

陈伟以谷歌为例,谷歌的一般化是基于2010年至2016年新闻采访训练集整体的数据,在开集训练中确保精度高。例如,搜索犬早期对新闻广播主持人的一般训练,其精度平均在70%以上。陈伟回答说,在对外开放口语测试水平的基础上,基本上可以确保50%-60%的正确率,但在横向场景下,声音相对收敛过多,正确率可以比较提高。例如,在车载和智能家庭场景下。

关于唇语识别是否与用户隐私安全性无关,陈伟回答说,目前技术发展状态还没到这个阶段,搜索犬正在探索唇语识别与什么样的明确需要融合场景。原始文章允许禁止发布。下一篇文章发表了注意事项。


本文关键词:华,体会,官网,作为,搜狗,语音,交互,华体会官网,补充,的

本文来源:华体会官网-www.funporo.com