LiveTranscribe是一款谷歌为聋人和听力障碍者推出的新的无障碍服务手机app。livetranscribeapp使用谷歌最先进的自动语音识别技术,实时转录在你的屏幕上执行语音到文本的实时转录,这样有了livetranscribeapk你就可以参与周围世界的对话。欢迎有需要的用户下载体验。
软件介绍
livetranscribeapp是一款由Google针对耳聋及听力障碍人群开发免费的Android无障碍服务应用,在安卓手机上安装livetranscribeapk,你也可以通过在屏幕上输入你的回答来保持对话的进行。LiveTranscribe将自动生成字幕的功能引入了手机设备,只需一部手机,便可实现实时的语音转文字功能。
功能介绍
·livetranscribeapp支持70多种语言和方言的转录
·双语支持,livetranscribeapp可在两种语言之间快速切换
·我们的文字记录与我们从麦克风接收到的音频一样好。这就是为什么实时转录支持有线耳机、蓝牙耳机和USB麦克风中的外部麦克风
·响度和噪音指示器显示扬声器声音相对于环境噪音的音量
·livetranscribeapp通过在应用程序中键入您的回复,无需说话即可回复
·可选的触觉反馈在有人开始或继续说话时向您发出信号
·在Android5.0和更高版本上提供
·私人-通话记录在您的设备上保持安全
软件特色
-livetranscribe支持70多种语言并覆盖全球80%以上的人群;
-安装livetranscribeapp后只需轻点一下系统任务栏上的“无障碍功能”图标,即可在任意应用中启用此服务;
-显示转录的置信水平。黄色代表高置信度,绿色代表中等置信度,而蓝色代表低置信度。白色单词为新文本,在最终确定置信度前等待语境处理;
-响度与噪声指示器由两个同心圆构成。较亮的内部同心圆代表噪声层,它会让耳聋用户了解当前环境所处的噪声级别。外部同心圆表示麦克风对说话人声音的接收状况。将二者相结合后,相对差异便会一目了然。
相关阅读
过去,基于ASR的转录系统一般都需要计算密集型模型、详尽的用户研究以及昂贵的连接服务费用。
为了降低用户使用自动连续转录服务的成本,Sagar团队将LiveTranscribe背后的神经网络模型分别部署在设备端和云端(GoogleCloud)。
设备端的是卷积神经网络模型,主要做声音分类的工作,能辨别570个声音类别,比如婴儿哭声或玻璃破碎声。
云端的神经网络模型规模大得多,主要做语音转录成文字的工作,由两个部分组成。
第一部分是声学模型,能够从音节的角度辨析说话者所说的是“Hi”还是“Hello”。
第二部分是发音模型,可以根据识别出来的音节做拼接或组合,组成实际的单词。第三部分是语言模型,根据识别出来的单词添加适当的标点符号和停顿,以符合人类语言使用习惯。
实用工具