欢迎光临
我们一直在努力

谷歌发布免费实时转录软件

最近,谷歌邀请媒体在北京举行视频电话会议。 Google产品经理Sagar Savla推出了Live Transcribe软件,这是一款免费的Android服务,通过在日常会话中加入自动字幕,减少了现实世界中对话的障碍。
根据谷歌的说法,Live Transcribe支持70种不同的语言(方言),可以随着对话的继续进行微调(类似于自动修复字幕)。为了提高识别的准确性,该应用程序还支持外部麦克风。虽然它需要联网,但Google承诺不会在服务器上存储会话内容。
可以理解,通过自动语音识别技术(ASR),计算机可以检测浊音语言并将其转录到文本中进行阅读。在Google Cloud的支持下,Live Transcribe可以执行实时对话和字幕转录,支持70多种语言。覆盖全球80%以上的人口。
Sagar Savla表示,虽然依靠云ASR可以为我们提供更高的准确性,但谷歌希望减少Live Transcribe所需的网络流量消耗。为此,Google基于以前的AudioSet工作实现了基于神经网络的设备语音检测器。该网络是一种类似于我们之前发布的VGGish模型的图像模型,该模型检测语音并自动管理与云ASR引擎的网络连接,以最大限度地减少长期使用期间的数据消耗。
在技术演示方面,谷歌考虑了几种不同的模式:计算机,平板电脑,智能手机和小型投影仪,以迭代的方式显示听觉信息和字幕。最后,Sagar Savla的团队决定专注于智能手机模型,因为这些设备无处不在,而且越来越强大。
根据这些数据,世界卫生组织估计到2055年将有9亿人遭受听力损失。谷歌的软件可以为他们带来便利。该软件目前在亚洲非常受欢迎。资料来源:网易情报

未经允许不得转载:美国主机评论博客 » 谷歌发布免费实时转录软件

分享到:更多 ()