精听什么材料好?
作为一名在AI(人工智能)领域深耕数十年的老兵,我其实一直非常关注语音领域的研究进展。因为在我看来,语音是人工智能最重要的技术方向之一。 最近我一直在思考这么一个问题:如今我们已经拥有了全球最大最先进的人工智能计算平台(百度大脑),以及丰富的人力资源(百度翻译团队),我们是否有可能借助AI技术让机器听懂人类语言,甚至可以做到机语互译?
于是我和团队一起调研了当前业界主流的音频/视频转文字和语音翻译的技术,并在此基础上实现了基于深度学习的语音自动翻译系统。这个系统的语言组合包括中英日韩德法西六种语言,能够从音频或视频中实时转写文字,也支持英韩日中四国语言的语音到文字的翻译。
我们采用深度学习的方法训练语言模型,不使用词典和不规则转化,能准确地将英文“I love China.”转化为中文“我爱中国”,将韩语“영혼이 너를 원하는 것은 바로 나의 심장을 느껴봐.”翻译成英文“The soul wants to feel the beating of your heart, which is just like mine.” 当然,这个系统还有待完善。目前只能处理短句,不能识别复杂的语法结构;而且虽然能理解一般时态一般动词的句子,但对主谓结构的分析还不给力。但我们相信,随着深度学习的进步,加上大数据和新算法的应用,这一难题一定能得到解决。到那时,AI语音翻译机就可以梦想成真了!