新闻
您现在的位置:首页 > 新闻 > 谷歌研究人员训练AI来区分9种印度语言
  • 第三批专项债六月底发完 项目完成审核

    第三批专项债六月底发完 项目完成审核

    发布时间:2020/04/06

    财政部副部长许宏才4月3日在新闻发布会上表示,今年以来,根据全国人大常委会授权,财政部提前下达了2020年部分新增专项债券额度12900亿元。截至2020年3月31日,全国各地发行新增专项债券1.08万亿元,占84%,发行...

  • 国美零售转型加速 携拼多多“迎战”零售业大考

    国美零售转型加速 携拼多多“迎战”零售业大考

    发布时间:2020/04/06

    随着国内疫情初步得到控制,零售消费市场也在逐渐恢复运转。日前,国务院联防联控机制举办新闻发布会。商务部消费促进司负责人王斌在会上指出,将千方百计促进消费回补和潜力释放,壮大新型消费和升级消费,扩大...

  • 美新冠疫情蔓延,建霖家居等IPO企业受累

    美新冠疫情蔓延,建霖家居等IPO企业受累

    发布时间:2020/04/06

    编者按: 随着疫情蔓延,全球新冠肺炎确诊病例已突破百万,累计死亡超5万例,其中,美国确诊超过23万例,欧洲确诊超过50万例。作为全球经济重要力量的欧美地区,其疫情将对IPO企业产生什么影响? “有一天美国将成...

  • 信托代销哪家强?招行去年赚64亿

    信托代销哪家强?招行去年赚64亿

    发布时间:2020/04/04

    证券时报记者 杨卓卿 随着银行年报密集披露,一些行业巨头代销信托产品的情况也浮出水面。 证券时报记者注意到,“零售之王”招商银行2019年代销的信托产品规模超过3000亿元,借此实现64.32亿元的手续费及佣金收入...

谷歌研究人员训练AI来区分9种印度语言

发布时间:2019/10/02 新闻 浏览次数:2153

 
世界上讲数千种语言,准确地说大约是6,500种语言,而Google,Facebook,Apple和Amazon等系统每天都在更好地识别它们。问题是,并非所有这些语言都具有大量可用的语料库,这会使训练支撑这些系统的数据量巨大的模型变得困难。
这就是Google研究人员正在探索将知识从数据丰富的语言应用于数据稀缺的语言的技术的原因。它以多语言语音解析器的形式取得了成果,该解析器学习了多种语言的转录,最近在奥地利格拉茨举行的Interspeech 2019会议上接受的预印本中对此进行了详细说明。共同作者说,他们的单一端到端模型可以高度准确地识别九种印度语言(印地语,马拉地语,乌尔都语,孟加拉语,泰米尔语,泰卢固语,卡纳达语,马拉雅拉姆语和古吉拉特语),同时展示出“戏剧性的”改进自动语音识别(ASR)的质量。
“在这项研究中,我们关注的是印度,这是一个固有的多语言社会,那里有三十多种语言,至少有一百万人以英语为母语。由于母语的地理位置和共同的文化历史,这些语言中的许多语言在声学和词汇上都有重叠。”主要合著者以及Google Research软件工程师Arindrima Datta和Anjuli Kannan在博客中解释道。 “此外,许多印度人是双语或三语的,这使得在对话中使用多种语言成为一种普遍现象,并且是训练单一多语言模型的自然案例。”
研究人员的系统体系结构在某种程度上具有独特之处,它将声学,发音和语言成分结合在一起。先前的多语言ASR工作无法解决实时语音识别的问题。相比之下,由Datta,Kannan及其同事提出的模型利用了递归神经网络传感器,该传感器适于一次输出一个字符的多种语言的单词。
为了减轻因转录的语言的小数据集而引起的偏见,研究人员修改了系统架构,以包括额外的语言标识符输入,即从训练数据的语言区域派生的外部信号。 (一个示例:在智能手机中设置的语言首选项。)与音频输入相结合,它使模型可以消除给定语言的歧义,并根据需要学习不同语言的单独功能。
该团队通过以剩余适配器模块的形式为每种语言分配其他参数,进一步扩展了模型,从而有助于微调全局每种语言模型并提高整体性能。最终结果是一种多语言系统,其性能优于所有其他单语言识别器,并简化了培训和服务,同时满足了Google Assistant等应用程序的延迟要求。
共同作者写道:“基于这一结果,我们希望继续针对其他语言群体的多语言ASR进行研究,以更好地帮助我们不断增长的多样化用户群体。” “ Google的使命不仅是整理世界各地的信息,而且使所有人都可以访问它,这意味着确保我们的产品能够以世界上尽可能多的语言工作。”
该系统-或类似的系统-可能会进入Google Assistant,该系统在2月份获得了对多韩语,北印度语,瑞典语,挪威语,丹麦语和荷兰语的多圈对话的多语言支持。在相关新闻中,Google推出了解释器模式,可翻译数十种语言和9种由AI生成的新声音。

姓 名:
邮箱
留 言: