新闻
您现在的位置:首页 > 新闻 > 语音克隆专家涵盖犯罪,积极用例和防护措施
  • 第三批专项债六月底发完 项目完成审核

    第三批专项债六月底发完 项目完成审核

    发布时间:2020/04/06

    财政部副部长许宏才4月3日在新闻发布会上表示,今年以来,根据全国人大常委会授权,财政部提前下达了2020年部分新增专项债券额度12900亿元。截至2020年3月31日,全国各地发行新增专项债券1.08万亿元,占84%,发行...

  • 国美零售转型加速 携拼多多“迎战”零售业大考

    国美零售转型加速 携拼多多“迎战”零售业大考

    发布时间:2020/04/06

    随着国内疫情初步得到控制,零售消费市场也在逐渐恢复运转。日前,国务院联防联控机制举办新闻发布会。商务部消费促进司负责人王斌在会上指出,将千方百计促进消费回补和潜力释放,壮大新型消费和升级消费,扩大...

  • 美新冠疫情蔓延,建霖家居等IPO企业受累

    美新冠疫情蔓延,建霖家居等IPO企业受累

    发布时间:2020/04/06

    编者按: 随着疫情蔓延,全球新冠肺炎确诊病例已突破百万,累计死亡超5万例,其中,美国确诊超过23万例,欧洲确诊超过50万例。作为全球经济重要力量的欧美地区,其疫情将对IPO企业产生什么影响? “有一天美国将成...

  • 信托代销哪家强?招行去年赚64亿

    信托代销哪家强?招行去年赚64亿

    发布时间:2020/04/04

    证券时报记者 杨卓卿 随着银行年报密集披露,一些行业巨头代销信托产品的情况也浮出水面。 证券时报记者注意到,“零售之王”招商银行2019年代销的信托产品规模超过3000亿元,借此实现64.32亿元的手续费及佣金收入...

语音克隆专家涵盖犯罪,积极用例和防护措施

发布时间:2020/01/31 新闻 浏览次数:657

 
Deepfake,或将人带入现有图像,音频记录或视频,并使用AI将其替换为别人的肖像的媒体,正在迅速繁殖。认识到深造假对隐私,文明和民主进程造成的威胁,美国联邦贸易委员会(FTC)昨天举办了一个研讨会,研究了深造假的子类别,称为语音克隆,即产生人的近乎完美复制品的技术。语音。在一系列小组讨论和演讲中,包括FTC专员Rohit Chopra,美国司法部律师Mona Sedky,微软捍卫民主技术和运营总监Ashish Jaiman以及国防高级研究计划局(DARPA)科学和工程技术顾问Neil在内的嘉宾演讲者约翰逊权衡了各种Deepfake音频用例和可能用于解决它们的方法。
心情同样冷酷而乐观。演讲者预计,深造假将被用于实施欺诈和骚扰,但也可能被用于为患有ALS和其他健康疾病的人们合成声音。话虽如此,但所有人都认为,在AI产生与真实人的声音无法区分的声音的世界中,法规,检测方法和公众意识将至关重要。
犯罪与同意
乔普拉指出,根据最近的调查,美国人正在迅速失去对科技公司的信任,深造假的泛滥只会加剧这种不信任感。 “今天,那些希望对我们的国家和我们的社会造成伤害的人将技术和数据武器化。如今,隐私显然已经成为国家安全问题和人身安全问题,”他说。 “失去对自己的生物识别技术的控制带来了另一个危险……我们将决定如何控制这项技术,并将其控制在不正确的人手中,并保护我们的安全和保障免受生物识别技术被盗的危险。”
几位小组成员指出,未经许可将使用“已经伪造”的声音。迄今为止,一些最令人印象深刻的例子,例如来自多伦多的研究公司Dessa,伦敦帝国学院和Facebook的例子,都是在研究或宣传活动中创建的。但是网络安全公司赛门铁克(Symantec)在2019年9月表示,至少发生了三起深度欺诈性语音欺诈案件,并且Experian预测,今年的犯罪分子将利用AI破坏商业企业的运营并在国家之间造成“混乱”。
塞奇指出,从历史上看,邪恶的行为者避免了以通讯为中心的欺诈计划,其原因有三点:它们留下指纹,成本高昂,而且困难重重。 (例如,具有口音的外国人可能难以说服一个人他们是另一个人。)Deepfake技术已经颠倒了这一点,因为合成声音相对易于产生和扩展。
“将会有基于欺诈的……和以骚扰为重点的犯罪分子会喜欢这种技术。可以将Deepfake音频与deepfake视频一起使用,以创建非常伪造和逼真的,色情的视频,然后将其用于[勒索和勒索],” Sedky说。 “ [犯罪分子可以]用听起来完全像[受信任的]联系人的电话跟进伪造的…仿冒网站的钓鱼电子邮件。 [或者]冒充公司首席执行官的人[可能]发出虚假的财报电话,以操纵股价[或]破坏竞争对手。”
代表电影和电视演员,记者,歌手和其他媒体专业人士的美国工会SAG-AFTRA的执行副总裁丽贝卡·达蒙(Rebecca Damon)指出,未经授权使用他人的肖像可能会损害生计,或对声誉造成不可挽回的损害。
戴蒙(Damon)提供了这种情况:广播公司正处于打破一个大故事的前夕,他们发现自己声音的声音说出了一些自己没有说过的话,从而破坏了他们的信誉。 “人们(应该)就如何使用他们的声音做出明智的决定。表演者的声音使用与他们的信仰不一致的方式(或认为可能与其他协议不一致的方式)是不可接受的,”她说。很多时候,人们很兴奋,他们急于采用新技术,但是,他们并不一定会考虑所有应用程序。当我们仔细研究这种技术的含义时,我们……相信必须以尽可能多的保护措施来实现它。”
积极用途
周二的研讨会并不是严格意义上的厄运。波士顿儿童医院增强沟通计划负责人约翰·科斯特洛(John Costello)致力于非语言患者和言语严重受损的患者,他强调了语音克隆技术为患有肌萎缩性侧索硬化症(ALS),亨廷顿舞蹈病和自闭症自然说话的能力。
在继续播放Alphabet的DeepMind的录像之前,他说:“我们的声音是我们的声学指纹。”记录了ALS倡导者和前美国国家橄榄球联盟球员蒂姆·肖的声音的再现。 “声音……(是)我们个性的标志-这不仅对于演讲者,而且对于(人类和动物的)交流伙伴都非常重要。考虑到我们越来越多地依靠自己的房屋中的家庭自动化技术(我们正在使用语音来控制声音),为无法说话的人提供高质量的声音,对于赋予一定程度的独立性至关重要否则他们将无法使用。”
东北大学的教授Rupal Patel是开发语音合成平台的初创公司VocalID的创始人兼首席执行官,他指出,合成技术甚至可以用于为出生时缺乏语音的人创建语音。通过众包语音并从无法正常说话的人那里获取发声样本,VocalID等公司的研究人员可以将声音与非语言人的声音匹配,听起来很相似。
“ [VocalID现在是我们的语音合成引擎的第四代产品,它使我们能够制作出[个人]高度可复制的语音,”帕特尔解释说。 “ [[虽然我们主要关注]不说话的人,[我们也帮助]将要失去声音的人……在他们失去声音之前,他们会[与我们一起]存储声音,然后我们重新创造出来。”
另一方面,医生和社会工作者可能会使用克隆的声音“触摸更多生活”,帕特尔说-也许是将数字化身嵌入网络和应用程序中。她补充说:“语音是……[卫生工作者]如何与患者互动的值得信赖的方面。” “可以使用这种技术的各种不同方式,以继续您与已知个人的关系。”
帕特尔指出,语音克隆技术具有商业意义。品牌声音(例如,由女演员和喜剧演员斯蒂芬妮·考特尼(Stephanie Courtney)扮演的Progressive的Flo)通常负责录制电话树以进行交互式语音响应(IVR)系统或为公司培训视频提供电子学习脚本。合成可以通过减少辅助录制和接听(录制会议以解决错误,更改或画外音脚本中的添加内容)的方式来提高演员的工作效率,同时使他们腾出时间从事创作工作,并使他们能够收集残差。
帕特尔说:“每一项新技术都会永远被邪恶使用。” “ [最大的保障措施之一是意识。人们不知道这项技术的存在,也不知道这项技术有多好。我认为我们需要开始对人们进行教育,并了解这项技术及其机制以及如何传播。”
保障与缓解
Costello指出,要防止恶意使用以特定人风格合成的声音,就需要技术保障。他提出了一种在生成的声音之上分层放置的音频指纹,以作为一种认证形式。
野外克隆语音的检测解决方案开始出现。几个月前,初创公司Resemble发布了一种工具,该工具可使用AI通过提取语音样本的高级表示并预测它们是真实的还是生成的来检测深度欺诈。另外,在2019年1月,Google发布了一个语料库,其中包含该公司的文字转语音模型说出的“数千”个短语。像ID R&D这样的公司(其首席执行官参加了周二的活动)采用的算法会查看语音中的不同特征(例如韵律,相位,频率和音调),以确定语音是否来自“再现设备”(例如扬声器)与人的声道。
Johnson说,来自奥尔巴尼大学,加利福尼亚大学伯克利分校,SRI International以及DARPA MediFor的其他研究人员正在研究可操纵媒体检测技术的孵化器,即使说话者ID系统也可以区分真实语音和合成语音失败。其中一些功能不仅考虑音频功能,还考虑呼叫者ID,压缩级别等信号。
“通过…计划,我们正在研究跨模式。这样做的目的是,我们希望虚假信息和假新闻永远存在。我们将不得不忍受它,但是我们能做的是确保我们对我们在这里看到的一切有信任。在DARPA,我们想要做的是……[想出办法]应对假新闻和虚假信息,并…有一个指标将某种信任价值置于所产生的媒体和所讲述的故事中。”
奥尔巴尼大学计算机科学教授Siwei Lyu认为,反复接触后,消费者有可能会学会自行捕获深造品。对此进行了支持的研究-麻省理工学院媒体实验室和马克斯·普朗克研究所的研究人员去年进行的一项研究发现,人们在获得反馈后发现伪造照片的能力会提高。
Lyu说:“我认为,五年后,我们将达到某种程度,在消费者听到大量Deepfake音频样本并发展出某种免疫系统后,他们将变得更加老练。”
也许是为了对赌,一些社交媒体网络已采取措施来防止深造的传播-音频或其他。 Twitter宣布了计划对围绕媒体实施的政策进行修改,以误导公众,并表示将删除“威胁某人的人身安全或导致其他严重伤害”的政策。就其本身而言,Facebook最近表示会从其平台上删除任何经过修改的媒体(除了为清晰度或质量进行调整之外),而这种方式“对普通人而言并不明显”。
佛罗里达大学工程学卓越主席Patrick Traynor表示:“打击……假冒媒体和检测假冒声音将是社区的工作。” “这(将需要)商业公司和典型用户的势头。 [如果每个人都进行尽职调查,我们可以控制这一点。“

研讨会的主持人同意,法规和立法同样是克隆语音难题的关键部分。其中一些人指出,9月,美国国会议员致信国家情报局局长丹·科茨(Dan Coats),要求情报机构提交有关深造假对民主和国家安全的潜在影响的报告,并且在10月,加利福尼亚州成为美国第一个州将在政治竞选活动和广告中使用深度欺诈行为定为犯罪。
Sedky说,在诸如欺诈之类的情况下,根据1984年《信用卡欺诈法》制定了18 USC 1029和1028,其中规定了语音(或克隆语音)等访问设备的使用,尤其是在生物识别环境下(例如,访问在线帐户),显然可以起诉使用Deepfake。但是,她说,首先未经授权获得克隆声音是否构成犯罪是一个公开的问题。
中国最近实施的Deepfake规则可能会为将来的监管提供模型。他们明确禁止发布和分发使用AI和虚拟现实等技术创建的“虚假新闻”,并要求对AI或VR的任何使用进行显着标记。
但是在缺乏法律框架的情况下,贾曼主张采用类似于微软内部使用的风险模型。它试图平衡可能推向市场的任何技术与该技术可能带来的潜在危害。
他说:“ [您]实质上是在建模[风险],并提出一种治理模型,说:’好吧,我们可以采取什么措施来降低风险?” “ [在Microsoft,]我们提出了一个[危害]框架,[基本上]说,嘿,这是对该技术的潜在滥用,并且…如果我们看到其中任何一种,我们可以减少对[a]服务的访问。 Jaiman断言,只有Microsoft的客户可以证明目标说话者表示同意并且该应用程序符合Microsoft的服务条款,他们才能创建语音克隆。他说:“我们还必须确保随着社会和技术的发展而与时俱进。 [任何模型都必须内置]问责制,隐私,安全性,可靠性和安全性……信任是一种高价值货币。”
无论如何,增加Sedky的透明度,高度的谨慎性将是在未来几年中努力解决语音合成技术的关键。
“显然,这项技术太棒了,” Sedky说。 “就像互联网可以被用来对付人们的武器一样,这并不意味着我们不应该拥有互联网。这只是意味着这些是我们需要考虑的事情,并且……这将使对人民的武器化变得更加困难。我们需要预先了解如何保护那些肯定会受到犯罪分子伤害的消费者。罪犯通常在我们前面。”