深度伪造技术的风险、挑战及治理
随着人工智能的快速发展,近几年深度伪造技术迅速兴起,其巨大的应用潜力为艺术、社交、医疗等领域的发展带来了新的可能性,但同时也为不法分子散布虚假视频,激化社会矛盾,煽动暴力和恐怖行动提供了新工具,给经济安全、社会安全等安全领域带来了诸多风险。本文聚焦深度伪造技术,对其基本内涵、带来的风险与挑战,以及主要国家的治理措施进行了深入研究。
一、关于深度伪造技术
(一)什么是深度伪造技术
深度伪造技术(Deepfake)是指利用人工智能、机器学习、神经网络等方法来伪造图片、音频及视频等内容的一种技术手段。深度伪造技术是人工智能技术发展过程中衍生技术的一种,其核心原理是利用生成对抗网络或者卷积神经网络等算法对语音、图像、文字等信息内容进行修改。
深度伪造技术主要有人脸深度伪造技术和语音深度伪造技术。 其中人脸的深度伪造技术可以概括为以下几个步骤:
2. 裁剪并预处理目标图片中的人脸;
3. 提取人脸中的身份和表情信息,并通过生成模型生成伪造人脸;
4. 将生成的人脸渲染到目标图像中人脸位置,重建图像。
针对语音深度伪造技术需要音频和文字输入,用于指定目标语音的内容和音色。 语音深度伪造技术的主要步骤有:
1. 如果该方法接受文本输入,则将其编码;
2. 提取输入音频的梅尔倒谱系数(Mel-Frequency Cepstral Coefficients,MFCCs);
展开全文
3. 将预处理后的数据输入生成模型,得到目标语音的帧级语音特征;
4. 通过声码器等方式得到目标语音。
(二)深度伪造的生成模型
基于深度学习的生成模型是深度伪造的技术基础,其中两种主要的生成模型为 生成对抗网络(Generative Adversarial Network,GAN) 和变分自编码器(Variational Auto-Encoders,VAE) 。
生成对抗网络是一种应用较为广泛的生成模型,包括生成器和分类器。生成器可在高斯分布中采样生成图片,训练目标生成分类器无法辨别真伪的图片,分类器则学习图片是否由生成器生成。在训练过程中,交替固定生成器和分类器的参数。目前较为常用的生成对抗网络模型有InfoGAN、CycleGAN等。
变分自编码器是一种基于自编码器结构的生成模型,自编码器一般包括编码器模块和解码器模块,在深度伪造过程中通过添加解码器和编码器或者在编码中注入信息来进行身份或动作的篡改,而变分自编码器相比自编码器具有更好的耐噪声能力。
(三)深度伪造检测技术
深度伪造技术的深入发展对社会安全、网络安全甚至是政治安全都产生了严重的威胁,为应对深度伪造技术带来的一系列负面影响,人们逐渐开始关注针对深度伪造技术的对抗策略。
图像与视频的深度伪造检测技术主要可以分为针对伪造痕迹进行取证的检测方法和数据驱动的检测方法。针对伪造痕迹进行取证可以采取直接对图像进行检测的方法,主要检测“图像处理取证,生物信息,融合痕迹,时序连贯和模型指纹”等图像伪造痕迹。
除了直接针对检测图像进行图像取证的方法,部分研究者针对深度伪造步骤中将生成模型输出结果和外围背景的融合步骤产生的伪造痕迹进行检测。基于数据驱动的检测方法则是利用卷积神经网络对常用的人脸伪造方法(例如face2face)进行检测,得到相关的特征向量,之后利用神经网络根据特征向量判断输入图像是否经过伪造。
语音深度伪造检测一般分为前端和后端,分别从音频中提取声学特征,以及利用高斯混合模型、神经网络等分类模型根据声学特征对目标音频进行分类,从而判断语音是否经过伪造。
二、深度伪造技术的风险与挑战
2020年,伦敦大学学院的研究人员发布了一份专家认为最严重的人工智能犯罪威胁的排名,其中深度伪造高居榜首。必须全面把握、深刻认识该技术带来的威胁,才能及时防范应对其带来的安全风险。
(一)深度伪造影响国际关系
深度伪造会破坏国际社会的战略互信并冲击脆弱的和平环境。从国际形势稳定的角度看,深度伪造与其他颠覆性数字技术相结合,将极大地降低全球和区域多边机构以及国际关系行为体彼此间的信任。根据美国权威数据科学公司的一项测试,通过语音生成算法,只需要借助两小时的语料并训练五天时间,就可以模拟一份以假乱真的特朗普向俄罗斯宣战的语音。对于在国际社会试图制造事端的国家与非国家行为体而言,它们可以随时获取和利用深度伪造技术,扩大参与并深度影响国际关系形势。
深度伪造很可能会成为国际恐怖活动的催化剂。早期的恐怖组织缺乏制作虚假但可信的音频和视频的资源,如今随着深度伪造技术的成熟,它们可以轻而易举地制造这类作品了。恐怖组织通过深度伪造的视频或音频,针对对手包括政府官员发表煽动性言论或从事挑衅性行动,最大限度地对其目标受众产生有利于恐怖组织的影响。
(二)深度伪造影响新闻舆论
其次,深度伪造给国家形象带来新的挑战。一方面,深度伪造可能用以抹黑国家形象。 2022年8月底,美国斯坦福大学网络观察室发布报告,披露美国利用社交媒体操纵全球舆论。另一方面,深度伪造可能通过假新闻诽谤公众人物。 正如有专家预测的那样,未来几年,电脑将能够快速生成令人信服的、伪造的音频和视频信息,这将把假新闻提升到一个全新水平。深度伪造技术可能通过所谓的假新闻用以诽谤公众人物。
(三)深度伪造侵犯公众利益
颠覆性技术已从传统神秘的技术流派,转向技术开源代码的普及,面临着低门槛扩散化的风险。如深度伪造技术的代码算法,已在GitHub等技术交流网站开源;更便捷的方式是通过手机应用商城免费下载相关应用软件,开展深度伪造的活动。获取渠道和应用场景的平民化趋势,将带来社会安全和经济风险,侵犯公民合法权益。
深度伪造技术侵犯公民肖像权和名誉权。众多技术公司开发的商业性娱乐性深度伪造软件,能轻松地将面部表情、技术动作和声音三者融为一体。这种平民化和社会娱乐化的使用,使得大规模低成本的针对个人的恶搞乃至污蔑成为可能。深度伪造技术最常见的非法运用方式,是将一些知名歌星、影星等公众人物的脸“移花接木”到色情明星身上,伪造色情片非法牟利,或者是伪造恶搞视频,这对个人名誉权与肖像权构成严重侵害。
三、各国对深度伪造技术的政策及治理
(一)美国:自下而上的治理路径
2019年美国情报界发布研究报告——《2019年全球威胁评估》,该报告认为“深度伪造”技术已经对美国国家安全构成威胁,敌对势力和战略竞争对手很有可能企图利用“深度伪造”技术或类似的机器学习技术,创造出高度可信但却完全虚假的图片、音频和视频资料,以加强针对美国及其盟友和合作伙伴的影响渗透运动。
美国作为第一个大规模出现深度伪造技术的国家,针对该技术引发的一系列问题采取针对性回应举措,由基层参与先行,综合各方形成自下而上的治理路径(见表1)。
表1 美国深度伪造的治理路径
(二)欧盟:自上而下的治理路径
欧盟由于“深度伪造”换脸的普及程度、影响广度和侵害深度远低于美国,因而不同于美国制定针对性法案,而是将“深度伪造”纳入“虚假信息”范畴进行统一管理。
欧盟委员会在2018年4月26日发布公告《应对线上虚假信息:欧洲方案》(Tackling online disinformation: a European Approach),以欧盟委员会为治理主体,自上而下发挥总揽全局作用,协调欧盟各成员国参与“深度伪造”治理(见表2)。
表2 欧盟深度伪造的治理路径
(三)中国:多方主体共同参与的治理路径
在中国,深度伪造技术被人们所关注是由于2019年“ZAO”这款换脸应用的兴起,ZAO在初始版用户协议中对用户个人信息做了如下规定:“确保肖像权利人同意授予‘ZAO’及其关联公司全球范围内完全免费、不可撤销、永久、可转授权和可再许可的权利,包括但不限于:人脸照片、图片、视频资料等肖像资料中所含的您或肖像权利人的肖像权,以及利用技术对您或肖像权利人的肖像进行形式改动。”但随着ZAO用户数量的激增,有关ZAO强制用户录入人脸数据,过度攫取和肆意滥用等行为引起大众的广泛关注和质疑。
目前我国暂未出现“深度伪造”换脸的政治性舆论事件,负面社会影响也才刚刚凸显,应对举措还在探索中,但已呈现出政府指导下多方主体共同参与的治理路径(见表3)。
表3 中国深度伪造的治理路径
目前,包括中国、美国、欧盟在内的众多地区和国家都已经认识到深度伪造带来的挑战和威胁,并且从新技术的研发、加强对信息发布平台的监管以及社会立法等方面采取行动,力求遏制恶意深度伪造带来的各种威胁。但是,数字活动的跨境性也决定了要解决深度伪造带来的问题,国家间的合作是必不可少的。国际社会必须在相互尊重、相互信任的基础上,倡导综合安全、合作安全、共同安全的理念,共同打造数字时代人类安全的命运共同体。
免责声明:本文转自元战略,原作者解雨 。 文章内容系原作者个人观点,本公众号编译/转载仅为分享、传达不同观点,如有任何异议,欢迎联系我们!
转自丨元战略
作者丨解雨
研究所简介
国际技术经济研究所(IITE)成立于1985年11月,是隶属于国务院发展研究中心的非营利性研究机构,主要职能是研究我国经济、科技社会发展中的重大政策性、战略性、前瞻性问题,跟踪和分析世界科技、经济发展态势,为中央和有关部委提供决策咨询服务。“全球技术地图”为国际技术经济研究所官方微信账号,致力于向公众传递前沿技术资讯和科技创新洞见。
地址:北京市海淀区小南庄20号楼A座
微信:iite_er
特别声明
本文仅代表作者观点,不代表本站立场,本站仅提供信息存储服务。