萬惡的Deepfake，爲什么百禁不絕？

2024-10-09 18:40:22 編輯： robot

導讀在國慶假期期間，網友惡搞的雷軍AI配音突然爆火，引發了諸多爭議。AI造假音視頻，似乎已經成爲一個無法關閉的潘多拉魔盒。在更早之前，韓國爆發的Deepfake危害事件就曾引發全球關注。根據相關報道，最...

在國慶假期期間，網友惡搞的雷軍AI配音突然爆火，引發了諸多爭議。AI造假音視頻，似乎已經成爲一個無法關閉的潘多拉魔盒。在更早之前，韓國爆發的Deepfake危害事件就曾引發全球關注。根據相關報道，最初是由多名韓國女性通過社交平台，披露了傳播Deepfake換臉不雅視頻的事件。隨後，有越來越多的危害事件與受害人被爆出。

根據社交媒體流傳的受Deepfake影響名單，有超過百所韓國中小學以及國際學校出現相關問題。有韓國官員表示，受害者可能達到22萬人。

這裏大家可能會有這樣一個疑問：爲什么多年來人人喊打的Deepfake反而愈演愈烈？

要知道，早在2017年Deepfake剛剛出現的時候，僅僅幾天就遭到了全球範圍的合力封殺，包括但不限於主流社交媒體的嚴格封禁。此後，多個國家與地區採用了立法的形式，嚴禁利用Deepfake以及其他AI換臉技術侵犯他人肖像權與隱私權。

危害難以杜絕，是因爲Deepfake技術高深，讓人防不勝防嗎？

答案剛好相反，Deepfake難以禁止的原因，恰恰在於其過分簡單，只需要簡單的技術資源就能造成巨大的破壞性影響。

而這些資源，在今天的互聯網環境下能夠輕而易舉地獲取。

我想，我們沒有必要從人性和動機上討論爲什么有人制作和傳播AI換臉視頻。只要違法成本夠低，這種行爲就必然無法杜絕。作爲普通人，我們也難以從立法和執法的角度探討如何打擊Deepfake。我們能做的，是審視進行Deepfake的真實情況，進而考慮如何增大違法難度，壓縮這種行爲的生存空間。

Deepfake被很多媒體稱作“人類最邪惡的AI技術”。這種描述有其合理性，但也客觀上對Deepfake進行了妖魔化、神祕化的修飾，讓不了解的人將其與黑客、勒索病毒、暗網等關鍵詞聯系起來，認爲其非常隱祕而高深。

事實恰恰相反，Deepfake的危害性與破壞性，恰恰在於其操作簡單。近乎沒有任何技術學習門檻，同時其所需要的每一步幫助，都可以在公开的互聯網環境中堂而皇之地獲取。

試想一下，韓國的22萬名受害者，不可能都是某幾個技術大牛進行的施暴。當普通人可以隨時隨地，沒有成本地作惡，惡意才真正難以被遏制。

之所以這樣說，是我們必須先了解Deepfake的具體流程。一般來說，使用Deepfake進行AI換臉，需要經歷以下幾個步驟：

1.准備Deepfake相關軟件，或者找到具有類似功能的在线AI开發平台。

2.准備要進行人臉替換的視頻，對視頻進行照片化切圖。

3.挑選出若幹照片中要替換的人臉並進行操作。俗稱切臉，提臉。

4.將准備好的照片進行覆蓋，進而進行模型訓練。這一步對於缺乏技術功底的人來說，大概率需要預訓練模型來輔助訓練。

5.訓練完成，生成視頻。

從這個流程中我們可以總結出，想要進行一次有危害性的Deepfake最多只需要四件東西：AI換臉軟件、預訓練模型、被換臉的視頻、受害人照片。

獲取這些東西過分容易，就是Deepfake百禁不絕，反而流毒更廣的核心原因。

我們可以來分步驟看看，Deepfake的“作案工具”究竟來自哪裏。討論這些的原因絕不是希望普及相關知識，而是希望指出互聯網環境下，留給Deepfake作惡者的機會與漏洞究竟在哪裏。這些漏洞不被斬斷，僅憑道德層面的號召倡議，或者對AI換臉視頻的技術識別，是斷然無法組織別有用心者的。

首先，AI換臉必然需要受害人的照片。根據相關技術社區的分享，最初版本的Deepfake大概需要50張、多角度、高清晰度的照片，才能實現較爲自然的視頻合成。但經過幾年的迭代，目前只需要20張左右的照片就可以實現。

試想一下，對於稍微有社交媒體分享習慣的朋友來說，20張照片被盜用簡直是輕而易舉。

加上一段很容易找到的不雅視頻，一場無妄之災可能就此开啓。

得到了受害人的照片信息之後，不法分子就要找到可以進行Deepfake的軟件。Deepfake的創始人最早是將軟件與教程分享到了Reddit上，此後很快被官方禁止。一氣之下，作者就將這款軟件的代碼全部放到了Github上進行免費分享，可供隨時下載與使用。

到2022年，相關軟件已經升級到了DeepFaceLab 3.0版本，不僅可以在作者的Github下載，在中文互聯網環境中還有大量QQ群、網盤鏈接進行分享。

更爲可惡的是，在各個下載渠道中獲得的DeepFaceLab，都有非常詳細的中文說明與操作指引。而在切臉這類比較繁瑣的工作上，甚至有專門軟件進行加速。

唯一可能給不法者造成阻礙的，是AI換臉依舊需要比較好的顯卡來進行訓練加速，但中高端的遊戲顯卡也已經完全足夠。

獲取成本爲0的不法軟件，技術成本爲0的操作難度，構成了Deepfake真正恐怖的地方。

到以上爲止，如果是一個有AI技術能力的人，已經獲得了全部進行Deepfake施暴的前提條件。但對不太了解AI技術的人來說，還有一個關鍵需求，就是獲取預訓練模型。

預訓練模型，是AI开發的一個基本機制。由於大部分AI模型的前置訓練任務是相同的，因此开發者傾向將相同的部分進行預訓練，在同類任務中作爲公用底座來使用。而在AI換臉任務中，由於難以掌握訓練方法，大部分新手訓練出的AI換臉模型會出現貼臉不自然，嚴重掉幀等現象。這時候就需要使用預訓練模型進行訓練，從而在提升模型精度的同時，也降低模型訓練所需時間。

按理說，作爲非技術人員的普通人，應該較難獲得預訓練模型來進行Deepfake吧？

事實並非如此，打开很多電商平台、二手交易平台，就可以輕松找到專用於Deepfake的預訓練模型。這些模型一般被稱爲“AI金丹”。

在某主流二手交易平台，搜索AI金丹、AI仙丹、AI底丹，或者DFL丹藥、DFL靈丹等關鍵詞，會出現大量Deepfake預訓練模型的出售聯接。一般只需要幾元錢成本。

由於平台缺乏監管，這類售賣行爲長期存在，成爲滋長惡行的“產業鏈”。就連上文提到的DeepFaceLab軟件，很多時候也可以在二手交易平台买到，賣家還對進行操作教程與指引。

而這種“AI仙丹產業鏈”另一個難以杜絕的地方在於，一個Deepfake用戶熟練操作之後，又可以將自己的模型制作爲預訓練模型，也被俗稱爲“煉丹”。煉好的彈藥再到二手平台進行販賣，這種灰色產業就這樣不斷擴散綿延。

總結Deepfake施暴者每一步的支持來源，是爲了指出杜絕其危害，真正應該着手發力的地方。

目前相關話題的討論，經常會陷入某種誤區：總是想要用非常前沿的，高成本的方法去阻擊Deepfake，比如倡導利用AI技術來鑑別視頻是否爲AI生成等。

當然，通過AI算法來分辨AI換臉有重要的應用場景，比如在AI換臉詐騙識別上，檢測視頻造假就至關重要。

但在類似韓國Deepfake事件，這類利用AI換臉炮制不雅視頻的犯罪中，識別視頻爲假是無力的，甚至是無用的。

對於造假者與傳播者而言，他們大多不在乎視頻是否爲假。依靠高精尖的智能化技術去檢測Deepfake，就像用微小的技術沙袋，去堵決堤的人性江河，不過是揚湯止沸而已。

更有效的方法，或許是釜底抽薪，是從源頭上杜絕別有用心者嘗試Deepfake。

首先，或許我們需要在社交媒體上分享照片時更加慎重。誠然，不能讓受害者承擔制止犯罪的義務，但在這個充滿不確定性的網絡環境中，個人隱私的保護責任也在變得愈發重要。

接下來，是對相關軟件要採取更具嚴格的封禁策略。對傳播類似軟件採取適當的制止行爲。尤其在AIGC興起後，大量新型平台开始爲普通开發者提供各種各樣的AI开發功能。一定要謹慎提防類似功能混跡其中，成爲新的AI安全漏洞。