AI 換臉 ZAO 一晚,成本燒掉幾百萬(wàn)

人工智能
2019
09/02
21:31
量子位
分享
評(píng)論

來(lái)源:量子位

唯一能阻止 ZAO 刷屏的,可能是服務(wù)器。

今天上午 10 點(diǎn)半左右,正在使用 ZAO 的用戶發(fā)現(xiàn),想要生成一段新的 AI 換臉視頻,已經(jīng)不是等待幾秒、排隊(duì)第幾位的問(wèn)題,而是——

" 服務(wù)器繁忙 "

提示頁(yè)卡上寫(xiě)著:當(dāng)前制造任務(wù)已滿,無(wú)法制造,預(yù)計(jì) 10:XX 恢復(fù)能力。這里的 XX 大概是一段 10 分鐘左右的延時(shí),不過(guò)只要 5、6 分鐘就能繼續(xù)處理。

10 點(diǎn) 45 分左右,這個(gè)提示變?yōu)楦?jiǎn)單粗暴的一句話:

" 當(dāng)服務(wù)器制作量過(guò)大,請(qǐng)稍后再試 "

仔細(xì)看這句話,你以為是漏了一個(gè)字?不不不,只需要?jiǎng)佑贸踔虚喿x理解方法,就能推斷出這是運(yùn)營(yíng)方的一個(gè)暗示:

缺 " 前 "。

要知道,每個(gè) ZAO 用戶換臉的背后,是熊熊燃燒的服務(wù)器成本。據(jù) ZAO 官方透露的消息,一個(gè)晚上 ZAO 的服務(wù)器就能燒掉 200 多萬(wàn)。(燒一天怎么也得 500 萬(wàn)以上了吧)

這也足見(jiàn) ZAO 的火爆。

為什么 ZAO 火了

AI 換臉,不是新鮮事。

2017 年底,國(guó)外一位 ID 為 "deepfakes" 的網(wǎng)友,利用業(yè)余時(shí)間創(chuàng)造了一個(gè) AI 換臉?biāo)惴ā:髞?lái)這個(gè)算法也被廣泛稱為 deepfakes。

這個(gè)機(jī)器學(xué)習(xí)算法,首先在小圈子炸開(kāi)。在國(guó)外的 Reddit 論壇上,有一個(gè) deepfakes 社區(qū),一個(gè)月內(nèi)聚集了 1.5 訂閱者,并產(chǎn)生了大量的 AI 換臉視頻。

隨后,這個(gè)社區(qū)逐漸變成了生產(chǎn)假冒愛(ài)情動(dòng)作片的 " 黑窩點(diǎn) " ——不少人用 AI 技術(shù)將色情作品中的主角換成明星的臉。有文化,真可怕。小電影,可造假。

也正是因?yàn)檫@樣,這個(gè)社區(qū)引發(fā)了大量的爭(zhēng)議,最后被徹底關(guān)掉。

但這個(gè) AI 換臉這個(gè)技術(shù),卻一直進(jìn)化至今。比如今年初,B 站 UP 主 " 換臉哥 ",使用者個(gè)技術(shù)將 94 版《射雕》里朱茵扮演的黃蓉,換成楊冪的臉。

效果是真的好。(詳見(jiàn):朱茵變楊冪,流量一個(gè)億)

還有徐錦江對(duì)戰(zhàn)滅霸、洪世賢換臉艾莉等等。(詳見(jiàn):B 站名場(chǎng)面全被 AI 換臉調(diào)戲了一遍)

但,為什么 ZAO 大火特火了?

原因很簡(jiǎn)單。因?yàn)?ZAO 最簡(jiǎn)單。

最初的 deepfakes 只是一套算法,是基于 Keras 等多個(gè)開(kāi)源庫(kù)完成的。后來(lái)有位高手添加了一些工具,封裝成引用 FakeApp。這是一個(gè)桌面應(yīng)用,可以運(yùn)行 deepfakes 算法,無(wú)需安裝 Python、TensorFlow 等,僅需要 " 支持 CUDA 的高性能 GPU"。

這聽(tīng)起來(lái)簡(jiǎn)單,但對(duì)于普通用戶來(lái)說(shuō),下載、安裝、訓(xùn)練都是費(fèi)時(shí)費(fèi)力的大工程。所以通常都是一些愛(ài)好者制作發(fā)布,大家欣賞換臉后的成片。

而這次 ZAO 把門(mén)檻一下拉低到近乎沒(méi)有。

用戶想要體驗(yàn) AI 換臉,不再需要電腦、高性能 GPU、數(shù)據(jù)集、編程和 AI 知識(shí),只需要一部手機(jī),一張自拍,就可以把多種影視場(chǎng)景中主角的臉,換成自己的臉。

這是一種前所未有的體驗(yàn),而且效果雖然不能說(shuō)特別好,但通常情況下,都是相當(dāng)不錯(cuò)的,至少可以讓用戶有動(dòng)力發(fā)到朋友圈去顯擺一下。

燒自己的錢(qián),讓用戶爽,從這一點(diǎn)來(lái)說(shuō),ZAO 當(dāng)然有火的理由。當(dāng)然 ZAO 應(yīng)該也不缺錢(qián),畢竟背后是著名的公司:陌陌。

被質(zhì)疑的隱私問(wèn)題

當(dāng)然越火,質(zhì)疑聲就越大。

AI 換臉如此,ZAO 也是如此。現(xiàn)在 ZAO 面對(duì)的一些質(zhì)疑,就是當(dāng)初 deepfakes 出現(xiàn)的時(shí)候,曾經(jīng)面對(duì)的質(zhì)疑。

質(zhì)疑一是 " 版權(quán) " 之爭(zhēng);二是倫理道德之爭(zhēng)。

顯而易見(jiàn),deepfakes 是雙刃劍。這個(gè)簡(jiǎn)單的應(yīng)用可能會(huì)被居心叵測(cè)的用戶利用,從而制作各種色情、暴力甚至關(guān)乎政治的虛假視頻,一旦發(fā)生,后果可能非常嚴(yán)重。

這并非聳人聽(tīng)聞。而且不只是視頻,AI 還能 " 造假 " 聲音。斯坦福和普林斯頓大學(xué)等最新研究:給定任意文本,就能隨意改變一段視頻里人物說(shuō)的話。并且,改動(dòng)關(guān)鍵詞后人物口型還能對(duì)得奇準(zhǔn)無(wú)比,絲毫看不出篡改的痕跡,就像下面這樣:

蘋(píng)果今日收盤(pán)價(jià) 191 塊 4,改成 182 塊 2 你也看不出來(lái)。

讓新垣結(jié)衣向你表白,讓石原里美大聲喊出你的名字,甚至隨便根據(jù)某個(gè)人的視頻偽造個(gè)人陳述 …… 現(xiàn)在都不在話下。

手握這項(xiàng)技術(shù),在視頻中讓你怎么說(shuō)你就怎么說(shuō),讓你說(shuō)什么你就得說(shuō)什么,誰(shuí)也看不出來(lái)這是假的。對(duì),臉和聲音都是你的,而且有視頻,但一切都是假的。

另外,ZAO 也讓很多用戶有強(qiáng)烈的隱私擔(dān)心。

畢竟這是一個(gè)需要上傳人臉數(shù)據(jù)的應(yīng)用,而人臉作為生物識(shí)別信息,很多時(shí)候已經(jīng)成為我們的重要資產(chǎn)的密碼。

比方韭菜教育專家李笑來(lái)就在微博上說(shuō):"ZAO 可能很危險(xiǎn)的 … 別看你今天玩得開(kāi)心,過(guò)段時(shí)間就有可能你的支付寶被盜刷臉了?不過(guò)這事兒很難怪 ZAO,誰(shuí)讓你認(rèn)知淺薄了呢?"

還有 ZAO 用戶、隱私協(xié)議里的一些話,也被很多人拿出來(lái)質(zhì)疑。

比如上面這句,就被集火抨擊。

當(dāng)然還有人替 ZAO 著急,畢竟之前大火過(guò)的各種換臉應(yīng)用。基本上都難逃一陣風(fēng)的宿命,親愛(ài)的用戶們新鮮勁很快就過(guò)去了,保質(zhì)期可能都不到一個(gè)禮拜。

換臉背后的技術(shù)

ZAO 沒(méi)有公布背后的技術(shù)細(xì)節(jié),但 AI 換臉本質(zhì)上都是大同小異。

前幾天,有個(gè)國(guó)外的團(tuán)隊(duì)制作出毫無(wú)破綻的換臉視頻,同時(shí)也披露了背后的技術(shù)細(xì)節(jié)。那就是開(kāi)源項(xiàng)目:DeepFaceLab。

DeepFaceLab 是 Deepfakes 換臉術(shù)的一個(gè)軟件工具包,安裝簡(jiǎn)單,使用方便,更新及時(shí)。在 GitHub 上已有 5000 多星。

代碼公開(kāi)是一方面。另一方面,從項(xiàng)目描述看,不需要太多算力就能跑 ( 詳見(jiàn)下文 ) 。總體說(shuō)來(lái)門(mén)檻很低。

軟件包里有多種模型,各有特點(diǎn):

H64 ( 2GB+ 顯存 ) ,64 像素模式。這是經(jīng)典模型,DeepFakes 最初揚(yáng)名就是靠它。DeepFaceLab 對(duì)它做了些改進(jìn),讓這個(gè)模型在低顯存情況下也能用低配置參數(shù)運(yùn)行。

H128 ( 3GB+ 顯存 ) ,128 像素模型,比 H64 像素更高,細(xì)節(jié)更豐富。能應(yīng)對(duì)大部分遠(yuǎn)景和中景鏡頭,適合亞洲臉型。

DF ( 5GB+ 顯存 ) ,H128 的全臉模型。它換出來(lái)的臉通常比 H128 更像,但兼容性更差,邊緣問(wèn)題突出。

LIAEF128 ( 5GB+ 顯存 ) ,結(jié)合了 DF,IAE 的改進(jìn)型 128 全臉模型。這個(gè)模型存在閉眼識(shí)別問(wèn)題。

SAE ( 最低配置 2GB+,推薦配置 11GB+ ) ,風(fēng)格化的編碼器,基于風(fēng)格損失的新型超級(jí)模型。可以有效重建被遮擋的臉。可玩性高,參數(shù)可調(diào),調(diào)優(yōu)空間大。

DeepFaceLab 唯一的安裝要求就是對(duì)應(yīng)版本的顯卡驅(qū)動(dòng),甚至不需要 CUDA 和 CuDNN。

軟件的中文官網(wǎng)提供了下載通道 ( 有無(wú)需魔法的百度網(wǎng)盤(pán)版本 ) ,以及詳細(xì)的安裝教程。

同時(shí)還自帶許多人臉圖片數(shù)據(jù)。

官網(wǎng)說(shuō),DeepFaceLab 雖然沒(méi)有可視化界面,但步驟非常清晰,操作并不復(fù)雜。

換臉主要分為五個(gè)階段:

視頻轉(zhuǎn)圖片、提取臉部、訓(xùn)練模型、人臉替換、合成視頻。

每個(gè)步驟只需點(diǎn)擊 BAT 文件即可執(zhí)行。

想要入門(mén) AI 換臉的小伙伴,也可以在 DeepFaceLab 中文官網(wǎng)找到豐富的教程:

https://www.deepfakescn.com/

雖然,DeepFaceLab 描述的硬件要求不高,但 ctrl shift face 能做到今天的效果,背后很可能有貴貴的 GPU 在燃燒 ( 盡管沒(méi)披露技術(shù)細(xì)節(jié),不知道有沒(méi)有改進(jìn)算法 ) 。

自學(xué)換臉配置指南

最后,貼一個(gè)量子位之前就發(fā)過(guò)的指南。如何才能自己動(dòng)手搞 AI 換臉。

目前網(wǎng)上已經(jīng)有 fakeapp、faceswap、deepfacelab 等一大批現(xiàn)成換臉軟件,只要有夠強(qiáng)的硬件,你也能自制一段換臉視頻。

這些軟件都一個(gè)基本要求,就是必須支持英偉達(dá)的 CUDA。

通俗地說(shuō),如果你最近幾年為了玩吃雞這類(lèi)游戲配置了一臺(tái) PC,而且安裝的是英偉達(dá)的獨(dú)立顯卡,那么運(yùn)行 Deepfakes 應(yīng)該是沒(méi)問(wèn)題的。

根據(jù)國(guó)外網(wǎng)友的實(shí)測(cè)效果,要運(yùn)行 fakeapp 且電腦不崩潰,至少需要以下配置:

至少有 2GB 顯存的英偉達(dá) GPU

英特爾 i3 或者 AMD 9 處理器

8GB 內(nèi)存

20GB 剩余硬盤(pán)空間

以上只是最低的配置,制作一個(gè)換臉視頻可能需要幾天才行,是不是感到電費(fèi)在燃燒?如果為了省事中途截?cái)啵Ч麜?huì)慘不忍睹。

去年科技媒體 The Verge 的記者還真試了一把,她的電腦給人換臉大概需要一天的時(shí)間,如果只訓(xùn)練幾個(gè)小時(shí),結(jié)果根本沒(méi)法看:

從電腦屏幕上來(lái)看,訓(xùn)練過(guò)程是這樣的:

如果你不想每天早晨打開(kāi)電腦都看到上面的畫(huà)面,那么我們推薦以下配置,它能講訓(xùn)練時(shí)間縮短到只有幾個(gè)小時(shí):

至少 4GB 顯存的英偉達(dá) GPU(GTX 9 系或者更高,多數(shù)網(wǎng)友推薦 GTX 1060 6GB 顯存,售價(jià) 1699 元)

英特爾 i5 或 AMD Ryzen 處理器(以 i5-8400 為例,售價(jià) 1599 元)

12GB 內(nèi)存(購(gòu)買(mǎi) 2 條 8GB 內(nèi)存,總價(jià) 700 元)

100GB 剩余硬盤(pán)空間(考慮到其他占用空間,購(gòu)買(mǎi) 250GB 固態(tài)硬盤(pán),價(jià)格大約 300 元)

以上只是主要部件的價(jià)格,再加上主板、電源、機(jī)箱,總的主機(jī)(不包括顯示器)價(jià)格區(qū)間在 5000~6000 元之間。

需要注意的是,在這里,硬盤(pán)空間比硬盤(pán)讀寫(xiě)速度更重要。

因?yàn)橛?xùn)練 Deepfake 過(guò)程中大約每分鐘會(huì)產(chǎn)生 1GB 的圖像文件,通常 SSD 的空間較小,如果被訓(xùn)練數(shù)據(jù)占滿,將會(huì)導(dǎo)致 SSD 性能下降。而機(jī)械硬盤(pán)的性能幾乎不受剩余空間影響,非常適合用在訓(xùn)練 Deepfake 中。

當(dāng)然,除了軟硬件條件,你還得準(zhǔn)備相應(yīng)的視頻素材。

最后友情提示,你自己準(zhǔn)備好軟硬件,也需要面臨最開(kāi)始提到的,錢(qián)的問(wèn)題。根據(jù) Deepfake 軟件要求的硬件配置和訓(xùn)練時(shí)間,換一次臉就需要燒掉至少一度電以上。

THE END
廣告、內(nèi)容合作請(qǐng)點(diǎn)擊這里 尋求合作
ai
免責(zé)聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表砍柴網(wǎng)的觀點(diǎn)和立場(chǎng)。

相關(guān)熱點(diǎn)

據(jù)小米MIUI官方,小米AI實(shí)驗(yàn)室AutoML團(tuán)隊(duì)就自動(dòng)化神經(jīng)架構(gòu)搜索(NAS)方面取得的成果,在近日首度接受了媒體公開(kāi)采訪。
人工智能
7月25日消息,阿里巴巴旗下半導(dǎo)體公司平頭哥正式發(fā)布玄鐵910(XuanTie910),稱玄鐵910目前業(yè)界性能最強(qiáng)的一款RISC-V處理器。
業(yè)界
AI+5G+IoT的組合,雖然打開(kāi)了語(yǔ)音芯片的新想象力。但是在這個(gè)邏輯里,未來(lái)能占據(jù)廣泛市場(chǎng)的芯片模式,絕不是今天智能音箱芯片的模樣。語(yǔ)音芯片本身,變化才剛剛開(kāi)始。
人工智能
困難重重的AI“辯味”。
人工智能
今天凌晨,一年一度的蘋(píng)果WWDC 19全球開(kāi)發(fā)者大會(huì)在美國(guó)圣何塞舉辦,蘋(píng)果更新了自家系統(tǒng)平臺(tái)macOS、iOS、watchOS、tvOS以及今年剛剛加入的iPadOS。
業(yè)界

相關(guān)推薦

1
3
主站蜘蛛池模板: 啦啦啦在线观看视频直播免费| √天堂中文官网在线| xxxxx69hd杨幂| 男人边吃奶边摸下边的视频| 手机看片一区二区| 亚洲美女大bbbbbbbbb| 麻豆成人精品国产免费| 天天综合天天色| 亚洲欧美日韩综合俺去了| 中文字幕日韩精品麻豆系列| 我要看WWW免费看插插视频| 免费看大黄高清网站视频在线| 97精品国产97久久久久久免费| 欧美交换乱理伦片在线观看| 国产999精品久久久久久| freeⅹxx69性欧美按摩| 模特侨依琳大尺度流出| 午夜一区二区免费视频| 亚洲精品短视频| 宝贝过来趴好张开腿让我看看| 亚洲精品动漫免费二区| 超清首页国产亚洲丝袜| 国语自产少妇精品视频| 九九这里只有精品视频| 精品亚洲成a人无码成a在线观看| 国内精品久久久久伊人av| 久久亚洲精品中文字幕| 残忍女王虐茎chinese| 国产性猛交╳XXX乱大交| eeuss在线播放| 欧美、另类亚洲日本一区二区 | 最近2019中文免费字幕| 免费在线观看黄网站| 日日夜夜嗷嗷叫| 日本人强jizz多人| 免费看污成人午夜网站| 高清一级毛片免免费看| 日本中文字幕有码视频| 免费a级黄色毛片| 欧美另类黑人巨大videos| 成年免费视频黄网站在线观看|