Tumblr掃黃正式開始!AI鑒黃也許是老司機們的頭號敵人

人工智能
2018
12/19
12:59
機器之心
分享
評論

大家喜聞樂見的 Tumblr(湯不熱)涼了……

12 月初,美國著名圖片博客網站 Tumblr 宣布將全面禁止任何成人內容。新規定將于 12 月 17 日正式施行。這一行為看來是主動在和「互聯網的 30% 流量」說再見,長久混跡 Tumblr 的老司機們送了一首「涼涼」予它。

自 2007 年上線以來,Tumblr 一直以允許 NSFW 內容而聞名(也可能是臭名昭著),這是公司管理層一時的頭腦發熱還是想要「改過自新」了?不論 Tumblr 的意圖如何,想要為社交網絡加入審核機制,過濾色情圖片/視頻是需要投入技術和人力的。

在 Tumblr 的官方通告中,公司 CEO Jeff D’Onofrio 表示,「……(Tumblr) 將采用產業標準的機器監控、不斷加大的人類監控等方式禁止成人內容。」

但是,才「睜開眼睛」的計算機并不那么完美。」Wired 在近日的一篇文章中稱。許多 Tumblr 用戶在 Twitter 上抱怨其鑒別系統存在許多誤判行為。如據 Wired 文章,奧克拉荷馬大學法學院教授 Sarah Burstein 只是發布了幾張設計專利圖,就被標記了。文章表示這不僅效率低下,而且傷害了用戶的感情。不少 Tumblr 的用戶失望地涌向推特,《紐約時報》稱這些用戶是「棄船而逃」。

其實在多年前,Tumblr 就面臨著準確識別 NSFW 內容的問題。2013 年,Yahoo 11 億美元收購 Tumblr,4 年后 Verizon 收購雅虎,Tumblr 歸于 Verizon 子公司 Oath,并在不久之后推出了「安全模式」,能在搜索結果中自動過濾成人內容。

人工智能雖然可以同時處理大量圖片,但畢竟不是人類,難免會出現一些令人哭笑不得的差錯。特別像 Tumblr 這樣的微博客平臺,用戶群體復雜,色情與非色情的界限非常難以把握。圖普科技產品運營總監姜澤榮表示,「(這樣的平臺在制定標準時)標準過嚴可能會把攝影作品、藝術作品之類的內容識別為色情內容,傷害用戶體驗;標準過低則會讓平臺上的色情內容繼續泛濫。此外平臺上的內容類型繁多,包含文字、圖片、視頻、直播等,各個類型的內容實時性不一,審核標準差異大,這無疑都對開發、運營等團隊提出高要求。」

圖普科技是國內較早使用深度學習技術提供圖像和視頻內容審核服務的 AI 創業公司。在平臺色情內容審核等問題上,圖譜向機器之心解釋了一些問題。

圖像鑒黃系統流程是什么?

鑒黃系統的工作流程是這樣的:首先是要建模,其次是制定色情圖片的分類標準,然后收集大量素材,進行分類標注,最后用這些標注好的素材進行訓練,讓機器去學習各個分類里面的特征,不斷調整自己模型的參數并最終得到最佳的識別模型。

而當機器對圖像進行識別以后,這些圖像數據會轉化為數字化的信息,帶入到模型里面進行計算, 根據計算值將圖片標注為「正常、性感、色情」三個類別。

因為「識別」的不完美性,這樣的系統也會有人類的參與。在經過識別之后,系統把判斷結果和概率告訴使用方,使用方會再根據結果做對應處理,比如自動刪除、或者人工接入復審。如果在人工復核環節發現機器識別有誤,則會有針對性地對相同場景的圖片進行數據學習, 并調整參數, 直到錯誤率達到最低值。

AI 鑒黃的技術核心是深度學習理論(Deep Learning)。通俗來講,可以把深度學習理解為一個空白的大腦,海量數據就是灌輸進來的經驗。當我們把大量的色情、性感、正常的樣本的屬性告訴深度學習的引擎,讓引擎不斷學習,然后把他們做對的進行獎勵,做錯的就懲罰,當然這些獎勵和懲罰都是數學上的,最后空白的腦袋就會學成了一種連接的模型,這種模型就是為了鑒別色情與非色情而生的。

深度學習就是人工神經網絡(Artificial Neural Network,以下簡稱 ANN)。要了解 ANN,讓我們先來看看人類的大腦是如何工作的。

人腦的視覺處理系統(圖片來源:Simon Thorpe)

上圖表示人理解外界視覺信息的過程。從視網膜(Retina)出發, 經過低級的 V1 區提取邊緣特征,到 V2 區的基本形狀或目標的局部,再到高層的整個目標(如判定為一張人臉),以及到更高層的 PFC(前額葉皮層)進行分類判斷等。也就是說高層的特征是低層特征的組合,從低層到高層的特征表達越來越抽象和概念化,也即越來越能表現語義或者意圖。

深度學習恰恰就是通過組合低層特征形成更加抽象的高層特征(或屬性類別),然后在這些低層次表達的基礎上通過線性或者非線性組合,來獲得一個高層次的表達。此外,不僅圖像存在這個規律,聲音也是類似的。

現在來看深度學習的簡易模型。

傳統的神經網絡與深度神經網絡(圖片來源網絡)

深度學習的一個主要優勢在于可以利用海量訓練數據(即大數據),在學習的過程中不斷提高識別精度,但是仍然對計算量有很高的要求。而近年來,得益于計算機速度的提升、大規模集群技術的興起、GPU 的應用以及眾多優化算法的出現,耗時數月的訓練過程可縮短為數天甚至數小時,深度學習才逐漸可用于工業化。

對于開發團隊來說,做該領域的產品困難在于如何獲取大規模已標注數據、集成有 GPU 的計算集群以及針對自己的項目調參數,團隊需要不斷地輸入新數據,持續迭代以提高機器識別準確率。

既有圖片又有視頻怎么辦?

在短視頻流行的今天,各家科技公司還要面對海量的視頻內容。圖片是靜態的,視頻/直播是動態的,而視頻內容的完整審核包括對圖片、文字、語音的審核,所以會更加復雜。以對視頻圖片審核為例,在鑒別視頻和直播時,可以先把動態的內容解碼成圖片幀,這就與靜態圖片鑒別方法相似了。

直播實時性強,對響應時間要求高,并且里面的場景和人物變化比較大,審核要求比較嚴格,所以識別難度會相對比較大,需要實時不斷對房間進行截幀傳輸識別,并且結合人工來實現預警處理;視頻在畫質整體上比圖片和直播差,一定程度會影響識別效果,通常是以視頻為單位進行等時間間隔截圖,以一個視頻多張截圖的結果來綜合判斷視頻是否色情違規。

如果企業對視頻或直播的每一幀圖片都進行識別,數據量將變得非常巨大,運營成本會很高。面對這類情況,一般會采用對視頻抽幀的方式進行處理。例如,一分鐘視頻,可以按照時間段來抽取 6-15 幀左右的圖片進行識別處理,以此減少計算成本。

審核能否完全依賴機器?

針對人們屢屢吐槽的「誤殺」問題,圖譜認為在提高 AI 算法準確度的同時目前還需依靠人類做最后的判斷。誤判分為兩大類型:把色情內容誤判為正常內容,以及把正常內容誤判為色情內容。

1)色情判正常:在光線昏暗場景,或者距離很遠時背景干擾比較大的場景下,以及有特效干擾的情況都有可能造成誤判;衣著正常但實際上露點、隱晦的動作和姿勢等。

2)正常判色情:穿著暴露但實際沒露點,物體形似性器官,接近于色情動作但實際不是(譬如手抓棍狀物體、手正常放在敏感部位)等。

機器能夠幫助企業大幅提升審核效率和準確率。以圖普科技的鑒黃系統為例,每天可審核近 10 億張圖片,識別準確率高于 99.5%,可為企業節省 95% 以上的審核人力。但在現階段甚至很長一段時間內,人工智能鑒黃無法完全代替人工鑒黃。因為機器還很難理解內容背后的深意,也不會在不同文化場景中做自由切換。所以推薦以機器+人工的審核方法。

單純的算法和模型是可以把機器訓練到完全正確地判斷情況的,但是在實際應用中,機器沒有自主思考和自己的主觀意識,仍然需要人工輔助進行確認。例如客戶提供的畫面過于模糊或者說光線過暗,以及訓練數據的不能完全覆蓋性等種種客觀原因影響下,機器打不出很高的分確認圖片,這都需要人工來輔助。

「Tumblr 網友:即使這樣我也愛你。」

看來,AI 圖像識別系統可以用現有的,「鑒黃師」則非請不可。在宣布禁止成人內容之后,Tumblr 的 app 終于再次出現在蘋果應用商店里。這輛車最終會開向何處?讓我們拭目以待。

【來源:機器之心】

THE END
廣告、內容合作請點擊這里 尋求合作
ai
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

2017年,以斯坦福大學為首、包括吳恩達、李開復等一眾大咖專家團隊齊力打造的人工智能指數(AI Index)重磅年度報告首次發布。從學術、業界發展、政府策略等方面對全年的人工智能全球發展進行了回顧,堪稱...
人工智能
一大早,朋友給我發來一條騰訊AI進軍農業的新聞。發完新聞,他感嘆說:“你看看這國內科技公司和國外科技公司的差距有多大。國外的AI都被用到了航空、機器人這些高大上的領域,而國內公司鼓搗的盡是一些養...
人工智能
人工智能未來會輔助人類還是替代人類?這是個問題。
人工智能
目前,大數據滲透到各行各業,生產服務、工作生活和衣食住行數字化的場景比比皆是。物聯網已被廣泛應用于智能城市、智能醫療、智能家居、智能物流和智慧農業等領域。
人工智能
人們越來越多地要求像Alexa這樣的虛擬助手,仰望天空,看看你是否需要一把雨傘,他們這樣做可能是明智之舉。AI方法功能強大 , 能夠分析天體物理數據,檢測腫瘤或幫助控制糖尿病。一種分析購物模式的算法...
人工智能

相關推薦

1
3
主站蜘蛛池模板: 欧美日韩第三页| 久久久久无码中| 91资源在线播放| 成年无码av片在线| 亚洲午夜电影一区二区三区| 精品久久久久久无码人妻蜜桃| 国产精自产拍久久久久久蜜| 久久精品国产69国产精品亚洲 | 亚洲欧美日韩国产精品一区| 高清一级毛片免免费看| 少妇愉情理伦片丰满丰满| 亚洲国产精品毛片AV不卡在线| 看国产一级毛片| 国产无遮挡又黄又爽在线视频| 99久久免费精品视频| 幻女free性zozozoxxxxx| 亚洲国产成人久久综合区| 男女超爽视频免费播放| 国产精品入口麻豆电影网| h在线观看视频免费网站| 把她抵在洗手台挺进撞击视频| 久久这里只精品| 百合潮湿的欲望| 四虎影院海外永久| 6080夜福利| 天天舔天天射天天干| 中文字幕亚洲欧美在线不卡| 欧美性色黄大片www| 人人爽人人爽人人爽人人片av| 麻绳紧缚奴隷女囚| 在我跨下的英语老师景老师| 久久国产欧美日韩精品| 没带罩子让他c一节课| 国产亚洲欧美日韩精品一区二区| 99热这里有免费国产精品| 日本一道综合久久aⅴ免费| 亚洲欧洲国产经精品香蕉网| 老子影院午夜伦手机不卡6080| 亚洲乱码无限2021芒果| 精品午夜福利1000在线观看| 国产欧美日韩精品第一区|