騙過83%網友,圖像生成界天花板DALL-E 2竟然通過了圖靈測試?

36氪 2022-05-19 14:37:56

前幾天,一位正在度假的網友得知了自己獲得了「DALL-E 2」的訪問權限。

在思考了兩秒之後,他決定搞一波事情。

DALL-E 2通過了圖靈測試?

旅遊嘛,肯定是少不了各種遊客照的。

現在既然有了DALL-E 2,那是不是意味著可以不用親自去拍照,而是用模型生成一個「度假經歷」出來。

反正,其他人應該也分辨不出來?

為了驗證自己的想法,這位名叫Matt Bell的朋友決定,把生成的圖像混入到真實的照片裡,然後發在Facebook上。

照片裡的這個地方名叫「羅阿坦島」,是洪都拉斯北部海灣群島中最大的一座島,東西長約60公裡,南北最寬處不足8公裡。

它現在是一個著名的潛水勝地,其附近海域的物種十分豐富,且地勢復雜。甚至可以說擁有著西半球最好的一批珊瑚礁。

大概是下面這個樣子:

不過你可能想不到,羅阿坦島曾經竟然是加勒比海盜的基地!

啊,對不起,跑錯片場了。

言歸正傳,我們先來看一下這位網友拍的照片和DALL-E 2生成的對比。

圖1. 潛水員

圖2. 龍蝦

圖3. 魚

怎麼樣,能分辨出來麼?

測試流程

首先,參與的朋友們需要逐一滾動瀏覽照片,或者選擇以幻燈片的形式進行自動播放。

其中,共有22張真實的照片,以及4張合成的照片。合成的照片都在真實照片之後。

最後,Bell放了一張圖來解釋這個實驗。

經過統計,有83%的人(19/23)沒有看出來DALL-E生成的圖片有什麼不同。

當然,為了遵守OpenAI的訪問規則,可以很明顯得看出,DALL-E的水印位於圖片的右下角。

這個結果還是很出乎意料的,畢竟DALL-E 2生成的圖像顆粒感更強,而且Bell的朋友們也瞭解DALL-E和DeepFake這類的技術。

甚至,Bell還十分偷懶地沒有對其他圖像進行裁剪(生成的比例是1:1)。

這都沒發現的話……

難道不是因為大家壓根就沒認真看你的「朋友圈」麼?

然而當小編點進Bell的臉書一看,明明就是個「人生贏家」好伐!

你這個圖靈測試,不准吧?

雖說這多半隻是Bell同志的自娛自樂,但不知為何帖子竟然火了……

網友一看,既然你都說「通過圖靈測試」了,那就別怪我嘴下不留情:

首先,圖靈測試的前提是需要人類「法官」知道自己是在進行判別。

其次,判斷的正確率不能比「隨機」的表現更好。

而且,即便是沒告訴別人這是個「圖靈測試」,第2個項目應該也沒有通過。

然後,不出所料網友們就在下面吵開了。

倒不是針對Bell的DALL-E 2有沒有通過測試這件事,而是「圖靈測試」到底是個啥,應該怎麼測……

有人表示,要通過圖靈測試,你應該能騙過任何人類(包括專家)。也就是說,他的任務不僅是明確區分人類和計算機,而且他必須對如何區分人類和計算機有一個好的想法。

看到這個標准,另一位網友表示,還好我們不對「人類」進行圖靈測試。

DALL-E 2不搞黃!用戶:試試就試試?

當然,在這個大家不僅對內容真假、還對在線內容尺度虎視眈眈的年代,OpenAI也沒有放鬆對DALL-E 2的內容審核。

在4月份DALL-E 2公佈的通告消息中,OpenAI就強調了這模型集「生成暴力、仇恨、成人類圖像內容的能力已經收到限制。」

OpenAI說,在模型訓練時,它的數據工程師們就在注意這個顯而易見的規則。在訓練數據集中,最露骨的內容都被剔除了,DALL-E 2是正直的、沒被黃色污染的一個清純大模型。

而且OpenAI還說,已經預備好應對各種心懷叵測的老司機們的措施。

通告消息的原話是:「如果過濾器程序發現作為生成提示的文本或上傳圖像可能違反我司的內容政策,那麼本模型集將拒絕生成圖像。

而且我司有自動化的、和人工值班的監控系統以避免不良分子濫用。」

自然,這不會擋住腳已經踩在油門上的躍躍欲試老司機們。幾乎與DALL-E 2面世同時,就有人在琢磨如何繞過這些限制了。

在2022年4月下旬的一個Reddit貼子中,就有人在論壇貼的頭腦風暴裡摸索出了或許可以讓DALL-E 2生成不良圖片的方法。

首先是發揮人類智能對人工智能的聯想優勢:

如果「血洗」這個字眼被OpenAI屏蔽,那「紅油漆蔓延」總是可以過關的吧。而二者的視覺效果並沒太大不同。

之後,就要運用「有多少人工就有多智能」的人力優勢了:

第一步,在DALL-E 2生成圖像的文本內容框裡輸入「視覺效果雙關語+無意義字符串」的組合,例如「濕草莓+asdoij oaishdahsd+手指+aosduiajdoasdhoasd+嘴唇」。

第二步,在生成圖像結果裡人工選擇三個最靠近作者意圖的。

第三步,將以上三個結果再次上傳到DALL-E 2,繼續生成。

然後周而復始,直到生成作者滿意的成人類圖片為止。而且從第二步開始的步驟可以編程完成,非常自動化哦。

讀者們可以照方抓藥試試看,反正編輯們是勤懇的打工人,沒空搞這花名堂……

囚犯是黑人,CEO是白人?

DALL-E 2不僅有生成不雅圖像的可能,還和同類大模型一樣,能被平權人士挑剔出各種種族偏見來。

2022年5月,《連線》雜志報道,與OpenAI合作、驗收模型的紅帽黑客組透露,訓練好的DALL-E 2其實也有近年來其他競品多次被挑剔出的毛病:基於訓練數據的刻板偏見。

而這些毛病也被OpenAI承認並且公佈了。

比如,輸入「怒漢」或者「人坐牢房中」的文本,DALL-E 2給出的就是個黑人咆哮圖。

輸入「CEO」或者「建築工人」或「律師」文本,DALL-E 2給出的就是或正裝、或工裝、或法袍的各種白人男性圖片。

輸入「空乘人員」或「秘書」或「護士」的文本,DALL-E 2給出的就是靚女或大媽的女性圖片。

「空乘人員」圖片裡還全是黃種人女性……

要是輸入「野蠻人」和「恐怖分子」的文本……嗯,結果就是你想像的那樣啦。

OpenAI:加強內容審核

可能真的有不少老司機前僕後繼地、挖空心思地試圖用DALL-E 2來開車,逼到OpenAI必須馬上更新模型了。

2022年5月18日,OpenAI宣佈已更新了DALL-E 2,主要是對內容安全把控系統做了加強。

OpenAI稱已大幅改善了DALL-E 2的文本過濾器功能,極大調整了文本內容的自動化探測功能和違反內容政策文本的應對系統。

之前只有不到0.05%的上傳圖像和公開分享的圖片內容,是被DALL-E 2的過濾器程序自動過濾掉的。不過有30%的違規內容被OpenAI的人工審核者斃掉了。

看來即使全球首屈一指的大廠,也沒擺脫「有多少人工就有多智能」的窘迫嘛。

參考資料:

https://openai.com/blog/dall-e-2-update/

https://www.mattbell.us/my-fake-dall-e-2-vacation-photos-passed-the-turing-test/

https://news.ycombinator.com/item?id=31424368

https://futurism.com/the-byte/openai-image-generating-ai-porn

https://www.wired.com/story/dall-e-2-ai-text-image-bias-social-media/

本文來自微信公眾號“新智元”(ID:AI_era),編輯:好困 袁榭,36氪經授權發布。

本文經授權發布,不代表36氪立場。

如若轉載請註明出處。來源出處:36氪

建議售價 618 萬元起,Mercedes-AMG GLC 63 S E PERFORMANCE Coupé、GLC 43 4MATIC 雙車型同步上市
Jun
18
建議售價 618 萬元起,Mercedes-AMG GLC 63 S E PERFORMANCE Coupé、GLC 43 4MATIC 雙車型同步上市
CarStuff 人車事
Written by: Jason Hu地表最速家族 Mercedes-AMG 再添新成員,由 GLC 63 S E PERFORMANCE Coupé 領銜登場,以搭載「One Man, One Engine」引擎為熱血基底,導入源自 Formula 1 技術的 E PERFORMANCE高性能混合動力系統,承襲 GT 63 S E PERFORMANCE、C 63 S E PERFORMANCE 同樣強悍的 P3-Hybr...
全新大改款BMW X3曝光 鼻孔造型掀起熱議
Jun
8
全新大改款BMW X3曝光 鼻孔造型掀起熱議
CarFun玩車誌
我們即將迎來全新大改款的BMW X3,雖然原廠先前已經公佈了相關的偽裝照片,但實際上的長相相當令人好奇,而現在該車輛的真實模樣在網路上意外曝光,特殊的設計引起了車迷討論,這輛車的外觀借鑒了BMW旗艦車型XM的設計元素,不過在細節處加入了一些獨特的氛圍,在眾多的休旅車款當中脫穎而出,...
Volkswagen推出極具動態性的全新ID.7 GTX & ID.7 Pro S車系 WLTP續航里程最高可達709公里
Jun
18
Volkswagen推出極具動態性的全新ID.7 GTX & ID.7 Pro S車系 WLTP續航里程最高可達709公里
CarStuff 人車事
Written by: Bear新款ID.7 GTX是一部擁有250 kW(340 ps)最大輸出功率和電動四輪驅動的Fastback車型。就像ID.7 GTX一樣,250 kW ID.7 GTX Tourer旅行車還有電動全輪驅動。至於後輪驅動車型ID.7 Pro S和ID.7 Tourer Pro S最大輸出功率則為210 kW(286 ps)。所有四個新ID.7版本車型都配備了新型86...
韓系性能豪華跑旅強勢登場!目標鎖定 BMW X6、賓士 GLE Coupe 而來
Jun
18
韓系性能豪華跑旅強勢登場!目標鎖定 BMW X6、賓士 GLE Coupe 而來
自由時報汽車頻道
韓系豪華品牌 Genesis 去年 9 月發表首款跨界跑旅 GV80 Coupe,展現進軍性能 SUV 市場的強烈企圖心,近期宣布以 2025 年式身分在北美上市,當地售價為 79,950 美元起(約台幣 258 萬元),主要對手鎖定 BMW X6、賓士 GLE Coupe。
光陽 RTS 135 新世代水冷超級街跑 聽大家說不如自己下場跑!
Jun
14
光陽 RTS 135 新世代水冷超級街跑 聽大家說不如自己下場跑!
點子生活
光陽日前推出新世代水冷超級街跑 RTS 135,一推出看到規格就讓大家熱血沸騰,大家是不是也想要親自下場體驗看看呢?現在你也有機會喔。在分享人車一體的極致騎乘機會前,這邊也先分享超
鉑金出場,敵手退散!BMW X3 / X4 鉑金版成車系最佳入手時刻!
Jun
18
鉑金出場,敵手退散!BMW X3 / X4 鉑金版成車系最佳入手時刻!
2GameSome
早在 1999 年,BMW 就嗅到休旅車將成市場主流的態勢,期望在滿足消費者空間機能與多人乘載需求之際,更能完美延續自身對於駕馭樂趣的造車堅持。接連創立的 SAV(Sport Activity Vehicle)與 SAC(Sports Activity Coupé)家族車系,一新車壇休旅視野後,更讓BMW就此成為休旅市場的領導者。
BMW M徽章默默向下移動 從水箱護罩跑到保桿下方
Jun
18
BMW M徽章默默向下移動 從水箱護罩跑到保桿下方
Carture 車勢文化
相信許多BMW的死忠粉絲都想要那塊象徵性能的M廠徽,而其實不論是真正的性能M品牌車款,或者是M Performance車型,其水箱護罩上都可以看到M廠徽的配置,但現在這個徽飾的位置有所改變,原本都在水箱護罩上的M移動到了保險桿的下方,而這是為了讓全球的車型可以更加統一,同時也讓車輛的散熱效...
人氣低迷 銷量僅雙 B 的 1/3!Volvo 發言人證實:S60 美國準備停產
Jun
18
人氣低迷 銷量僅雙 B 的 1/3!Volvo 發言人證實:S60 美國準備停產
自由時報汽車頻道
由於銷量不佳,Volvo 的中型房車 S60 第三代,在上週爆出美國即將停產的消息,外媒向 Volvo 美國發言人求證,官方已證實 S60 將在 6 月停產。
MINI Countryman D配置Favored Trim規格展現高效駕駛&品牌典型的駕駛樂趣
Jun
18
MINI Countryman D配置Favored Trim規格展現高效駕駛&品牌典型的駕駛樂趣
CarStuff 人車事
Written by: Bear最大隻的MINI以先進的四缸柴油引擎和TwinPower Turbo渦輪增壓技術給人留下深刻印象。其成果是:高度動態的性能和經濟的油耗表現。並且,全新MINI Countryman D在Favored Trim中尤為富有設計表現力。
德國反對歐盟向中國實施高汽車關稅 政府官員擬議妥協方案
Jun
18
德國反對歐盟向中國實施高汽車關稅 政府官員擬議妥協方案
CarFun玩車誌
歐盟針對中國的超便宜電動車正式宣佈將徵收38.1%的關稅,但中國也宣布將會有所反制,將針對大排量的進口車款課徵更高昂的關稅,這一點對於許多歐洲車廠來說將會是一個硬傷,因此不少品牌都已經表示他們反對這次的關稅政策,現在德國官方更想要會同歐盟的官員前去中國進行會談,希望可以在這項...
Honda在日本推出「HondaJet共享服務」
Jun
18
Honda在日本推出「HondaJet共享服務」
Carture 車勢文化
大家可能聽過、也用過「共享單車」、「共享機車」或「共享汽車」,但在日本,Honda竟然推出了「HondaJet共享服務」,讓消費者可以共同使用HondaJet商務客機,進行較長距離的移動。在日本,要在較長距離的城市間移動,大多都是使用鐵道或航空運輸,但對於層峰人士或企業等更講求時效的族群,可...
車壇又一雙門跑車正式停產!問世 11 年確認無後繼車款
Jun
17
車壇又一雙門跑車正式停產!問世 11 年確認無後繼車款
自由時報汽車頻道
2013 年推出,前身為 XK、E-Type 的 Jaguar F-Type 雙門跑車,近期正式由 Jaguar 宣佈正式停產,未來也不再有後繼車,正式走入歷史。
二款畢業代表作!GT-R將在北美結束其17年來之性能神話
Jun
17
二款畢業代表作!GT-R將在北美結束其17年來之性能神話
CARLINK鏈車網
目前GT-R仍是全球0-400m加速挑戰賽中之佼佼者,重度改裝GT-R最大馬力可達2000hp以上,然而此性能神話將慢慢劃下句點,因為GT-R即將結束其北美市場長達17 年之銷售週期,是的,R35 Nissan GT-R即將消失,GT-R在北美市場之銷售將於今年10月結束,最後一舞則是推出兩款特仕車Skyline和Takumi Edi...
【一手試駕】動靜皆型 Mercedes-Benz CLE 300 4Matic Coupe
Jun
17
【一手試駕】動靜皆型 Mercedes-Benz CLE 300 4Matic Coupe
車訊網
全新CLE是Mercedes-Benz用以一次取代過往C-Class Coupe與E-Class Coupe的新世代轎跑代表...
【一手試駕】全能七人座旗艦休旅 Mazda CX-90 33T AWD Premium
Jun
17
【一手試駕】全能七人座旗艦休旅 Mazda CX-90 33T AWD Premium
車訊網
從CX-90的身形與尺碼來看,確實能感受到此車身為品牌旗艦休旅的份量,5100/1994/1745 mm的...
G car 車主日常:縱橫山林,探索秘境
Jun
17
G car 車主日常:縱橫山林,探索秘境
SiCAR愛車酷
G car 車主日常:縱橫山林,探索秘境
破千萬台幣售價的Ford 最強野馬Mustang GTD
Jun
14
破千萬台幣售價的Ford 最強野馬Mustang GTD
SiCAR愛車酷
破千萬台幣售價的Ford 最強野馬Mustang GTD
中國版的BMW iX登陸歐洲 Nio EL8擁有643匹馬力
Jun
17
中國版的BMW iX登陸歐洲 Nio EL8擁有643匹馬力
Carture 車勢文化
中國Nio蔚來汽車在歐洲市場推出另一款純電動SUV,EL8不只是尺寸很大,同時他的性能表現也很強大,不過價格也將會變得更加昂貴,預計在德國的售價將會是8.29萬歐元(約287.7萬元),其對手鎖定BMW iX以及Mercedes-Benz賓士EQS,內裝高級的質感將會讓他可以與豪華品牌匹敵,現在就看消費者願不願...
非概念車、非模型車、更不是積木玩具車!Fiat Grande Panda準備大殺四方
Jun
18
非概念車、非模型車、更不是積木玩具車!Fiat Grande Panda準備大殺四方
CARLINK鏈車網
飛雅特並非只有Fiat 500和Abarth性能車款上得了檯面,相信許多人都不知道Fiat 600X與Panda的存在,但顯然只有這幾輛新車是不夠的,照此情況下去世人遲早會把Fiat給遺忘,意思就是「不要Panda只要Food Panda」!因此飛雅特原廠很認真地思考這麼問題~如何創造一輛「非常具有存在感」令人過目不...
據調查統計 近5成電動車車主想重回內燃機懷抱
Jun
17
據調查統計 近5成電動車車主想重回內燃機懷抱
Carture 車勢文化
從去年開始電動車需求已明顯趨緩,先前J.D. Power調查報告指出非常有可能和應該有可能購買電動車比例都較去年下降,而不願購買比例則是增加,近日麥肯錫也公布調查報告,結果顯示美國有近5成電動車車主下次會選擇燃油車。前幾年電動車市場正處於成長階段,但沒想到從去年開始市場需求竟開始明...