騙過83%網友,圖像生成界天花板DALL-E 2竟然通過了圖靈測試?

36氪 2022-05-19 14:37:56

前幾天,一位正在度假的網友得知了自己獲得了「DALL-E 2」的訪問權限。

在思考了兩秒之後,他決定搞一波事情。

DALL-E 2通過了圖靈測試?

旅遊嘛,肯定是少不了各種遊客照的。

現在既然有了DALL-E 2,那是不是意味著可以不用親自去拍照,而是用模型生成一個「度假經歷」出來。

反正,其他人應該也分辨不出來?

為了驗證自己的想法,這位名叫Matt Bell的朋友決定,把生成的圖像混入到真實的照片裡,然後發在Facebook上。

照片裡的這個地方名叫「羅阿坦島」,是洪都拉斯北部海灣群島中最大的一座島,東西長約60公裡,南北最寬處不足8公裡。

它現在是一個著名的潛水勝地,其附近海域的物種十分豐富,且地勢復雜。甚至可以說擁有著西半球最好的一批珊瑚礁。

大概是下面這個樣子:

不過你可能想不到,羅阿坦島曾經竟然是加勒比海盜的基地!

啊,對不起,跑錯片場了。

言歸正傳,我們先來看一下這位網友拍的照片和DALL-E 2生成的對比。

圖1. 潛水員

圖2. 龍蝦

圖3. 魚

怎麼樣,能分辨出來麼?

測試流程

首先,參與的朋友們需要逐一滾動瀏覽照片,或者選擇以幻燈片的形式進行自動播放。

其中,共有22張真實的照片,以及4張合成的照片。合成的照片都在真實照片之後。

最後,Bell放了一張圖來解釋這個實驗。

經過統計,有83%的人(19/23)沒有看出來DALL-E生成的圖片有什麼不同。

當然,為了遵守OpenAI的訪問規則,可以很明顯得看出,DALL-E的水印位於圖片的右下角。

這個結果還是很出乎意料的,畢竟DALL-E 2生成的圖像顆粒感更強,而且Bell的朋友們也瞭解DALL-E和DeepFake這類的技術。

甚至,Bell還十分偷懶地沒有對其他圖像進行裁剪(生成的比例是1:1)。

這都沒發現的話……

難道不是因為大家壓根就沒認真看你的「朋友圈」麼?

然而當小編點進Bell的臉書一看,明明就是個「人生贏家」好伐!

你這個圖靈測試,不准吧?

雖說這多半隻是Bell同志的自娛自樂,但不知為何帖子竟然火了……

網友一看,既然你都說「通過圖靈測試」了,那就別怪我嘴下不留情:

首先,圖靈測試的前提是需要人類「法官」知道自己是在進行判別。

其次,判斷的正確率不能比「隨機」的表現更好。

而且,即便是沒告訴別人這是個「圖靈測試」,第2個項目應該也沒有通過。

然後,不出所料網友們就在下面吵開了。

倒不是針對Bell的DALL-E 2有沒有通過測試這件事,而是「圖靈測試」到底是個啥,應該怎麼測……

有人表示,要通過圖靈測試,你應該能騙過任何人類(包括專家)。也就是說,他的任務不僅是明確區分人類和計算機,而且他必須對如何區分人類和計算機有一個好的想法。

看到這個標准,另一位網友表示,還好我們不對「人類」進行圖靈測試。

DALL-E 2不搞黃!用戶:試試就試試?

當然,在這個大家不僅對內容真假、還對在線內容尺度虎視眈眈的年代,OpenAI也沒有放鬆對DALL-E 2的內容審核。

在4月份DALL-E 2公佈的通告消息中,OpenAI就強調了這模型集「生成暴力、仇恨、成人類圖像內容的能力已經收到限制。」

OpenAI說,在模型訓練時,它的數據工程師們就在注意這個顯而易見的規則。在訓練數據集中,最露骨的內容都被剔除了,DALL-E 2是正直的、沒被黃色污染的一個清純大模型。

而且OpenAI還說,已經預備好應對各種心懷叵測的老司機們的措施。

通告消息的原話是:「如果過濾器程序發現作為生成提示的文本或上傳圖像可能違反我司的內容政策,那麼本模型集將拒絕生成圖像。

而且我司有自動化的、和人工值班的監控系統以避免不良分子濫用。」

自然,這不會擋住腳已經踩在油門上的躍躍欲試老司機們。幾乎與DALL-E 2面世同時,就有人在琢磨如何繞過這些限制了。

在2022年4月下旬的一個Reddit貼子中,就有人在論壇貼的頭腦風暴裡摸索出了或許可以讓DALL-E 2生成不良圖片的方法。

首先是發揮人類智能對人工智能的聯想優勢:

如果「血洗」這個字眼被OpenAI屏蔽,那「紅油漆蔓延」總是可以過關的吧。而二者的視覺效果並沒太大不同。

之後,就要運用「有多少人工就有多智能」的人力優勢了:

第一步,在DALL-E 2生成圖像的文本內容框裡輸入「視覺效果雙關語+無意義字符串」的組合,例如「濕草莓+asdoij oaishdahsd+手指+aosduiajdoasdhoasd+嘴唇」。

第二步,在生成圖像結果裡人工選擇三個最靠近作者意圖的。

第三步,將以上三個結果再次上傳到DALL-E 2,繼續生成。

然後周而復始,直到生成作者滿意的成人類圖片為止。而且從第二步開始的步驟可以編程完成,非常自動化哦。

讀者們可以照方抓藥試試看,反正編輯們是勤懇的打工人,沒空搞這花名堂……

囚犯是黑人,CEO是白人?

DALL-E 2不僅有生成不雅圖像的可能,還和同類大模型一樣,能被平權人士挑剔出各種種族偏見來。

2022年5月,《連線》雜志報道,與OpenAI合作、驗收模型的紅帽黑客組透露,訓練好的DALL-E 2其實也有近年來其他競品多次被挑剔出的毛病:基於訓練數據的刻板偏見。

而這些毛病也被OpenAI承認並且公佈了。

比如,輸入「怒漢」或者「人坐牢房中」的文本,DALL-E 2給出的就是個黑人咆哮圖。

輸入「CEO」或者「建築工人」或「律師」文本,DALL-E 2給出的就是或正裝、或工裝、或法袍的各種白人男性圖片。

輸入「空乘人員」或「秘書」或「護士」的文本,DALL-E 2給出的就是靚女或大媽的女性圖片。

「空乘人員」圖片裡還全是黃種人女性……

要是輸入「野蠻人」和「恐怖分子」的文本……嗯,結果就是你想像的那樣啦。

OpenAI:加強內容審核

可能真的有不少老司機前僕後繼地、挖空心思地試圖用DALL-E 2來開車,逼到OpenAI必須馬上更新模型了。

2022年5月18日,OpenAI宣佈已更新了DALL-E 2,主要是對內容安全把控系統做了加強。

OpenAI稱已大幅改善了DALL-E 2的文本過濾器功能,極大調整了文本內容的自動化探測功能和違反內容政策文本的應對系統。

之前只有不到0.05%的上傳圖像和公開分享的圖片內容,是被DALL-E 2的過濾器程序自動過濾掉的。不過有30%的違規內容被OpenAI的人工審核者斃掉了。

看來即使全球首屈一指的大廠,也沒擺脫「有多少人工就有多智能」的窘迫嘛。

參考資料:

https://openai.com/blog/dall-e-2-update/

https://www.mattbell.us/my-fake-dall-e-2-vacation-photos-passed-the-turing-test/

https://news.ycombinator.com/item?id=31424368

https://futurism.com/the-byte/openai-image-generating-ai-porn

https://www.wired.com/story/dall-e-2-ai-text-image-bias-social-media/

本文來自微信公眾號“新智元”(ID:AI_era),編輯:好困 袁榭,36氪經授權發布。

本文經授權發布,不代表36氪立場。

如若轉載請註明出處。來源出處:36氪

Toyota 插電式油電名稱全球終於統一!北美 Prius 與 RAV4 比照辦理
Sep
27
Toyota 插電式油電名稱全球終於統一!北美 Prius 與 RAV4 比照辦理
自由時報汽車頻道
針對不同市場,Toyota 的插電式油電混合動力名稱也會有所不同,但 Toyota 決定將名稱統一,將取消在北美 Toyota 插電式混合動力車的 Prime 名稱,比照歐洲、日本,使用 PHEV 的名稱。
Toyota新年式Sienna提升兒童安全 內建吸塵器、冰箱更便利
Sep
18
Toyota新年式Sienna提升兒童安全 內建吸塵器、冰箱更便利
CarFun玩車誌
台灣市場是全球少數地區,同時擁有Toyota Sianta、Sienna以及Alphard三款不同級距及用途的MPV車款,現在於北美市場針對Sienna推出了2025年式更新,該車款將配備一項全新的安全技術,其用意在防止兒童被意外留在車內的悲劇發生,這項技術名為「後座提醒系統」,當車輛檢測到後座上有乘客且駕駛...
明年回歸 Honda 經典跑車還能更熱血!日媒爆有手排選項
Sep
27
明年回歸 Honda 經典跑車還能更熱血!日媒爆有手排選項
自由時報汽車頻道
自從在去年 2023 東京移動展,推出全新概念跑車 Prelude Concept,並且已著手實現 Prelude Concept 量產,讓 Honda 本質迷興奮不已,日媒更透露最新消息,Prelude 除了有 CVT 變速箱,Honda 還打算為它增加油電動力匹配手排變速箱的選項,最快 2025 年下半年會亮相。
角田裕毅抵達台灣! RED BULL 冠軍賽車 RB8 經典V8引擎即刻Fire Up!
Sep
27
角田裕毅抵達台灣! RED BULL 冠軍賽車 RB8 經典V8引擎即刻Fire Up!
CarStuff 人車事
Written by: Jason HuF1 一級方程式賽車 日本籍現役賽車手角田裕毅 (Yuki Tsunoda) 於昨天深夜搭機飛抵台灣,今天立即在 Red Bull Showrun 車庫現身,與充滿傳奇色彩的冠軍車 RB8 合體,並與來自英國的技師團隊進行最後測試,現場正式點燃經典 V8 引擎。首次造訪台灣的角田裕毅表示,「期待明...
以輕奢越野之姿吹起反攻號角,2025 Ford Kuga ACTIVE 1.5 EcoBoost
Sep
27
以輕奢越野之姿吹起反攻號角,2025 Ford Kuga ACTIVE 1.5 EcoBoost
CarStuff 人車事
Written by: Jason Hu現行 Kuga 自 2019 年上市以來已經在市場上征戰了 4 年之久,在面對眾多中型休旅車的夾擊之下縱使不斷的推出新年式樣來維持競爭力,但新鮮感逐漸消退卻是事實,加上 MG 等主打 C/P 值的品牌加入戰局,更讓 Kuga 的銷售表現更為險峻。
能在三排休旅市場中從容應戰嗎?|Kia 小改款 Sorento 試駕
Sep
27
能在三排休旅市場中從容應戰嗎?|Kia 小改款 Sorento 試駕
2GameSome
說到讓 Kia 於國內市場成功闖出一片天的重要功臣,Sorento 絕對是其中之一,三排座加上豐富多元的座椅佈局選擇,作為中大型旗艦而言,本車確實奠定了 Kia 在家庭休旅市場的重要地位。
紐北最速野獸竟然也有一『軟』?!可攻可守的夢幻旅行車!|BMW M3 Competition Touring新車試駕
Sep
27
紐北最速野獸竟然也有一『軟』?!可攻可守的夢幻旅行車!|BMW M3 Competition Touring新車試駕
Go車誌 Video
M3 Competition Touring為BMW M3車系中首次出現的旅行車車款,它搭載了BMW M TwinPower Turbo 直列六缸汽油引擎創造出510匹的最大馬力,創下紐北最速旅行車的紀錄!而今天嘉偉哥要試駕小改款前的BMW M3 Competition Touring。BMW M3 Competition Touring的建議售價是615萬,小改款後的預售價...
保時捷964心臟被摘除 裝入意想不到的異種科技
Sep
27
保時捷964心臟被摘除 裝入意想不到的異種科技
三立新聞網 setn.com
KALMAR Automotive近期推出了一款獨特的電動改裝車KALMAR 7-97 E-Volt,這款車型是基於經典的氣冷世代保時捷911(代號964)進行改裝,搭載了特斯拉Model S的電動動力單元,將經典與現代科技完美結合,為車迷呈現前所未見的駕馭體驗。
華麗盛宴 Cadillac Opulent Velocity
Sep
27
華麗盛宴 Cadillac Opulent Velocity
車訊網
Cadillac凱迪拉克在北美與中國市場可以說是持續蓬勃發展,其中掛上V名號的車款更是性能的保證...
電驅極限 Rimac Nevera R
Sep
27
電驅極限 Rimac Nevera R
車訊網
Rimac推出了全新的Nevera R,不僅有著更具侵略感的造型,動力系統、操控表現都更勝以往...
RAEC後方自動緊急煞車系統超有用,但請勿以「肉身」試法、雷達設計跟你想的不一樣!
Sep
26
RAEC後方自動緊急煞車系統超有用,但請勿以「肉身」試法、雷達設計跟你想的不一樣!
CARLINK鏈車網
IIHS是美國高速公路安全保險協會,專門研究車輛的各種安全設計,不只有各種嚴苛的撞擊測試,目前對於車輛的主動安全設計更是觀察入微,因為這牽扯到保險金的制訂與理賠。根據IIHS的調查研究,近年來「車尾撞擊事故」比例有上升趨勢,一大原因在於休旅車當道,因此車輛體積越來越龐大、車身也...
2025 BMW 4 Series Gran Coupe、i4油電雙雄小改款出擊!四車型陣容、售價263萬起!
Sep
26
2025 BMW 4 Series Gran Coupe、i4油電雙雄小改款出擊!四車型陣容、售價263萬起!
Yahoo奇摩汽車機車
延續傳統豪華品牌電動車領先地位,今年BMW已售出超過18萬輛純電車款,不只佔全車系銷售比例近16%,在台灣純電車款的銷售比例更高達33%,遠超過全球其他市場表現,因此BMW也決定趁勢強化純電潮流,在今日(9/26)以油、電同步出擊之姿,宣布全新小改款BMW 4 Series Gran Coupé四門跑車與BMW i4...
2025 Maserati GranCabrio Trofeo雅緻亮相!隨總代理臺灣蒙地拿台中展間開幕粉墨登場!
Sep
27
2025 Maserati GranCabrio Trofeo雅緻亮相!隨總代理臺灣蒙地拿台中展間開幕粉墨登場!
Yahoo奇摩汽車機車
由Maserati指標性車款GranTurismo衍生而來的全新雙門敞蓬GranCabrio正式抵達台灣,由總代理臺灣蒙地拿導入並隨著全新台中展示中心的開幕,宣告以Trofeo車型正式在台上市,GranCabrio的到來除了進一步地完善Maserati現有車系的版圖,全台首座以新世代品牌識別所打造的旗艦展示暨售服中心也以更...
經銷商疑似走漏消息來源!Lexus 最頂級休旅新增全新動力選項
Sep
26
經銷商疑似走漏消息來源!Lexus 最頂級休旅新增全新動力選項
自由時報汽車頻道
Lexus 最頂級休旅 LX 車系,因為過於熱賣,在日本已經停止接單,但這並沒影響 Lexus 繼續推出新車型,Lexus 美國經銷商疑似洩露比 LX600 更高等級的 LX700h 車型編成。
Toyota 秘密測試 600 匹大馬力引擎!新世代車款有望搭載
Sep
26
Toyota 秘密測試 600 匹大馬力引擎!新世代車款有望搭載
自由時報汽車頻道
Toyota 在今年 5 月底,宣布與 Mazda、Subaru 合作,開發適合電動化的新引擎。日媒在一場媒體活動上,看到一輛配置四缸引擎,輸出 592 匹馬力的 Lexus RC,根據 Toyota 工程師透露,期許這顆引擎能超越之前 Toyota 經典的
【新車試駕】國產SUV滿配天花板 小改款Ford Kuga給足11大亮點
Sep
26
【新車試駕】國產SUV滿配天花板 小改款Ford Kuga給足11大亮點
SiCAR愛車酷
【新車試駕】國產SUV滿配天花板 小改款Ford Kuga給足11大亮點
【試駕X集評】電能X性能? 韓國兩強Hyundai Ioniq 5 N vs. Kia EV6 GT 你想要的是什麼?
Sep
25
【試駕X集評】電能X性能? 韓國兩強Hyundai Ioniq 5 N vs. Kia EV6 GT 你想要的是什麼?
Carture 車勢文化
看完前面的配備空間與動態現在來到最終選擇階段了,老實說一開始很難在Ioniq 5 N與EV6 GT之間做出抉擇,不過經過空間、配備差異與動態表現等項目比較後,心中答案輪廓也愈來愈明顯了。 個性設定不同,你想要的是什麼? Hyundai Ioniq 5 N與Kia EV6 GT兩車有著截然不同風格的外型,至於何者較...
去年全球賣爆71萬台!Toyota Corolla Cross成品牌休旅銷售新霸主
Sep
27
去年全球賣爆71萬台!Toyota Corolla Cross成品牌休旅銷售新霸主
SiCAR愛車酷
去年全球賣爆71萬台!Toyota Corolla Cross成品牌休旅銷售新霸主
德國賓士持續縮減陣容!苗頭將指向Coupe SUV
Sep
27
德國賓士持續縮減陣容!苗頭將指向Coupe SUV
SiCAR愛車酷
德國賓士持續縮減陣容!苗頭將指向Coupe SUV
十年磨一劍沒關係 但請勿拖延!McLaren預約10月06日發表P1後繼車
Sep
26
十年磨一劍沒關係 但請勿拖延!McLaren預約10月06日發表P1後繼車
CARLINK鏈車網
McLaren P1進入生產期程已經十多年了,是時候該推出繼任者了!為了延續F1、P1之光芒,預期McLaren依然會以「1」字繼續做文章。好的,全新McLaren超級跑車預計英國夏令時間(日光節約時間)10月6日下午1:00正式發表。今年初McLaren已向經銷商透露了「代號P18」的全新終極跑車,應該會配備新的V...