留言討論


分享本文至 E-mail 信箱

相像跟相同截然不同:演算法搞錯了所造成的悲劇——《打開演算法黑箱》

2014 年,史帝夫.塔利(Steve Talley)在丹佛市南區的家中睡覺時,聽到敲門聲。他打開門,看到有個男子為了不小心撞到他的車來道歉。這個陌生人請塔利出來看一下,他照做了。

當他蹲下來評估駕駛座這邊車門的受損程度時,一顆閃光彈引爆了。出現三個穿黑夾克戴頭盔的男子,把他打倒在地。一名男子踩在他臉上,另一名抓住他的手臂,還有一名開始一直用槍托打他。

塔利的受傷範圍很大。到那天深夜,他遭受了神經損傷、血栓及陰莖折斷。「我甚至不知道陰莖可以折斷,」他後來告訴調查新聞網站「攔截」(The Intercept)記者:「我一度真的大叫要找警察。然後我明白了,正在毒打我的這些人就是警察。」

你以為你是誰?鑑識錯誤導致的悲劇

塔利因為兩起當地銀行搶案被捕。第二起搶案發生時,一名警官遇襲,塔利認為,這就是為什麼他在逮捕過程中遭到如此野蠻的對待。「我對他們說他們瘋了,」他記得自己對著警官大吼:「你們抓錯人了!

平常該保護人民的善良警察,轉而向無辜的自己施以令人恐懼的暴力,那會是一件多令人心碎的事情。圖/Pixabay

 

塔利沒有說謊。他被捕是因為他長得和本尊那傢伙——真正的搶匪——像得驚人。

雖然一開始是塔利家那棟大樓的維修人員,看過地方新聞報導的照片後向警方通風報信,最後應該是聯邦調查局專家在案發後檢視過監視錄影,運用臉部辨識軟體,得出「所述可疑人物看來就是塔利」的結論。

塔利有堅不可摧的不在場證明,但由於聯邦調查局專家的證詞,還是花了超過一年才完全洗刷汙名。在那段期間,他被監押在最高保安等級的牢房將近兩個月,直到出現充足證據才放了他。結果,他沒辦法去上班,等到磨難結束時,他已經失去他的工作、他的家和探視小孩的權利。

一切都是鑑識錯誤的直接後果。

傳說中,看到另一個自己就會出事?

臉部辨識演算法在現代治安作為當中正開始普及起來。這些演算法收到相片、監視錄影或 3D 攝影機快照,就會偵測臉部、測量其特徵,並與已知臉部資料庫做比對,企圖確定相片中人的身分。

在柏林,能夠辨識已知恐怖主義嫌犯的臉部辨識演算法被訓練來鑑識經過火車站的群眾。在美國,2010 年以來,這些演算法光是在紐約州,僅僅針對詐欺和身分盜用就發動了超過四千次逮捕行動。而在英國,現在把攝影機架在交通工具上面,看起來像加強版的 Google 街景車,自動四處開來開去,交叉比對我們和通緝犯資料庫的相似度。

這些廂型車第一次成功找到目標是在 2017 年 6 月,一輛車從南威爾斯一名男子身旁開過去,而當地警方已對這名男子發出逮捕令。

研究模擬的機場保安設施中,臉孔辨識專家未能發現身分證不符竟然高達驚人的 14% ,而完全合格者則有 6% 誤遭駁回。圖/Free-Photos@Pixabay

我們的安全和保安往往取決於我們的臉部鑑定與辨識能力,但這項任務交在人類手上,可能會有風險。以海關官員為例,最近有一項研究模擬機場保安設施,這些臉孔辨識專家未能發現身分證不符的比率達驚人的 14% ——而完全合格者則有 6% 誤遭駁回。我不知道你怎麼想,但我覺得,當你考量到每天通過希斯洛機場的人數,這些數字不只是令人有點焦慮而已。

我們稍後會看到,臉部辨識演算法當然可以把這項任務做得比人類好。但用於追捕罪犯時,鑑識錯誤的後果是如此嚴重,而這些演算法的運用引發一項重大問題。把兩個人的身分弄錯,到底有多容易?我們之中有多少個一副塔利臉的正潛伏在外頭某處?

世界上真的存在和自己長得一樣的人嗎?

一項從 2015 年開始進行的研究顯示,你在自己的真實生活中擁有分身的機會(無論是銀行搶匪或其他)小到幾乎為零。

阿德雷德大學的泰涵.露卡絲(Teghan Lucas)千辛萬苦在四千人的照片中做了 8 種臉部測量,其中連一組相符的都找不到,讓她得出結論:兩個人要有完全相同臉孔的機率低於一兆分之一

研究顯示在真實生活中,擁有分身的機會小到幾乎為零。圖/pixabay

根據這項計算,塔利不光是運氣有「一點」背而已。考量到他那位兆中選一的邪惡分身也住在附近,而且碰巧是名罪犯,我們應該可以預期要在幾萬年之後,才會有另一個倒楣的人落入同樣的悲慘經驗。

但有些理由讓人懷疑這些數字不太兜得起來。想像遇上和你臉孔相同的某人當然難,但長得很像卻毫無關係的陌生人,這類軼聞證據看起來確實比露卡絲研究可能顯示的訊息要常見許多。

以尼爾.道格拉斯(Neil Douglas)來說吧,他搭機要前往愛爾蘭時才發現,他的分身就坐在他的位子上。在他們的自拍照裡,後面有滿滿一飛機的旅客與他們同笑,這張照片很快像病毒般傳播開來。不久之後,世界各地留著絡腮鬍、紅頭髮的人寄來自己的照片,證明他們也有相似的長相。「我想,我們可以組成一支小型軍隊了。」道格拉斯告訴 BBC。

尼爾.道格拉斯與他在飛機上遇見的分身。圖/BBC

我甚至有自己的故事可以添上一筆。我 22 歲的時候,有個朋友給我看一張他們在當地樂團 Myspace 的網頁上看到的照片。那是一場我沒去過的演唱會上所拍照片的拼貼圖,顯示很多人樂在其中,而其中一人看起來眼熟得令人毛骨悚然。

為了確認我沒有在某天晚上失去知覺,出門遊蕩去了如今想不起來有參加過的派對,我寄了電子郵件給樂團主唱,他確認了我的懷疑:我那愛好電子合成流行樂的分身,有著比我更精采的社交生活。

因此,塔利、道格拉斯和我,就是各有至少一名分身的這種人,可能還不只一名。在七十五億人口中,我們加起來就有三人,而且我們還沒開始認真算人頭呢——這樣已經遠超過露卡絲估算的一兆分之一。

研究與現實的差異

有一個理由可以解釋這種落差。一切都歸因於研究人員對「等同」的定義。

露卡絲的研究要求,兩個人的測量結果必須完全相合。即便道格拉斯和貌似他的人像到不可思議,如果有一個鼻孔或一片耳垂相差多達一毫米,根據她的判準,他們嚴格說來不算是分身。

但就算你比較的是同一個人的兩幅影像,精確的測量並不會反映出我們每一個人是如何持續在改變,由於年老、疾病、疲憊、我們所做的表情,或我們的臉如何因攝影機角度而被扭曲。

想以幾毫米之差來捕捉臉的本質,那麼你在同一個人臉上所發現的變異之多,將一如你在人與人之間察覺到的。簡單說,單憑測量無法區分兩張臉孔

塔利被控以未曾犯過的罪名,扔進最高保安等級的牢房。圖/Donald Tong@Pexels

雖然這兩張臉孔或許不完全等同,但一點都不難想像自己會把道格拉斯和照片中他那素昧平生的分身給弄混。塔利的情況類似,他和真正的搶匪看起來甚至沒有那麼相似,但影像還是被聯邦調查局專家錯誤解讀,以至於他被控以未曾犯過的罪名,扔進最高保安等級的牢房。

正如海關官員所顯示的,把不熟悉的臉孔弄混,即使這些臉孔只是略有相似,驚人地容易。結果證明,人類出乎意料地拙於辨識陌生人

這就是為什麼我的朋友聲稱,她是耐著性子勉強看完克里斯多福.諾蘭(Christopher Nolan)攝製優美的電影《敦克爾克大行動》(Dunkirk)——因為她要花很大的力氣來分辨這些演員。這是為什麼青少年發現,「借」年長朋友的身分證去買酒頗有成功的機會。

這也是為什麼根據美國非營利法律扶助組織「清白專案」(Innocence Project)評估,在 70% 以上的冤案中,目擊證人誤認發揮了某種作用。

其實演算法,並不是想像中那麼萬能

不過,雖然目擊者或許很容易將道格拉斯與他的同機旅伴弄混,他的母親當然可以毫無問題地從照片中認出她兒子——即使說的是真實生活中的分身:一對完全相同的雙胞胎,如果你和他們只是泛泛之交,或許容易弄混,但只要你對他們有正確認識,分辨他們同樣容易。

這裡有一個關鍵點:相似性取決於觀者的角度。

沒有嚴格定義相似性,你無法測量兩張臉孔有多麼不同,我們也就沒有一個標準可以說兩張臉孔完全相同。你無法定義何謂分身,或是說某一張特定臉孔有多常見;最重要的,你也說不出兩幅影像攝自同一人的機率為何。

DNA 是自豪地端坐在強大的統計學平台之上,能將罪犯特徵剖析的焦點放在基因組的特定區塊上。圖/TheDigitalArtist@Pixabay

這意味著臉部辨識做為一種鑑識法,不像 DNA 是自豪地端坐在強大的統計學平台之上。把 DNA 檢測法用於刑事鑑識,罪犯特徵剖析的焦點是放在基因組的特定區塊上,這些區塊已知在人類身上會有高度變異。

該變異的程度是關鍵所在:如果犯罪現場發現的身體組織樣本 DNA 序列與取樣自嫌犯身上的序列吻合,代表你可以計算兩者來自同一人的機率。也意味著,你可以說出某個倒楣傢伙碰巧就在那些點上有相同 DNA 序列的精確機率。

你使用的標記越多,比對錯誤的機率越低,所以藉由選擇所要測試的標記數量,全世界每一個司法系統都完全能夠決定他們願意容忍的疑慮限度。

即便我們覺得自己的臉孔與我們是何許人有如此本質性的關聯,如果不知道人類身上的變異性,以臉孔來指認重犯的做法得不到嚴謹科學的支持。說到以照片認人,借用聯邦調查局鑑識單位的說法:「缺乏統計,意味著這些結論最終都是奠基於個人看法。」

不幸的是,用演算法來做臉部辨識並未幫我們解決此一難題,這是對於運用演算法來指認罪犯一事提高警覺的極佳理由。

相像和相同不是同一回事,而且從來不是同一回事,無論演算法變得多精準。

而且,另外還有一個要對臉部辨識演算法步步為營的好理由。這些演算法並非真如你想的那般善於辨識臉孔。

——本文摘自《打開演算法黑箱》,2019 年 5 月,臉譜出版

圖/pixabay

關於作者


泛科選書(PanBooks)

PanX 泛科技新聞網從科技議題著手,企圖把未來更清楚地描繪出來。從能源議題、金融科技、生物科技,到物聯網、大數據、工業4.0、自造者,都是我們專注的內容。若希望有任何書籍合作歡迎向我們聯絡:contact [at] panx.asia

留言討論


網站更新隱私權聲明
本網站使用 cookie 及其他相關技術分析以確保使用者獲得最佳體驗,通過我們的網站,您確認並同意本網站的隱私權政策更新,了解最新隱私權政策