【中國安防展覽網 時事聚焦】今年33歲的付貴在被拐27年后終于通過在線視頻見到了自己的親人。“你好!”這是他看到視頻里面的人,說的句話。而視頻中的姑姑,早就淚如雨下。
與付貴視頻通話的一家人。 百度 圖
1990年,當時6歲的付貴在從重慶市大歇鎮幼兒園放學回家的途中被拐走,從此離開了自己的父母親人。由于父母早年離異,付貴幼年一直跟隨在姑姑身邊生活,20多年來,付貴走丟都是姑姑心頭的一個傷口。
4月8日下午,付貴次與重慶的家人通過視頻見上了面。視頻里的姑姑一一為他介紹老家的親人們。“要得,要得。”被拐以后生活在福建泉州的付貴早已忘記了鄉音,卻在一遍一遍地重復著自己還記得的簡短的方言。
百度成立AI尋人團隊
2017年3月,百度和全國大的尋親平臺“寶貝回家”開展合作,首批2萬多條尋親數據接入百度跨年齡人臉識別系統對比評測,并篩選出部分疑似案例。而付貴就是這項合作中個經DNA檢驗確認找到父母的孩子。
百度的工作人員告訴澎湃新聞記者,在付貴的案例中,大的困難的就在于幾年前付貴和姑姑在寶貝回家平臺上,分別提交了尋親的信息,由于年代久遠存在記憶偏差,兩方提供的信息在關鍵的被拐時間、地點和年齡上都對不上。
2009年9月,付貴在“寶貝回家”網站“寶貝尋家”版塊登記了自己被拐的信息,登記姓名為“胡奎”,出生日期為1986年4月22日,失蹤日期為1991年1月1日,失蹤地點位于福建。
另一個難度則在于,姑姑提交的是付貴4歲時的照片,而付貴上傳的是自己10歲的照片,6歲的年齡差距已經讓付貴的樣貌有了很大的變化,僅憑肉眼很難時間做出判斷是同一個人。
姑姑與付貴分別提交的尋親照片。
“如果依賴過去的人工排查,這樣的案例肯定就被錯過了。再加之寶貝回家平臺的數據庫中,被拐兒童尋親和父母尋找丟失的孩子是兩個分開的系統,要靠人工去一一匹配,工作量不可想象。”上述工作人員說道。
澎湃新聞了解到,百度與寶貝回家平臺的合作的主要內容,就是幫助寶貝回家設計和實現信息的集中管理,讓所有線索匯聚起來,加上百度的跨年齡段人臉比對技術,幫助寶貝回家盡快找到高疑似案例,交給志愿者追蹤和落地線索。百度接受項目后,先后邀請了IDL(深度學習實驗室)、AIP( AI平臺部)、AIQA(AI測試部)、眾測(平臺測試部)等多個部門的十幾位技術人員加入,成立了“AI尋人”虛擬團隊。
百度技術團隊向澎湃新聞記者表示,此次寶貝回家照片篩選對比的難度遠遠比預估的要大。首先是數據量不小,寶貝回家提供的批數據,超過2萬張,而且其中還有許多無效照片,如部分人員去世或失蹤、無法追尋等。此外,還有照片不規范的情況,如照片經過美化、照片中人物過多、父母無孩子照片直接上傳父母本人照片、比對年齡區間較大等,都給比對工作增加了難度。
識別年齡跨度可達30年
目前百度人臉識別人工智能系統能夠識別的年齡跨度可達30年。
百度AI平臺部產品經理楊抒含介紹稱,人臉識別技術基本原理,是從人臉照片上,提取所有的面部特征(眉毛、眼睛、鼻子、臉型輪廓等),把這些特征換算成不同維度,并給每個維度配比上不同的權重。當兩張照片進行對比時,會針對每個維度挨個對比,得出每個維度的相似度得分,再根據每個維度的權重比例計算出總體的匹配度得分,給出兩張臉的相似程度。
不過在實踐中,技術團隊發現一個很大的問題,目前基于強大的數據分析,很容易識別兩張近期的照片。但是對于識別十幾年或者時間跨度更久的照片,并沒有大量的數據可以分析。沒有足夠多的數據,基于深度學習的神經網絡很難學習到跨年齡的類內和類間變化。
據了解,百度目前的跨年齡人臉識別訓練模型使用的數據主要來自百度內部員工貢獻的圖像,再加之用一個大規模人臉數據訓練好的模型作為底座,然后用跨年齡數據進行更新。對于數據量不足的問題,百度希望未來能有更多這樣的數據,包括和公安部等政府機構合作。
在實際操作中,技術團隊也積累了有益的經驗。“我們利用正確的對比照片,不斷糾正調整臉部特征維度的權重比例。如鼻子的權重數很高,識別時就重點進行鼻子的比對,以提高度。” 楊抒含表示。
2017年兩會期間,全國政協委員,百度公司董事長兼CEO李彥宏曾提案 “利用人工智能技術來解決兒童走失的問題”。
李彥宏建議,國務院辦公廳牽頭,協調公安部、民政部等“反對拐賣婦女兒童行動工作部際聯席會議”的重要組成單位,統籌企業和社會力量,利用人臉識別等大數據和人工智能技術,進一步提升兒童走失案件的偵破效率與破案率。具體建議包括:建立適用于搜尋走失兒童的人臉識別模型;建立覆蓋全國的走失兒童數據庫;將人臉識別技術與治安、交通
監控系統相結合。