「#10YearChallenge」本來應該是指 Facebook 上的「How Hard Did Aging Hit You Challenge」(時間在你身上留下多少歲月痕跡),意思是挑戰「衰老」有多大程度影響你。
許多外媒指出,這項「挑戰」由美國奧克拉荷馬州的當地媒體 KOCO 5 News 的首席氣象學家 Damon Lane 率先發起,他把十年前後的相片合在一起,於今年1月11日在Facebook上發佈。
美國有科技記者認為這很有可能是Facebook 為了訓練人工智慧 AI,判斷人類老化過程的活動。
如果資料科學家向 AI 展示這些人 10 年前跟現在可能的樣貌照,AI 就很容易建立一個關於人類年齡算法跟數據的模型,不僅有助於改善臉部辨識軟體,還可以預測未來結果,或是也可以幫助執法單位,搜尋可能的嫌疑罪犯以及失蹤人口等用途。
根據《wird》報導,這種推論其實相當合理,想像一下,如果你想要訓練一個關於年齡相關特徵的臉部識別算法,更具體地說,是關於人們會如何隨著年齡的增長臉部會有何改變。
理想情況下,您需要一個包含大量人物照片的數據資料庫,而這個數據資料庫必須是嚴謹且涵蓋範圍很廣泛的。如果你知道這些照片被間隔了一定時間,例如隔開十年之間變化的照片就會有所幫助。
▲標籤#10YearChallenge 傳聞是為了方便 FB 進行資料探勘(data mining)的陷阱。(影片/取自YouTube,若遭移除請見諒)
當然,你可以利用人工的方式透過 Facebook 瀏覽個人資料圖片,查看發布日期或EXIF數據,但是整套文件圖片最終可能會變成大量無用的資訊,因為一般使用臉書的使用者,不太可能會依照現實當中的時間順序上傳圖片,此外,上傳的動態很容易被最新的照片圖文資訊覆蓋過去。
換句話說,如果你有一套簡單,有用的標籤可以加以區別,那麼將會對現在的照片以及未來的系統有所幫助。
更重要的是,Facebook上的個人資料圖片,照片發布日期不一定與拍攝照片當下的時刻完全一樣。即使是參照照片上的可交換圖檔格式(Exchangeable image file format,官方簡稱Exif)數據,也無法可靠地確認上傳照片的日期,究竟是否為使用者拍攝當下的照片。
Let's say you wanted to train a facial recognition algorithm on aging. What would do? Maybe start a meme like #10yearchallenge https://t.co/usFLAtMnAt
— Nicholas Thompson (@nxthompson) 2019年1月16日
資料探勘(data mining)是什麼?
資料探勘(data mining)是一個跨學科的電腦科學分支 。它是用人工智慧、機器學習、統計學和資料庫的交叉方法在相對較大型的資料集中發現模式的計算過程。
資料探勘過程的總體目標是從一個資料集中提取資訊,並將其轉換成可理解的結構,以進一步使用。除了原始分析步驟,它還涉及到資料庫和資料管理方面、資料預處理、模型與推斷方面考量、興趣度度量、複雜度的考慮,以及發現結構、視覺化及線上更新等後處理。資料探勘是「資料庫知識發現」(Knowledge-Discovery in Databases,KDD)的分析步驟 ,本質上屬於機器學習的範疇。
文/張岑宇
本文、圖經授權轉載自智慧機器人網(原標題:【十年回顧對比照揭密】#10YearChallenge為啥爆紅?傳聞這竟是 FB 為了讓 AI 收集人類衰老過程變成數據庫)
責任編輯/趙元