作者:ADRIENNE LAFRANCE
機器之心編譯出品
編譯:吳攀,賽坡
人類越來越傾向于依賴機器作為認識自己的方式。長期以來機械世界都為人體的工作方式提供著類比。
「在嘗試解釋生物學上,我們一直有技術上的類比,」卡內基梅隆大學機器人學家Chris Atkeson 說,「有一種關于大腦如何工作的想法是覺得大腦是液壓的。人們描述液壓時鐘和心臟泵血。然后我們有了蒸汽機作為(我們身體)工作方式的類似。再然后我們有了電。」
1948 年,數學家和哲學家諾伯特·維納 出版了他的著作《控制論》,進一步擴大了這個傳統;這本書使用計算機-大腦的類比奠定了人們現在思考信息時代的基礎。
當然,今天計算機已經在解釋生命系統中占據了突出的位置。人們常常將大腦描述成計算機一樣,就好像我們的記憶是存儲在灰質做成的硬盤中一樣。仔細審視一下,可以發現這樣類比的拙劣程度并不比其之前的比喻性的比較更少。而這樣的比喻的局限性是雙向的。機器學習是一種通過向計算機展示圖像或其它信息的大數據集來訓練其識別模式的方法,該方法常被描述是以一定的方式教育計算機大腦「看見」世界。這就意味著:機器與人類都是在過去見過的事物的基礎上積累知識。
「計算機『看見』的每一樣事物都基于它『知道』什么……依賴于你的『看見』是什么含義。」iRobot 的軟件工程師 Emily Pittore 在給我的一封電子郵件中寫道,「我使用著重引號是因為我對過于隨意地將人類認知的語言應用到計算機上有些猶豫。」
「如果你說的『看見』是指『光學輸入』,那么計算機總是看見相同的事物,」她說。換句話說,機器會忽略輕微的美學亮點和傳感器噪聲,而「人類有一個遠遠更復雜的傳感器——眼球和大腦。」
人類的視覺處理也會受到他們已知事物的嚴重影響——但他們實際看見或感知的可能會相差很大,甚至當輸入相同時也一樣。這是根據上個月發表在 Journal of Experimental Psychology 期刊上的一篇題為《人類感知和表現》的文章所得出的結論,該研究基于約翰霍普金斯大學研究者的發現。這些研究者進行了一系列實驗,以找到對阿拉伯字母的預先知識對不同的人感知阿拉伯字母的方式有怎樣程度的影響。
研究人員發現,同樣的字母在不同的人看來是不同的,這依賴于他們是否能夠閱讀阿拉伯文。而盡管他們評估的關注點是字母,但研究者表示,這些發現也可適用于任何事物——物體、照片、插圖等等。總而言之結論是:你已知曉的東西將會極大影響你看事物的方式。這聽起來很直觀,對嗎?但是這些發現比它們看起來更為微妙。
「我們不只是說,『噢,你是專家,所以你看事物不一樣』。」約翰霍普金斯大學認知科學研究生、該研究的主要作者 Robert Wiley 說,「微妙的一點是不只是你的顯性知識(explicit knowledge)會真正改變你的視覺系統。還有一些意識都無法觸及的事物。」
這就是為什么人類無法真正完全忘記事情的原因。因為我們首先就不知道怎么就解開所見與如何看見之間的連接。你可能會忘記一個事實或失去你曾擁有的某個技能,但卻沒有辦法探查——也就沒有辦法刻意改進——其發生的方式,在此過程中暴露給特定的輸入已經改變了你的感知。
但是機器可以忘記。
事實上,一些計算機科學家表示為此目的而設計計算機正越來越重要。機器學習系統的部分承諾是計算機將有能力處理海量的數據流,比如類似人臉識別中的海量數據。在這些計算能力的作用下,整個產業都在發生改變。隨著通過龐大的網絡的敏感數據的激增,人類需要能夠告訴計算機什么時候和確切地怎樣忘記被稱為數據沿襲(數據沿襲,指的是記錄有關每個數據塊的包執行和數據轉換的歷史紀錄)的海量信息,包括復雜信息、計算記錄以及由類腦計算網絡衍生出的信息。
「這樣的忘記網絡(forgetting system)必須仔細跟蹤數據沿襲,甚至需要跨統計處理或機器學習,并使該沿襲對用戶可見,」來自利哈伊大學和哥倫比亞大學的計算機科學教授 Yinzhi Cao 和 Junfeng Yang 寫道,「他們讓用戶使用不用的粒度(granularity)水平指定要遺忘的數據……然后這些系統移除這些數據并還原其所帶來的影響,這樣今后所有的操作都會像該數據從未存在過一樣。」
Cao 和 Yang 在 2015 年的一篇論文中闡述了他們對該系統的想法,該論文與2015年發表在IEEE的期刊 Security & Privacy上。他們說,從一個更大的集合中擦除一個單獨的數據線程具有很多潛在的效益。一些人可以從一臺機器上移除他們的敏感個人數據。學者可以使用忘記(unlearning)來清理或矯正分析數據,從而開發出更為精確的預測算法。
這種操作數據的能力可以被看做是它自身的安全威脅——比如說,如果數據被惡意篡改——但 Cao 表示,將有保護措施。比如:「在歐盟,移除與某人相關的的搜索結果之前,谷歌需要請求者的帶照片的身份證明的掃描件。」他在一封電子郵件中說,「這只是驗證的一種方法,還有其它方法涉及到用戶名/密碼、雙因素認證、指紋等等。」
這一想法已經讓計算機科學家們感到興奮了。Cao 和 Yang 接受了美國國家科學基金會 120 萬美元的資助以進一步發展這一概念。如果他們取得了成功,并且如果機器忘記真的可以像 Cao 和 Yang 建議的那樣,變成了一個至關重要且無處不在的計算功能,那么忘記系統(forgetting system)對人們思考人腦處理功能的方式又意味著什么呢?大概并不會有太多含義,直到新技術出現并提供一個更具說服力的類比。
「我們對大腦還有很多不理解,但我們確實知道他們并不神奇。」紐約大學心理學和神經科學教授 Gary Marcus 去年在《紐約時報》上寫道,「它們只是物質的異常復雜的排布。飛機可能飛起來并不像鳥,但它們都遵循于同樣的力進行升降。同樣道理,也沒有理由認為大腦可以免受計算定律的約束。」
人類-機器的比喻從不完美,但它們可以是有用的,即使計算機可以以人類所不能的方式學習和忘記。「我們想用由這些巨型計算機器提供的概念模型做更多事,」文化人類學家 Margaret Mead 在 1948 年談論計算機時說道,據 Ronald Kline 的著作 《The Cybernetics Moment》,「說人的身體是一臺機器沒有什么陷阱,而只是這些方法,尤其是數學家在這些機器問題中所使用的方法,可能是可用于更精確思考人類行為的工具。」
本文由機器之心原創
|