作者:Will Knight
機器之心翻譯 參與:李九喻、微胖
Maluuba正在訓練深度學習算法,回答少量文本問題。該技術最終可能會替代人類閱讀用戶使用手冊。
教計算機以超人的水平下圍棋很酷,但是,對你和我來說沒多大用處。不過,如果有一臺電腦能讀懂幾十頁的文本,例如新微波爐的使用手冊,然后回答關于它如何操作的問題,會怎樣?給我來一臺。
閱讀和理解文本對計算機來說非常困難,但加拿大一家名叫Maluuba的公司已經利用一種算法在這方面取得進展,該算法可以閱讀文本并以令人印象深刻的準確度回答相關問題。最重要的是,不像其他的方法,它只需要少量文本就可以運行,可能最終幫助電腦理解文檔。
Mauuba的研究人員上周發布了論文,描述他們最新的進展。它描述了一個能夠閱讀幾百個童話故事的算法,并提問和回答文本相關問題。在訓練結束后,該算法可以正確地回答有關其并不熟悉文本的多選題,準確率超過70%。研究人員還用《哈利波特和魔法石》測試了它,發現該算法可以用類似的準確率回答有關文本的問題。
除了學術上的進步,Maluuba希望最終創建一個可以幫你完成繁瑣閱讀的系統。總部設在加拿大滑鐵盧的公司產品副總裁表示Muhamed Musbah表示:「我們有興趣的使用案例包括用戶使用手冊,患者記錄,或者客戶服務文件。在這些領域,真的沒有過剩的數據。」
Maluuba的研究小組利用被稱為深度學習的流行神經網絡學習方法培養自己的系統。但是,研究人員設計他們的網絡來考慮不同抽象程度的文本—— 從詞詞到短語到句子——而且他們也讓網絡在訓練之前,就為善于用這種方法進行學習做準備。通常,深度學習網絡在訓練前受到隨機配置。這使網絡學習得很快,結果,問答表現上,比使用深度學習方法前提高15%。它也比最好的人工編碼解決方案好2%。
蒙特利爾大學教授兼Maluuba的科學顧問Yoshua Bengio說: 「從數字上看,這是一個大的飛躍。」但是,目前為努力商業化人工智能的公司工作、深度學習為數不多的大師之一Bengio也警告說,專家還需要一段時間解析該方法的意義。
教會機器閱讀和使用語言進行有效交流的想法肯定是誘人的。它可以開發出強大的新方式來與計算機互動以及挖掘信息。但是,理解文本是人工智能面臨的最大挑戰之一;計算機通常被這一事實絆住: [理解] 語言需要對現實世界運方式有深刻理解。
盡管面臨這些挑戰,一些最大的科技公司正試圖開發可以理解文本的人工智能。Facebook正在通過叫做M的助理服務收集交談數據,用來訓練能夠自然交談的算法。谷歌的DeepMind正在做類似的工作,訓練深度學習系統閱讀新聞摘要。
然而迄今為止,還沒有出現過巨大突破,也不清楚給機器配備成熟的閱讀理解能力會有多困難。通過調整和完善關鍵的機器學習技巧以及向電腦輸入大量注釋文本,研究人員正在取得巨大進展。為了能夠學習,Maluuba研究人員使用的這種機器學習方法通常需要巨大的文本。實際上,讓深度學習運行的文本量,通常被視為主要限制因素之一。一個基本的語言挑戰是,被用來表示不同概念的單詞是任意的,所以,較之圖片,更難得出語言之間的聯系。
由滑鐵盧大學的幾個畢業生在2010年創立的Maluuba,先前開發過智能手機的智能個人助理,而且已經將研究重點置于自然語言處理或機器理解方面。
同樣致力于語言處理,人工智能公司MetaMind的聯合創始人Richard Socher說:「我認為,它是向前的一步,這是一個工程設計極佳的系統,將已被充分理解、確定的傳統自然語言處理特征和來自神經網絡想法結合了起來。」
來自卡內基·梅隆大學,專門從事自然語言處理的研究人員Chris Dyer,也認為Maluuba的研究成果令人印象深刻,但是,他相信機器需要獲得對世界的真正理解才能正常交談,而不是從文本得出統計結論。這將意味著要超越純粹對注釋文本的學習。
Dyer說:「就計算機對世界的感知和理解而言,它太有限了。」
本文由機器之心編譯
|