李彥宏說(shuō)互聯(lián)網(wǎng)的下一幕就是人工智能。機(jī)器學(xué)習(xí)是其中熱門(mén)的分支之一,主要研究如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能。機(jī)器學(xué)習(xí)有著光輝的愿景,但眼下卻存在一些難以克服的障礙。TechRepubic網(wǎng)站撰文,從技術(shù)角度分析了為什么會(huì)出現(xiàn)這些困難。以下是原文翻譯:
專(zhuān)家們紛紛炒作人工智能和機(jī)器學(xué)習(xí)就是未來(lái)的一切??墒敲總€(gè)對(duì)Siri喊過(guò)話(huà)的人都明白Siri在對(duì)我們提問(wèn)的基本理解上還很欠缺。我們離實(shí)現(xiàn)人工智能的理想也還有很長(zhǎng)的路要走。
人工智能和機(jī)器學(xué)習(xí)有哪些難以克服的難關(guān)呢?
第一個(gè)可以歸結(jié)為信任。Google研究主任Peter Norvig的一份聲明中表示,我們看不到機(jī)器內(nèi)部來(lái)真正明白正在發(fā)生什么:“機(jī)器學(xué)習(xí)產(chǎn)生的東西并不是代碼,而是被稱(chēng)作一個(gè)黑盒。里面發(fā)生的事情我們知道一點(diǎn),但并不能把握全部。”
第二個(gè)原因是很難教會(huì)一個(gè)機(jī)器足夠多的東西,去理解語(yǔ)境和上下文。Facebook的人工智能研究員Yann LeCun稱(chēng),想要機(jī)器達(dá)到無(wú)障礙溝通,需要讓機(jī)器理解這個(gè)世界是如何運(yùn)轉(zhuǎn)的,需要學(xué)習(xí)大量的背景知識(shí),感受在任何給定的時(shí)刻里這個(gè)世界所處的狀態(tài),并且還要有理性和計(jì)劃。
這是個(gè)不小的壯舉。
以一種精確的方式去做這件事的麻煩在于,我們“喂”給機(jī)器的數(shù)據(jù)必然被人的主觀性所左右。但這一點(diǎn)很難避免。
最后,機(jī)器學(xué)習(xí)的困難之處還在于進(jìn)入它的編程,Norvig指出:
“缺乏明確的抽象壁壘”,讓調(diào)試更加困難,因?yàn)樗茈y隔離一個(gè)bug;“非模塊性”(non-modularity),如果你改變了其中一部分,你最終就改變了一切;“不穩(wěn)定性”——需要持續(xù)輸入新的數(shù)據(jù);“這是誰(shuí)的數(shù)據(jù)?“涉及到隱私、安全性和公平性的問(wèn)題;缺乏足夠的工具和流程進(jìn)行傳統(tǒng)軟件的開(kāi)發(fā)。
盡管看起來(lái)困難重重,但是未來(lái)的曙光仍落在機(jī)器學(xué)習(xí)和人工智能上。
我們?cè)?jīng)生活的世界是一個(gè)相對(duì)有序、整齊的關(guān)系數(shù)據(jù)庫(kù),現(xiàn)在的世界則是一團(tuán)亂麻,一個(gè)松散的、半結(jié)構(gòu)化的關(guān)系數(shù)據(jù)庫(kù)。但是我們?nèi)狈?shù)據(jù)基礎(chǔ)設(shè)施來(lái)構(gòu)建。在用了Apache Hadoop, Apache Spark等等NoSQL數(shù)據(jù)庫(kù),我們終于獲得了正確的工具,以一個(gè)合適的價(jià)格(免費(fèi)、開(kāi)源)來(lái)處理我們的數(shù)據(jù)。
但是我們還在努力尋找這個(gè)龐大混亂的數(shù)據(jù)庫(kù)中隱含的模式。在這方面,機(jī)器學(xué)習(xí)將變得無(wú)比重要。Nervana公司的聯(lián)合創(chuàng)始人和CEONaveen Rao說(shuō):“我的聰明之處大概是在數(shù)據(jù)中找出結(jié)構(gòu)的能力?!边@并不是說(shuō)今天機(jī)器可以以人力難及的方式解釋這個(gè)世界。它們所做的事情是在看起來(lái)雜亂無(wú)章的海量數(shù)據(jù)中找出結(jié)構(gòu),而在同樣的時(shí)間里人腦不可能發(fā)現(xiàn)其中的模式。
解決問(wèn)題的訣竅在于讓機(jī)器和人類(lèi)協(xié)同工作。這是未來(lái)十年人工智能和機(jī)器學(xué)習(xí)的挑戰(zhàn)所在。盡管機(jī)器學(xué)習(xí)有其內(nèi)在的困難,人工智能和機(jī)器學(xué)習(xí)還是值得期待的。