【全國】 集團簡介 關(guān)注我們
幫學院 商標分類表-2024尼斯分類 知識產(chǎn)權(quán)交易

快幫集團

首頁 > 知識干貨 > 為什么機器學習這么困難?

為什么機器學習這么困難?

2016-11-22

李彥宏說互聯(lián)網(wǎng)的下一幕就是人工智能。機器學習是其中熱門的分支之一,主要研究如何在經(jīng)驗學習中改善具體算法的性能。機器學習有著光輝的愿景,但眼下卻存在一些難以克服的障礙。TechRepubic網(wǎng)站撰文,從技術(shù)角度分析了為什么會出現(xiàn)這些困難。以下是原文翻譯:


       專家們紛紛炒作人工智能和機器學習就是未來的一切。可是每個對Siri喊過話的人都明白Siri在對我們提問的基本理解上還很欠缺。我們離實現(xiàn)人工智能的理想也還有很長的路要走。


       人工智能和機器學習有哪些難以克服的難關(guān)呢?


       第一個可以歸結(jié)為信任。Google研究主任Peter Norvig的一份聲明中表示,我們看不到機器內(nèi)部來真正明白正在發(fā)生什么:“機器學習產(chǎn)生的東西并不是代碼,而是被稱作一個黑盒。里面發(fā)生的事情我們知道一點,但并不能把握全部。”


       第二個原因是很難教會一個機器足夠多的東西,去理解語境和上下文。Facebook的人工智能研究員Yann LeCun稱,想要機器達到無障礙溝通,需要讓機器理解這個世界是如何運轉(zhuǎn)的,需要學習大量的背景知識,感受在任何給定的時刻里這個世界所處的狀態(tài),并且還要有理性和計劃。


       這是個不小的壯舉。


       以一種精確的方式去做這件事的麻煩在于,我們“喂”給機器的數(shù)據(jù)必然被人的主觀性所左右。但這一點很難避免。


       最后,機器學習的困難之處還在于進入它的編程,Norvig指出:


     “缺乏明確的抽象壁壘”,讓調(diào)試更加困難,因為它很難隔離一個bug;“非模塊性”(non-modularity),如果你改變了其中一部分,你最終就改變了一切;“不穩(wěn)定性”——需要持續(xù)輸入新的數(shù)據(jù);“這是誰的數(shù)據(jù)?“涉及到隱私、安全性和公平性的問題;缺乏足夠的工具和流程進行傳統(tǒng)軟件的開發(fā)。

盡管看起來困難重重,但是未來的曙光仍落在機器學習和人工智能上。


       我們曾經(jīng)生活的世界是一個相對有序、整齊的關(guān)系數(shù)據(jù)庫,現(xiàn)在的世界則是一團亂麻,一個松散的、半結(jié)構(gòu)化的關(guān)系數(shù)據(jù)庫。但是我們?nèi)狈?shù)據(jù)基礎(chǔ)設(shè)施來構(gòu)建。在用了Apache Hadoop, Apache Spark等等NoSQL數(shù)據(jù)庫,我們終于獲得了正確的工具,以一個合適的價格(免費、開源)來處理我們的數(shù)據(jù)。


       但是我們還在努力尋找這個龐大混亂的數(shù)據(jù)庫中隱含的模式。在這方面,機器學習將變得無比重要。Nervana公司的聯(lián)合創(chuàng)始人和CEONaveen Rao說:“我的聰明之處大概是在數(shù)據(jù)中找出結(jié)構(gòu)的能力?!边@并不是說今天機器可以以人力難及的方式解釋這個世界。它們所做的事情是在看起來雜亂無章的海量數(shù)據(jù)中找出結(jié)構(gòu),而在同樣的時間里人腦不可能發(fā)現(xiàn)其中的模式。


       解決問題的訣竅在于讓機器和人類協(xié)同工作。這是未來十年人工智能和機器學習的挑戰(zhàn)所在。盡管機器學習有其內(nèi)在的困難,人工智能和機器學習還是值得期待的。


創(chuàng)業(yè)資訊

京公網(wǎng)安備 11010802036823號

   

京ICP備16051929號

   

增值電信業(yè)務(wù)許可證編號:京B2-20190686

   

專利代理機構(gòu)代碼:16087

   

人力資源服務(wù)許可證編號:1101082019043

   

代理記賬許可證書編號:DLJZ11010820210015

0