1、體育賽事預(yù)測
世界杯期間,谷歌、百度、微軟和高盛等公司都推出了比賽結(jié)果預(yù)測平臺。百度預(yù)測結(jié)果最為亮眼,預(yù)測全程64場比賽,準(zhǔn)確率為67%,進(jìn)入淘汰賽后準(zhǔn)確率為94%。現(xiàn)在互聯(lián)網(wǎng)公司取代章魚保羅試水賽事預(yù)測也意味著未來的體育賽事會被大數(shù)據(jù)預(yù)測所掌控。
“在百度對世界杯的預(yù)測中,我們一共考慮了團(tuán)隊(duì)實(shí)力、主場優(yōu)勢、最近表現(xiàn)、世界杯整體表現(xiàn)和博彩公司的賠率等五個(gè)因素,這些數(shù)據(jù)的來源基本都是互聯(lián)網(wǎng),隨后我們再利用一個(gè)由搜索專家設(shè)計(jì)的機(jī)器學(xué)習(xí)模型來對這些數(shù)據(jù)進(jìn)行匯總和分析,進(jìn)而做出預(yù)測結(jié)果?!?/span>---百度北京大數(shù)據(jù)實(shí)驗(yàn)室的負(fù)責(zé)人張桐
2、股票市場預(yù)測
去年英國華威商學(xué)院和美國波士頓大學(xué)物理系的研究發(fā)現(xiàn),用戶通過谷歌搜索的金融關(guān)鍵詞或許可以預(yù)測金融市場的走向,相應(yīng)的投資戰(zhàn)略收益高達(dá)326%。此前則有專家嘗試通過Twitter博文情緒來預(yù)測股市波動。
理論上來講股市預(yù)測更加適合美國。中國股票市場無法做到雙向盈利,只有股票漲才能盈利,這會吸引一些游資利用信息不對稱等情況人為改變股票市場規(guī)律,因此中國股市沒有相對穩(wěn)定的規(guī)律則很難被預(yù)測,且一些對結(jié)果產(chǎn)生決定性影響的變量數(shù)據(jù)根本無法被監(jiān)控。
目前,美國已經(jīng)有許多對沖基金采用大數(shù)據(jù)技術(shù)進(jìn)行投資,并且收獲甚豐。中國的中證廣發(fā)百度百發(fā)100指數(shù)基金(下稱百發(fā)100),上線四個(gè)多月以來已上漲68%。
3、市場物價(jià)預(yù)測
CPI表征已經(jīng)發(fā)生的物價(jià)浮動情況,但統(tǒng)計(jì)局?jǐn)?shù)據(jù)并不權(quán)威。但大數(shù)據(jù)則可能幫助人們了解未來物價(jià)走向,提前預(yù)知通貨膨脹或經(jīng)濟(jì)危機(jī)。最典型的案例莫過于馬云通過阿里B2B大數(shù)據(jù)提前知曉亞洲金融危機(jī),當(dāng)然這是阿里數(shù)據(jù)團(tuán)隊(duì)的功勞。
4、用戶行為預(yù)測
基于用戶搜索行為、瀏覽行為、評論歷史和個(gè)人資料等數(shù)據(jù),互聯(lián)網(wǎng)業(yè)務(wù)可以洞察消費(fèi)者的整體需求,進(jìn)而進(jìn)行針對性的產(chǎn)品生產(chǎn)、改進(jìn)和營銷?!都埮莆荨愤x擇演員和劇情、百度基于用戶喜好進(jìn)行精準(zhǔn)廣告營銷、阿里根據(jù)天貓用戶特征包下生產(chǎn)線定制產(chǎn)品、亞馬遜預(yù)測用戶點(diǎn)擊行為提前發(fā)貨均是受益于互聯(lián)網(wǎng)用戶行為預(yù)測。
5,人體健康預(yù)測
中醫(yī)可以通過望聞問切手段發(fā)現(xiàn)一些人體內(nèi)隱藏的慢性病,甚至看體質(zhì)便可知曉一個(gè)人將來可能會出現(xiàn)什么癥狀。人體體征變化有一定規(guī)律,而慢性病發(fā)生前人體已經(jīng)會有一些持續(xù)性異常。理論上來說,如果大數(shù)據(jù)掌握了這樣的異常情況,便可以進(jìn)行慢性病預(yù)測。
例如大數(shù)據(jù)應(yīng)用在醫(yī)療行業(yè)的經(jīng)典案例。
1,Valence Health: 提升醫(yī)保結(jié)果和財(cái)務(wù)狀況
Valence Health 使用MapR公司的數(shù)據(jù)融合平臺(Converged Data Platform)來建立一個(gè)數(shù)據(jù)湖并作為公司主要的數(shù)據(jù)倉庫。 Valence每天從3000個(gè)數(shù)據(jù)輸入源接收45種不同類型的數(shù)據(jù)。這些關(guān)鍵數(shù)據(jù)包括實(shí)驗(yàn)室測試結(jié)果、患者健康記錄、處方、疫苗記錄、藥店優(yōu)惠、賬單和付款, 以及醫(yī)生和醫(yī)院的賬單, 這些都用來提升決策來改善醫(yī)保結(jié)果和財(cái)務(wù)狀況。該公司快速增長的客戶和日益增加的相關(guān)數(shù)據(jù)量正在壓垮現(xiàn)有的技術(shù)基礎(chǔ)設(shè)施。
2,UnitedHealthcare: 欺詐,浪費(fèi)和濫用
UnitedHealthcare 為近5千1百萬用戶提供健康保險(xiǎn)和服務(wù)。和該公司合作的有超過85萬醫(yī)師和護(hù)理人員,全國范圍內(nèi)大約有6100所醫(yī)院。他們的賬目完整(Payment Integrity)小組的艱巨任務(wù)是確保所有賬單都按時(shí)正確付款。面對每天超過1百萬個(gè)的賬單(10TB的數(shù)據(jù)),他們之前的處理方式是特制的,嚴(yán)重依賴于規(guī)則,并受制于數(shù)據(jù)孤島和碎片化的數(shù)據(jù)環(huán)境。UnitedHealthcare 采用了一個(gè)獨(dú)特的雙模型策略,既集中關(guān)注業(yè)務(wù)收益,同時(shí)也追求利用最新的技術(shù)來不斷創(chuàng)新。
他們是這么做的:針對業(yè)務(wù)收益,該集團(tuán)建立了一個(gè)預(yù)測分析’工廠’用來系統(tǒng)地可重復(fù)地識別不準(zhǔn)確的賬單。Hadoop用做現(xiàn)在一個(gè)單一平臺的數(shù)據(jù)框架,該平臺上建有多種工具來分析各種信息,包括賬單,處方,醫(yī)保參與人,合作醫(yī)護(hù)人員,以及賬單審查結(jié)果。
他們集中了業(yè)務(wù)里所有數(shù)據(jù)孤島的數(shù)據(jù),包含36處數(shù)據(jù)資產(chǎn)。他們手邊現(xiàn)在有多個(gè)預(yù)測模型(PCR,確定欺詐True Fraud,Ayasdi 等),這些模型提供了一個(gè)潛在的欺詐排序列表,使得他們可以有針對性地和系統(tǒng)化地處理欺詐。
例如;大數(shù)據(jù)應(yīng)用其他案例:Google成功預(yù)測冬季流感。
2009年,Google通過分析5000萬條美國人最頻繁檢索的詞匯,將之和美國疾病中心在2003年到2008年間季節(jié)性流感傳播時(shí)期的數(shù)據(jù)進(jìn)行比較,并建立一個(gè)特定的數(shù)學(xué)模型。最終google成功預(yù)測了2009冬季流感的傳播甚至可以具體到特定的地區(qū)和州。
微軟大數(shù)據(jù)成功預(yù)測奧斯卡21項(xiàng)大獎(jiǎng)。
2013年,微軟紐約研究院的經(jīng)濟(jì)學(xué)家大衛(wèi)羅斯柴爾德(David Rothschild)利用大數(shù)據(jù)成功預(yù)測24個(gè)奧斯卡獎(jiǎng)項(xiàng)中的19個(gè),成為人們津津樂道的話題。今年羅斯柴爾德再接再厲,成功預(yù)測第86屆奧斯卡金像獎(jiǎng)?lì)C獎(jiǎng)典禮24個(gè)獎(jiǎng)項(xiàng)中的21個(gè),繼續(xù)向人們展示現(xiàn)代科技的神奇魔力。
大數(shù)據(jù)應(yīng)用案例之電子郵件。
MailChimp的核心業(yè)務(wù)是提供電子郵件服務(wù),它在一年內(nèi)為大約300萬用戶發(fā)送了350億封郵件。不過真正能體現(xiàn)MailChimp未來價(jià)值的則是該公司對這些郵件數(shù)據(jù)的處理和分析。
MailChimp的一個(gè)重要任務(wù)就是搞清楚如何幫助客戶更好地了解他們所發(fā)送的信息??紤]到這一點(diǎn),該公司建立了一個(gè)服務(wù)叫Wavelength,向客戶展示了與他們相似的其他訊息。這個(gè)系統(tǒng)使得Wavelength能夠儲存公司數(shù)據(jù)庫中每個(gè)郵件地址發(fā)生的互動。這意味著告訴了你,用戶打開了什么樣的郵件,何時(shí)打開,他們點(diǎn)擊了什么鏈接,還有訂閱了什么郵件。MailChimp也有一個(gè)功能叫做Ecommerce360,能讓客戶通過轉(zhuǎn)換來跟蹤點(diǎn)擊。
文章內(nèi)容來源于網(wǎng)絡(luò),侵刪