大數(shù)據(jù)時(shí)代的變化 課件_第1頁(yè)
大數(shù)據(jù)時(shí)代的變化 課件_第2頁(yè)
大數(shù)據(jù)時(shí)代的變化 課件_第3頁(yè)
大數(shù)據(jù)時(shí)代的變化 課件_第4頁(yè)
大數(shù)據(jù)時(shí)代的變化 課件_第5頁(yè)
已閱讀5頁(yè),還剩99頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

BIGDATA大數(shù)據(jù)時(shí)代天津財(cái)經(jīng)大學(xué)企業(yè)管理系1203班BIGDATA大數(shù)據(jù)時(shí)代天津財(cái)經(jīng)大學(xué)企業(yè)管理系1BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK《大數(shù)據(jù)時(shí)代》——書籍基本信息書名:《大數(shù)據(jù)時(shí)代——生活、工作與思維的大變革》原作名:《BigData:arevolutionthatwilltransformhowwelive,workandthink》作者:維克托·邁爾-舍恩伯格肯尼思·庫(kù)克耶譯者:周濤出版社:浙江人民出版社出版年:2013年1月BusinessAdministration|Tian2BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK作者簡(jiǎn)介“維克托·邁爾一舍恩伯格二十多年來(lái)一直致力于網(wǎng)絡(luò)經(jīng)濟(jì).信息與創(chuàng)新、信息監(jiān)管、網(wǎng)絡(luò)規(guī)范與戰(zhàn)略管理的研究。從維也納大學(xué)到哈佛大學(xué),從新加坡國(guó)立大學(xué)到牛津大學(xué),世界上最著名的互聯(lián)網(wǎng)研究學(xué)府都留下了他的足跡。”而現(xiàn)在,在數(shù)據(jù)信息界孜孜不倦求索的維克托,是世界著名學(xué)府牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,牛津大學(xué)克伯學(xué)院教授研究員。法學(xué)、信息學(xué)與網(wǎng)絡(luò)等多學(xué)科的跨界融合,讓他不僅擁有嚴(yán)謹(jǐn)?shù)乃季S,更擁有廣博的視野。他先后有100多篇論文公開發(fā)表在《科學(xué)》《自然》等著名學(xué)術(shù)期刊上。同時(shí)也是多家出版機(jī)構(gòu)的特約評(píng)論員,包括啥佛大學(xué)出版社、麻省理工學(xué)院出版社、通信政策期刊、美國(guó)社會(huì)學(xué)期刊等。BusinessAdministration|Tian3BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK大數(shù)據(jù)定義大數(shù)據(jù)(BigData),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。一個(gè)數(shù)據(jù)庫(kù)并不需要有以太字節(jié)計(jì)的數(shù)據(jù)。在相撲案例中,整個(gè)數(shù)據(jù)庫(kù)包含的字節(jié)量還不如一張普通的數(shù)碼照片包含得多。但是大數(shù)據(jù)分析法不只是關(guān)注一個(gè)隨機(jī)的樣本。這里“大”取的是相對(duì)意義而不是絕對(duì)意義,也就是說(shuō)這是相對(duì)所有數(shù)據(jù)來(lái)說(shuō)的。BusinessAdministration|Tian4BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK大數(shù)據(jù)的特點(diǎn)——4“V”Volume(大量):數(shù)據(jù)體量巨大。從TB級(jí)別,躍升到EB級(jí)別(1TB=1,024GB;1PB=1,024TB;1EB=1,024PB)Variety(多樣):數(shù)據(jù)類型繁多

Velocity(高速):處理速度快Value(價(jià)值):價(jià)值密度低,商業(yè)價(jià)值高BusinessAdministration|Tian5BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK案例1大數(shù)據(jù)——變革公共衛(wèi)生2009年H1N1流行病毒背景下谷歌通過(guò)檢測(cè)檢索詞條,處理了4.5億個(gè)不同的數(shù)據(jù)模型,通過(guò)預(yù)測(cè)并與2007年、2008年美國(guó)疾控中心記錄的實(shí)際流感病例進(jìn)行對(duì)比后,確定了45條檢索詞條組合,并將其用于一個(gè)特定的數(shù)學(xué)模型后,預(yù)測(cè)的結(jié)果與官方數(shù)據(jù)的相關(guān)系數(shù)高達(dá)97%。按照傳統(tǒng)的信息返回流程,通告新流感病毒病例將有一到兩周的延遲。對(duì)于飛速傳播的疾病,信息滯后兩周是致命的。而谷歌運(yùn)用大數(shù)據(jù)技術(shù),以前所未有的方式,通過(guò)海量數(shù)據(jù)分析得出流感所傳播的范圍,為世界預(yù)測(cè)流感提供了一種更快捷的預(yù)測(cè)工具。BusinessAdministration|Tian6BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK目錄第一部分:大數(shù)據(jù)時(shí)代的思維變革第二部分:大數(shù)據(jù)時(shí)代的商業(yè)變革第三部分:大數(shù)據(jù)時(shí)代的管理變革BusinessAdministration|Tian7第一部分大數(shù)據(jù)時(shí)代的思維變革第一部分大數(shù)據(jù)時(shí)代的思維變革8BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK第一部分大數(shù)據(jù)時(shí)代的思維變革更多:不是隨機(jī)樣本,而是全體數(shù)據(jù)更雜:不是精確性,而是混雜性更好:不是因果關(guān)系,而是相關(guān)關(guān)系123BusinessAdministration|Tian9BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK01更多:不是隨機(jī)樣本,而是全體數(shù)據(jù)當(dāng)數(shù)據(jù)處理技術(shù)已經(jīng)發(fā)生了翻天覆地的變化時(shí),在大數(shù)據(jù)時(shí)代進(jìn)行抽樣分析就像在汽車時(shí)代騎馬一樣。一切都改變了,我們需要的是所有的數(shù)據(jù),“樣本=總體”。BusinessAdministration|Tian10BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK02更雜:不是精確性,而是混雜性執(zhí)迷于精確性是信息缺乏時(shí)代和模擬時(shí)代的產(chǎn)物。只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫(kù)的。如果不接受混亂,剩下95%的非結(jié)構(gòu)化數(shù)據(jù)都無(wú)法被利用,只有接受不精確性,我們才能打開一扇從未涉足的世界的窗戶。BusinessAdministration|Tian11BusinessAdministration|TianjinUniversityofFinanceandEconomics案例2無(wú)所不包的谷歌翻譯系統(tǒng)資料來(lái)源:第52頁(yè)第2章第2節(jié)——大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效IBM在名為Candide的項(xiàng)目上花費(fèi)了大概十年的時(shí)間,將大約有300萬(wàn)句之多的加拿大議會(huì)資料譯成了英語(yǔ)和法語(yǔ)并出版。翻譯的標(biāo)準(zhǔn)非常高,投入資金也很多,但取得的成效不大,最終被迫停止了該項(xiàng)目。而谷歌翻譯利用更大更雜的數(shù)據(jù)庫(kù)(上萬(wàn)億的語(yǔ)料庫(kù)),也就是全球的互聯(lián)網(wǎng)。它吸收了它能找到的所有翻譯,還會(huì)去尋找聯(lián)合國(guó)等國(guó)際組織發(fā)布的譯本。盡管其輸入源很混亂,但較其他翻譯系統(tǒng)而言,谷歌的翻譯質(zhì)量相對(duì)而言還是最好的,而且可翻譯的內(nèi)容更多。BusinessAdministration|Tian12BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK03更好:不是因果關(guān)系,而是相關(guān)關(guān)系知道“是什么”就夠了,沒(méi)必要知道“為什么”。在大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己“發(fā)聲”。BusinessAdministration|Tian13BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK03更好:不是因果關(guān)系,而是相關(guān)關(guān)系相關(guān)關(guān)系的核心是量化兩個(gè)數(shù)據(jù)值之間的數(shù)理關(guān)系相關(guān)關(guān)系強(qiáng)是指當(dāng)一個(gè)數(shù)據(jù)值增加時(shí),另一個(gè)數(shù)據(jù)值很有可能也會(huì)增加。相關(guān)關(guān)系弱就意味著當(dāng)一個(gè)數(shù)據(jù)值增加時(shí),另一個(gè)數(shù)據(jù)值幾乎不會(huì)發(fā)生變化BusinessAdministration|Tian14BusinessAdministration|TianjinUniversityofFinanceandEconomics案例3沃爾瑪,請(qǐng)把蛋撻與颶風(fēng)用品擺在一起資料來(lái)源:第71頁(yè)第3章第1節(jié)——關(guān)聯(lián)物,預(yù)測(cè)的關(guān)鍵2004年,沃爾瑪對(duì)歷史交易記錄這個(gè)龐大的數(shù)據(jù)庫(kù)進(jìn)行了觀察,這個(gè)數(shù)據(jù)庫(kù)記錄的不僅包括每一個(gè)顧客的購(gòu)物清單以及消費(fèi)額,還包括購(gòu)物籃中的物品、具體購(gòu)買時(shí)間,甚至購(gòu)買當(dāng)日天氣等。沃爾瑪公司注意到,每當(dāng)在季節(jié)性颶風(fēng)來(lái)臨之前,不僅手電筒銷量增加了,而且POP-Tarts蛋撻的銷量也增加了。因此當(dāng)季節(jié)性風(fēng)暴來(lái)臨時(shí),沃爾瑪會(huì)把庫(kù)存的蛋撻放在靠近颶風(fēng)用品的位置,以方便行色匆匆的顧客從而增加銷量。BusinessAdministration|Tian15BusinessAdministration|TianjinUniversityofFinanceandEconomics案例4美國(guó)折扣零售商塔吉特與懷孕預(yù)測(cè)資料來(lái)源:第77頁(yè)第3章第1節(jié)——關(guān)聯(lián)物,預(yù)測(cè)的關(guān)鍵塔吉特公司在完全不和準(zhǔn)媽媽對(duì)話的前提下成功的預(yù)測(cè)了一個(gè)女性會(huì)在什么時(shí)候懷孕。公司分析團(tuán)隊(duì)首先查看了簽署嬰兒禮物登記簿的女性的消費(fèi)記錄,登記簿上的婦女會(huì)在懷孕大概第三個(gè)月的時(shí)候買很多無(wú)香乳液。幾個(gè)月之后,她們會(huì)買一些營(yíng)養(yǎng)品,比如鎂、鈣、鋅。公司最終找出了大概20多種關(guān)聯(lián)物,這些關(guān)聯(lián)物可以給顧客進(jìn)行“懷孕趨勢(shì)”評(píng)分。這些相關(guān)關(guān)系甚至使得零售商能夠比較準(zhǔn)確地預(yù)測(cè)預(yù)產(chǎn)期,這樣就能夠在孕期的每個(gè)階段給客戶寄送相應(yīng)的優(yōu)惠券,這才是塔吉特公司的目的。BusinessAdministration|Tian16BusinessAdministration|TianjinUniversityofFinanceandEconomics案例4美國(guó)折扣零售商塔吉特與懷孕預(yù)測(cè)資料來(lái)源:第77頁(yè)第3章第1節(jié)——關(guān)聯(lián)物,預(yù)測(cè)的關(guān)鍵杜西格在《習(xí)慣的力量》一書中講到了接下來(lái)發(fā)生的事情。一天,一個(gè)男人沖進(jìn)了一家位于明尼阿波利斯市郊的塔吉特商店,要求經(jīng)理出來(lái)見他。他氣憤地說(shuō):“我女兒還是高中生,你們卻給她郵寄嬰兒服和嬰兒床的優(yōu)惠券,你們是在鼓勵(lì)她懷孕嗎?”而當(dāng)幾天后,經(jīng)理打電話向這個(gè)男人致歉時(shí),這個(gè)男人的語(yǔ)氣變得平和起來(lái)。他說(shuō):“我跟我的女兒談過(guò)了,她的預(yù)產(chǎn)期是8月份,是我完全沒(méi)有意識(shí)到這個(gè)事情的發(fā)生,應(yīng)該說(shuō)抱歉的人是我。”BusinessAdministration|Tian17BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK大數(shù)據(jù)的核心建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測(cè)!BusinessAdministration|Tian18第二部分大數(shù)據(jù)時(shí)代的商業(yè)變革第二部分大數(shù)據(jù)時(shí)代的商業(yè)變革19BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK第二部分大數(shù)據(jù)時(shí)代的商業(yè)變革數(shù)據(jù)化:一切皆可“量化”價(jià)值:“取之不盡,用之不竭”的數(shù)據(jù)創(chuàng)新角色定位:數(shù)據(jù)、技術(shù)與思維的三足鼎立456BusinessAdministration|Tian20BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK04數(shù)據(jù)化:一切皆可“量化”大數(shù)據(jù)發(fā)展的核心動(dòng)力來(lái)源于人類測(cè)量、記錄和分析世界的渴望。信息技術(shù)變革隨處可見,但是如今的信息技術(shù)變革的重點(diǎn)在“T”(技術(shù))上,而不是在“I”(信息)上?,F(xiàn)在,我們是時(shí)候把聚關(guān)燈打向“I”,開始關(guān)注信息本身了。BusinessAdministration|Tian21BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics案例5大數(shù)據(jù)的早期實(shí)踐資料來(lái)源:第98頁(yè)第4章第1節(jié)——莫里的導(dǎo)航圖,大數(shù)據(jù)的最早實(shí)踐之一曾經(jīng),一位美國(guó)海軍軍官在上任為圖表和儀器廠負(fù)責(zé)人時(shí),利用以前海軍的航海日志、地圖和圖表等數(shù)據(jù)整理成全新的航海圖,整合之后,這些數(shù)據(jù)顯示出了更有價(jià)值的模式,也提供了更有效的航海路線。多年后,當(dāng)他前去到歐洲為他繪制的圖表尋求國(guó)際支持的時(shí)候,四個(gè)國(guó)家授予了他爵士爵位,包括梵蒂岡在內(nèi)的其他八個(gè)國(guó)家還頒給了他金牌。即使到今天,美國(guó)海軍頒布的導(dǎo)航圖上仍然有他的名字。BusinessAdministration|Tian22BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics案例6數(shù)據(jù),從最不可能的地方提取出來(lái)資料來(lái)源:第102頁(yè)第4章第2節(jié)——日本教授的坐姿研究與汽車防盜系統(tǒng)日本先進(jìn)工業(yè)技術(shù)研究所的教授越水重臣所做的一個(gè)研究就是一個(gè)人的坐姿。很少有人會(huì)認(rèn)為一個(gè)人的坐姿能表現(xiàn)出什么信息,但其實(shí)當(dāng)一個(gè)人坐著的時(shí)候,他的身形、姿勢(shì)和重量分布都可以量化和數(shù)據(jù)化。研究者通過(guò)在汽車座椅下部安裝總共360個(gè)壓力傳感器以測(cè)量人對(duì)椅子施加壓力的方式。把人體坐姿特征轉(zhuǎn)化成了數(shù)據(jù),并且用0~256這個(gè)數(shù)值范圍對(duì)其量化,這樣就會(huì)產(chǎn)生獨(dú)屬于每個(gè)乘車者的精確數(shù)據(jù)資料。BusinessAdministration|Tian23BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics案例6數(shù)據(jù),從最不可能的地方提取出來(lái)資料來(lái)源:第102頁(yè)第4章第2節(jié)——日本教授的坐姿研究與汽車防盜系統(tǒng)這個(gè)研究并不愚蠢。這項(xiàng)技術(shù)可以作為汽車防盜系統(tǒng)安裝在車上。有了這個(gè)系統(tǒng)之后,汽車就能識(shí)別出駕駛者是不是車主,如果不是,系統(tǒng)就會(huì)要求司機(jī)輸入密碼;如果司機(jī)無(wú)法準(zhǔn)確輸入密碼汽車就會(huì)自動(dòng)熄火。把一個(gè)人的坐姿轉(zhuǎn)化為數(shù)據(jù)后,這些數(shù)據(jù)就孕育出了一些切實(shí)可行的服務(wù)和一個(gè)前景光明的產(chǎn)業(yè)。比方說(shuō),通過(guò)匯集這些數(shù)據(jù),我們可以利用事故發(fā)生之前的一些姿勢(shì)變化情況,分析出坐姿和行駛安全之間的關(guān)系。這個(gè)系統(tǒng)同樣可以在司機(jī)疲勞駕駛的時(shí)候發(fā)出警示或者自動(dòng)剎車。同時(shí),這個(gè)系統(tǒng)不但可以發(fā)現(xiàn)被盜車輛,而且可以通過(guò)收集到的數(shù)據(jù)識(shí)別出盜賊的身份。BusinessAdministration|Tian24BusinessAdministration|TianjinUniversityofFinanceandEconomics案例7收集用戶地理位置數(shù)據(jù)的能力資料來(lái)源:第118頁(yè)第4章第5節(jié)——當(dāng)方位變成數(shù)據(jù)從個(gè)人層面上來(lái)說(shuō),根據(jù)他所居住的地點(diǎn)和他要去的地方的預(yù)測(cè)數(shù)據(jù),可以為他提供定制廣告。而且,這些信息匯集起來(lái)可能會(huì)揭示事情的發(fā)展趨勢(shì)。公司可以利用大量的位置數(shù)據(jù)預(yù)測(cè)交通情況,你也許無(wú)法想象,這是通過(guò)高速公路上的手機(jī)而不是汽車的數(shù)量和移動(dòng)速度預(yù)測(cè)出來(lái)的。AirSage每天通過(guò)處理來(lái)自上百萬(wàn)手機(jī)用戶的150億條位置信息,為超過(guò)100個(gè)美國(guó)城市提供實(shí)時(shí)交通信息。BusinessAdministration|Tian25BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK05價(jià)值:“取之不盡,用之不竭”的數(shù)據(jù)創(chuàng)新數(shù)據(jù)就像一個(gè)神奇的鉆石礦,當(dāng)它的首要價(jià)值被發(fā)掘后仍能不斷給予。它的真實(shí)價(jià)值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而絕大部分都隱藏在表面之下。BusinessAdministration|Tian26BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics案例8亞馬遜,讓數(shù)據(jù)的價(jià)值再大一點(diǎn)資料來(lái)源:第136頁(yè)第5章第1節(jié)——數(shù)據(jù)的再利用亞馬遜早期與AOL達(dá)成了一項(xiàng)協(xié)議,為AOL電子商務(wù)網(wǎng)站提供后臺(tái)技術(shù)服務(wù)。在許多人眼里,這只是一個(gè)普通的外包協(xié)議,而亞馬遜真正的用意在于掌握用戶的數(shù)據(jù):他們?cè)诳词裁础①I什么?!斑@些數(shù)據(jù)可以幫助亞馬遜提高它的推薦引擎性能?!眮嗰R遜前首席科學(xué)家韋斯岸一語(yǔ)道破??蓱z的AOL從來(lái)沒(méi)有意識(shí)到這一點(diǎn),只看到了銷售這個(gè)基本用途所帶來(lái)的利益,而聰明的亞馬遜卻知道如何從二次利用中獲利。BusinessAdministration|Tian27BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics案例9驗(yàn)證碼和數(shù)據(jù)的再利用資料來(lái)源:第128頁(yè)第5章第1節(jié)——ReCaptcha與數(shù)據(jù)再利用為了區(qū)分計(jì)算機(jī)和人類的辨識(shí)程度,馮·安創(chuàng)作了驗(yàn)證碼,但是,當(dāng)他意識(shí)到每天有這么多人要浪費(fèi)10秒鐘的時(shí)間輸入這堆惱人的字母,而隨后大量的信息被隨意地丟棄時(shí),他找到了能使人的計(jì)算能力得到更有效利用的方法,即ReCaptcha。在這里數(shù)據(jù)的主要用途是證明用戶是人,但它也有第二個(gè)目的:破譯數(shù)字化文本中不清楚的單詞。2009年谷歌收購(gòu)了馮·安的公司,并將這一技術(shù)用于圖書掃描項(xiàng)目。BusinessAdministration|Tian28BusinessAdministration|TianjinUniversityofFinanceandEconomics案例10丹麥癌癥協(xié)會(huì):手機(jī)是否增加致癌率資料來(lái)源:第139頁(yè)第5章第2節(jié)——重組數(shù)據(jù)丹麥擁有1985年手機(jī)推出以來(lái)所有手機(jī)用戶的數(shù)據(jù)庫(kù),同時(shí)記錄了所有癌癥患者的信息。結(jié)合這兩個(gè)數(shù)據(jù)集后,研究人員開始尋找兩者的關(guān)系。兩個(gè)數(shù)據(jù)集都采用了嚴(yán)格的質(zhì)量標(biāo)準(zhǔn),信息的收集不存在偏差。最重要的是,這項(xiàng)研究并沒(méi)有基于任何樣本,卻很接近“樣本=總體”的準(zhǔn)則,即包括了幾乎所有癌癥患者和移動(dòng)用戶。最后,研究沒(méi)有發(fā)現(xiàn)使用移動(dòng)電話和癌癥風(fēng)險(xiǎn)增加之間存在任何關(guān)系。BusinessAdministration|Tian29BusinessAdministration|TianjinUniversityofFinanceandEconomics案例11微軟與谷歌的拼寫檢查資料來(lái)源:第145頁(yè)第5章第5節(jié)——數(shù)據(jù)廢氣“數(shù)據(jù)廢氣”是用戶在線交互的副產(chǎn)品,包括瀏覽了哪些頁(yè)面、停留多久、鼠標(biāo)光標(biāo)停留的位置、輸入了什么信息等。谷歌擁有世界上最完整的拼寫檢查器,依據(jù)的是其每天處理的30億查詢中輸入搜索框中的錯(cuò)誤拼寫。谷歌的拼寫檢查系統(tǒng)顯示,那些“不合標(biāo)準(zhǔn)”、“不正確”或“有缺陷”的數(shù)據(jù)也是非常有用的,因?yàn)樗芸赡芘c正確的拼寫高度相關(guān)。谷歌不僅利用錯(cuò)別字開發(fā)了世界上最好、最新式的拼寫檢查器來(lái)提高搜索質(zhì)量,而且將其應(yīng)用于許多其他服務(wù)中,如搜索的“自動(dòng)完成”功能、Gmail、谷歌文檔甚至翻譯系統(tǒng)。BusinessAdministration|Tian30BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK06角色定位:數(shù)據(jù)、技術(shù)與思維的三足鼎立微軟以1.1億美元的價(jià)格購(gòu)買了大數(shù)據(jù)公司Farecast,而兩年后谷歌則以7億美元的價(jià)格購(gòu)買了給Farecast提供數(shù)據(jù)的ITASoftware公司。如今,我們正處在大數(shù)據(jù)時(shí)代的早期,思維和技術(shù)是最有價(jià)值的,但是最終大部分的價(jià)值還是必須從數(shù)據(jù)本身中挖掘。BusinessAdministration|Tian31BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics案例12大數(shù)據(jù)可以變革公司的贏利模式和傳統(tǒng)交流方式資料來(lái)源:第171頁(yè)第6章第4節(jié)——大數(shù)據(jù)思維公司和個(gè)人如今的汽車裝滿了芯片、傳感器和各種軟件,一經(jīng)啟動(dòng),它們就會(huì)及時(shí)把汽車狀況信息發(fā)送到制造商的電腦上。而這些設(shè)備監(jiān)控到的汽車零部件的工作狀況,能夠在整合之后用來(lái)提高汽車的質(zhì)量,因此,能夠掌握這些數(shù)據(jù)的公司擁有非常大的競(jìng)爭(zhēng)優(yōu)勢(shì)。德國(guó)一家汽車制造商曾通過(guò)與行業(yè)外的數(shù)據(jù)分析公司合作發(fā)現(xiàn)車輛配件的紕漏,通過(guò)改進(jìn)軟件而改進(jìn)了這個(gè)零件,并且為這次改進(jìn)申請(qǐng)了專利。然后,它把這項(xiàng)專利賣給了供貨商,價(jià)格是很長(zhǎng)一段時(shí)間內(nèi)進(jìn)行數(shù)據(jù)分析的成本的總額。BusinessAdministration|Tian32BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics大數(shù)據(jù)價(jià)值鏈的三大構(gòu)成

根據(jù)所提供價(jià)值不同來(lái)源,大數(shù)據(jù)價(jià)值鏈包括三大構(gòu)成部分即:數(shù)據(jù)本身、技能與思維BusinessAdministration|Tian33BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics基于數(shù)據(jù)本身的公司

這些公司擁有著大量數(shù)據(jù)或者至少可以收集到大量的數(shù)據(jù),卻不一定有從數(shù)據(jù)中提取價(jià)值或者用數(shù)據(jù)催生創(chuàng)新思想的技能(Twitter公司、人人網(wǎng)、微博等)。這些公司擁有海量的數(shù)據(jù),可以通過(guò)獨(dú)立的公司將數(shù)據(jù)授權(quán)給別人使用。BusinessAdministration|Tian34BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics基于技能的公司

它們通常是咨詢公司、技術(shù)供應(yīng)商或者分析公司。它們掌握了專業(yè)技能但并不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)新性用途的才能。(沃爾瑪借助天睿公司)BusinessAdministration|Tian35BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics基于思維的公司

對(duì)于某些公司來(lái)說(shuō),數(shù)據(jù)和技能并不是成功的關(guān)鍵。挖掘數(shù)據(jù)新價(jià)值的創(chuàng)新思維才是這些公司脫穎而出的優(yōu)勢(shì)所在例如,皮特.華登(Jetpac的聯(lián)合創(chuàng)始人),就是通過(guò)想法獲得價(jià)值的一個(gè)例子,他通過(guò)用戶分享到網(wǎng)上的旅行照片來(lái)為人們推薦下一次旅行目的地。BusinessAdministration|Tian36第三部分大數(shù)據(jù)時(shí)代的管理變革第三部分大數(shù)據(jù)時(shí)代的管理變革37BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK第三部分大數(shù)據(jù)時(shí)代的管理變革風(fēng)險(xiǎn):讓數(shù)據(jù)主宰一切的隱憂掌控:責(zé)任與自由并舉的信息管理78BusinessAdministration|Tian38BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK07風(fēng)險(xiǎn):讓數(shù)據(jù)主宰一切的隱憂我們時(shí)刻都暴露在“第三只眼”之下:亞馬遜監(jiān)視著我們的購(gòu)物習(xí)慣,谷歌監(jiān)視著我們的網(wǎng)頁(yè)瀏覽習(xí)慣,而微博似乎什么都知道,不僅竊聽到了我們心中的“TA”,還有我們的社交關(guān)系網(wǎng)。BusinessAdministration|Tian39BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK保護(hù)個(gè)人隱私的兩種想法第一種,使用數(shù)據(jù)時(shí)征詢數(shù)據(jù)所有個(gè)人的知曉和授權(quán)難點(diǎn):收集到的數(shù)據(jù)可能會(huì)被后續(xù)的多次利用第二種,模糊化與匿名化,讓所有能揭示個(gè)人情況的信息都不出現(xiàn)在數(shù)據(jù)集里。難點(diǎn):匿名化會(huì)在數(shù)據(jù)收集越來(lái)越多和數(shù)據(jù)的相互結(jié)合關(guān)聯(lián)使用時(shí)變得無(wú)效BusinessAdministration|Tian40BusinessAdministration|TianjinUniversityofFinanceandEconomics資料來(lái)源:第196頁(yè)7章第2節(jié)——我們的隱私被二次利用了想在大數(shù)據(jù)時(shí)代中用技術(shù)方法來(lái)保護(hù)隱私就是天方夜譚。如果所有人的信息本來(lái)都已經(jīng)在數(shù)據(jù)庫(kù)里,那么有意識(shí)地避免某些信息就是此地?zé)o銀三百兩。谷歌街景利用圖像采集車豐富自己的數(shù)據(jù),引起一些業(yè)主的不滿,谷歌對(duì)這些業(yè)主的房屋或花園的影像模糊化處理,對(duì)于盜賊來(lái)說(shuō)就是此地?zé)o銀三百兩。案例13谷歌街景地圖引發(fā)的隱私侵權(quán)BusinessAdministration|Tian41BusinessAdministration|TianjinUniversityofFinanceandEconomics資料來(lái)源:第209頁(yè)第7章第4節(jié)——數(shù)據(jù)獨(dú)裁麥克納馬拉從福特二世手里接過(guò)福特公司的控制權(quán),用“數(shù)據(jù)集”的方法救活了瀕臨倒閉的福特汽車公司,但是也造成了汽車零件的極大浪費(fèi),他規(guī)定只有在舊車型的所有零件的存貨用完之后才能生產(chǎn)新的車型,憤怒的生產(chǎn)線經(jīng)理們一股腦將剩余的零件全部倒進(jìn)了附近的河里。更典型而悲痛的例子是“大躍進(jìn)”時(shí)期各地瘋狂虛報(bào)糧食產(chǎn)量,以至于中央完全沒(méi)有意識(shí)到20世紀(jì)60年代初可怕的饑荒,還在大量出口糧食以換取其他戰(zhàn)略物資。案例14數(shù)據(jù)獨(dú)裁帶來(lái)的危機(jī)BusinessAdministration|Tian42BusinessAdministration|TianjinUniversityofFinanceandEconomics資料來(lái)源:第212頁(yè)第7章第4節(jié)——數(shù)據(jù)獨(dú)裁史蒂夫·喬布斯多年來(lái)持續(xù)不斷的改善Mac筆記本,以來(lái)的可能是行業(yè)分析,但他發(fā)行的iPod/iPhone和iPad靠的就不是數(shù)據(jù),而是直覺(jué)——他依賴于他的第六感。當(dāng)記者問(wèn)及喬布斯蘋果推出iPad之前做了多少市場(chǎng)調(diào)研時(shí),他那個(gè)著名的回答是這樣的:“沒(méi)做,消費(fèi)者沒(méi)有義務(wù)去了解自己想要什么。”只要得到合理的利用,而不單純只是為了“數(shù)據(jù)”而“數(shù)據(jù)”,大數(shù)據(jù)就會(huì)變成強(qiáng)大的武器。案例15卓越的才華并不依賴于數(shù)據(jù)BusinessAdministration|Tian43BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK08掌控:責(zé)任與自由并舉的信息管理當(dāng)世界開始邁向大數(shù)據(jù)時(shí)代時(shí),社會(huì)也將經(jīng)歷類似的地殼運(yùn)動(dòng)。在改變?nèi)祟惢镜纳钆c思考方式的同時(shí),大數(shù)據(jù)早已在推動(dòng)人類信息管理準(zhǔn)則的重新定位。然而,不同于印刷革命,我們沒(méi)有幾個(gè)世紀(jì)的時(shí)間去適應(yīng),我們也許只有幾年時(shí)間。BusinessAdministration|Tian44BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK管理變革1:讓數(shù)據(jù)使用者承擔(dān)責(zé)任管理變革1:個(gè)人隱私保護(hù),從個(gè)人許可到讓數(shù)據(jù)使用者承擔(dān)責(zé)任。數(shù)十年來(lái),全球范圍內(nèi)的隱私規(guī)范都開始讓人們自主決定是否、如何以及經(jīng)由誰(shuí)來(lái)處理他們的信息,把這種控制權(quán)放在了人們自己手中,這也是隱私規(guī)范的核心準(zhǔn)則。在互聯(lián)網(wǎng)時(shí)代,這個(gè)偉大的理想往往會(huì)演變成“告知與許可”的公式化系統(tǒng)。在大數(shù)據(jù)時(shí)代,我們需要設(shè)立一個(gè)不一樣的隱私保護(hù)模式,這個(gè)模式應(yīng)該更著重于數(shù)據(jù)使用者為其行為承擔(dān)責(zé)任,而不是將重心放在收集數(shù)據(jù)之初取得個(gè)人同意上。BusinessAdministration|Tian45BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK管理變革2:個(gè)人動(dòng)因VS預(yù)測(cè)分析管理變革2:個(gè)人動(dòng)因VS預(yù)測(cè)分析在大數(shù)據(jù)時(shí)代,關(guān)于公正的概念需要重新定義以維護(hù)個(gè)人動(dòng)因的想法:人們選擇自我行為的自由意志。簡(jiǎn)單地說(shuō),就是個(gè)人可以并應(yīng)該為他們的行為而非傾向負(fù)責(zé)。通過(guò)保證個(gè)人動(dòng)因,我們可以確保政府對(duì)我們行為的評(píng)判是基于真實(shí)行為而非單純依靠大數(shù)據(jù)分析。從而,政府只能依法對(duì)我們過(guò)去的真實(shí)行為進(jìn)行追究,而不可以追究大數(shù)據(jù)預(yù)測(cè)到的我們的未來(lái)行為。BusinessAdministration|Tian46BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK管理變革3:擊碎黑盒子,大數(shù)據(jù)算法師的崛起管理變革3:擊碎黑盒子,大數(shù)據(jù)算法師的崛起。大數(shù)據(jù)的運(yùn)作是在一個(gè)超出我們正常理解的范圍之上的。我們能看到大數(shù)據(jù)預(yù)測(cè)、運(yùn)算法則和數(shù)據(jù)庫(kù)有變?yōu)楹诤凶拥娘L(fēng)險(xiǎn),這個(gè)黑盒子不透明、不可解釋、不可追蹤,因而我們對(duì)其信心全無(wú)。社會(huì)發(fā)展出現(xiàn)過(guò)很多這種情況,當(dāng)一個(gè)特定領(lǐng)域變得特別復(fù)雜和專門化之后,就會(huì)催生出對(duì)運(yùn)用新技術(shù)的專門人才的迫切需求。BusinessAdministration|Tian47BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK管理變革4:反數(shù)據(jù)壟斷大亨管理變革4:反數(shù)據(jù)壟斷大亨。為了確保給大數(shù)據(jù)提供一個(gè)與早期技術(shù)領(lǐng)域情況相當(dāng)?shù)幕钴S的市場(chǎng)環(huán)境,我們應(yīng)該實(shí)現(xiàn)數(shù)據(jù)交易,比如通過(guò)授權(quán)和協(xié)同合作的方式。但是,這就引發(fā)了一個(gè)問(wèn)題:精心達(dá)到平衡的數(shù)據(jù)獨(dú)有權(quán),是否能讓社會(huì)大眾從中獲利?反壟斷法遏制了權(quán)力的濫用。然而令人驚奇的是,這些條例能從一個(gè)領(lǐng)域完美轉(zhuǎn)移到另外一個(gè)領(lǐng)域,并且適用于不同類型的網(wǎng)絡(luò)產(chǎn)業(yè)。這種不帶任何偏袒的強(qiáng)有力的規(guī)章非常實(shí)用,因?yàn)樗峁┑氖且粋€(gè)平等的競(jìng)爭(zhēng)平臺(tái),一開始便沒(méi)有任何優(yōu)劣之分。BusinessAdministration|Tian48BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK書籍推薦電影:《點(diǎn)球成金》影片《點(diǎn)球成金》改編自邁克爾·劉易斯的《魔球——逆境中制勝的智慧》。講述奧克蘭運(yùn)動(dòng)家棒球隊(duì)總經(jīng)理比利·比恩(BillyBeane)的經(jīng)營(yíng)哲學(xué),作品描寫了他拋棄幾百年一直依賴的選擇球員的傳統(tǒng)慣例,并采用了一種依靠電腦程序和數(shù)學(xué)模型分析比賽數(shù)據(jù)來(lái)選擇球員的方法。比恩的做法打破了一切的常規(guī)慣例,就如同伽利略用“太陽(yáng)中心論”來(lái)挑戰(zhàn)天主教的權(quán)威一樣。最終,比恩帶領(lǐng)這支備受爭(zhēng)議的球隊(duì)在2002年的美國(guó)聯(lián)盟西部賽中奪得冠軍,還取得了20場(chǎng)連勝的戰(zhàn)績(jī)。BusinessAdministration|Tian49BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK結(jié)語(yǔ)1——摘自電影《點(diǎn)球成金》

總是,這不僅威脅到整個(gè)經(jīng)營(yíng)模式,在他們的心目中,這威脅到整個(gè)運(yùn)動(dòng)理念。真的,這威脅到他們的生存方式、他們的飯碗、威脅到他們做事的方式。每次出現(xiàn)這種事,無(wú)論是政府行為、還是商業(yè)行為,無(wú)論是什么,手握掌控權(quán)的人、可以一手遮天的人他們會(huì)發(fā)瘋。你看,那些不拆散現(xiàn)有球隊(duì),不按你的模式重組球隊(duì)的人,他們就是將滅絕的恐龍。今年10月,他們會(huì)坐在自家沙發(fā)上,眼睜睜看著波士頓紅襪隊(duì)贏得世界大賽冠軍。

Always.Thisisthreateningnotjustawayofdoingbusiness,butintheirminds,it'sthreateningthegame.Really,whatit'sthreateningistheirlivelihood,theirjobs.It'sthreateningthewaythattheydothings.Everytimethathappens,whetherit'sagovernment,awayofdoingbusiness,whatever,thepeoplewhoareholdingthereins,theyhavetheirhandsontheswitch,theygobatshitcrazy.Imean,anybodywho'snottearingtheirteamdownrightnowandrebuildingitusingyourmodel,they'redinosaurs.They'llbesittingontheirassonthesofainOctoberwatchingtheBostonRedSoxwintheWorldSeries.BusinessAdministration|Tian50BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK結(jié)語(yǔ)2——《刪除》(維克托·邁爾-舍恩伯格)《刪除》講述了遺忘的美德,為讀者展現(xiàn)了大數(shù)據(jù)時(shí)代的取舍之道。從大數(shù)據(jù)時(shí)代信息取舍的目的和方法分別詮釋了“被遺忘的權(quán)利”?!秳h除》開啟了一場(chǎng)“互聯(lián)網(wǎng)遺忘運(yùn)動(dòng)”,讓我們始終記得遺忘的美德。這本書告訴我們,在大數(shù)據(jù)時(shí)代,面對(duì)海量信息人類該如何取舍,怎樣才能構(gòu)建一個(gè)積極而安全的未來(lái)。BusinessAdministration|Tian51

“凡是過(guò)去,皆為序曲”讀完此書,我們對(duì)大數(shù)據(jù)的認(rèn)識(shí)才剛剛開始

“凡是過(guò)去,皆為序曲”52BIGDATA大數(shù)據(jù)時(shí)代天津財(cái)經(jīng)大學(xué)企業(yè)管理系1203班BIGDATA大數(shù)據(jù)時(shí)代天津財(cái)經(jīng)大學(xué)企業(yè)管理系53BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK《大數(shù)據(jù)時(shí)代》——書籍基本信息書名:《大數(shù)據(jù)時(shí)代——生活、工作與思維的大變革》原作名:《BigData:arevolutionthatwilltransformhowwelive,workandthink》作者:維克托·邁爾-舍恩伯格肯尼思·庫(kù)克耶譯者:周濤出版社:浙江人民出版社出版年:2013年1月BusinessAdministration|Tian54BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK作者簡(jiǎn)介“維克托·邁爾一舍恩伯格二十多年來(lái)一直致力于網(wǎng)絡(luò)經(jīng)濟(jì).信息與創(chuàng)新、信息監(jiān)管、網(wǎng)絡(luò)規(guī)范與戰(zhàn)略管理的研究。從維也納大學(xué)到哈佛大學(xué),從新加坡國(guó)立大學(xué)到牛津大學(xué),世界上最著名的互聯(lián)網(wǎng)研究學(xué)府都留下了他的足跡。”而現(xiàn)在,在數(shù)據(jù)信息界孜孜不倦求索的維克托,是世界著名學(xué)府牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,牛津大學(xué)克伯學(xué)院教授研究員。法學(xué)、信息學(xué)與網(wǎng)絡(luò)等多學(xué)科的跨界融合,讓他不僅擁有嚴(yán)謹(jǐn)?shù)乃季S,更擁有廣博的視野。他先后有100多篇論文公開發(fā)表在《科學(xué)》《自然》等著名學(xué)術(shù)期刊上。同時(shí)也是多家出版機(jī)構(gòu)的特約評(píng)論員,包括啥佛大學(xué)出版社、麻省理工學(xué)院出版社、通信政策期刊、美國(guó)社會(huì)學(xué)期刊等。BusinessAdministration|Tian55BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK大數(shù)據(jù)定義大數(shù)據(jù)(BigData),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。一個(gè)數(shù)據(jù)庫(kù)并不需要有以太字節(jié)計(jì)的數(shù)據(jù)。在相撲案例中,整個(gè)數(shù)據(jù)庫(kù)包含的字節(jié)量還不如一張普通的數(shù)碼照片包含得多。但是大數(shù)據(jù)分析法不只是關(guān)注一個(gè)隨機(jī)的樣本。這里“大”取的是相對(duì)意義而不是絕對(duì)意義,也就是說(shuō)這是相對(duì)所有數(shù)據(jù)來(lái)說(shuō)的。BusinessAdministration|Tian56BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK大數(shù)據(jù)的特點(diǎn)——4“V”Volume(大量):數(shù)據(jù)體量巨大。從TB級(jí)別,躍升到EB級(jí)別(1TB=1,024GB;1PB=1,024TB;1EB=1,024PB)Variety(多樣):數(shù)據(jù)類型繁多

Velocity(高速):處理速度快Value(價(jià)值):價(jià)值密度低,商業(yè)價(jià)值高BusinessAdministration|Tian57BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK案例1大數(shù)據(jù)——變革公共衛(wèi)生2009年H1N1流行病毒背景下谷歌通過(guò)檢測(cè)檢索詞條,處理了4.5億個(gè)不同的數(shù)據(jù)模型,通過(guò)預(yù)測(cè)并與2007年、2008年美國(guó)疾控中心記錄的實(shí)際流感病例進(jìn)行對(duì)比后,確定了45條檢索詞條組合,并將其用于一個(gè)特定的數(shù)學(xué)模型后,預(yù)測(cè)的結(jié)果與官方數(shù)據(jù)的相關(guān)系數(shù)高達(dá)97%。按照傳統(tǒng)的信息返回流程,通告新流感病毒病例將有一到兩周的延遲。對(duì)于飛速傳播的疾病,信息滯后兩周是致命的。而谷歌運(yùn)用大數(shù)據(jù)技術(shù),以前所未有的方式,通過(guò)海量數(shù)據(jù)分析得出流感所傳播的范圍,為世界預(yù)測(cè)流感提供了一種更快捷的預(yù)測(cè)工具。BusinessAdministration|Tian58BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK目錄第一部分:大數(shù)據(jù)時(shí)代的思維變革第二部分:大數(shù)據(jù)時(shí)代的商業(yè)變革第三部分:大數(shù)據(jù)時(shí)代的管理變革BusinessAdministration|Tian59第一部分大數(shù)據(jù)時(shí)代的思維變革第一部分大數(shù)據(jù)時(shí)代的思維變革60BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK第一部分大數(shù)據(jù)時(shí)代的思維變革更多:不是隨機(jī)樣本,而是全體數(shù)據(jù)更雜:不是精確性,而是混雜性更好:不是因果關(guān)系,而是相關(guān)關(guān)系123BusinessAdministration|Tian61BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK01更多:不是隨機(jī)樣本,而是全體數(shù)據(jù)當(dāng)數(shù)據(jù)處理技術(shù)已經(jīng)發(fā)生了翻天覆地的變化時(shí),在大數(shù)據(jù)時(shí)代進(jìn)行抽樣分析就像在汽車時(shí)代騎馬一樣。一切都改變了,我們需要的是所有的數(shù)據(jù),“樣本=總體”。BusinessAdministration|Tian62BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK02更雜:不是精確性,而是混雜性執(zhí)迷于精確性是信息缺乏時(shí)代和模擬時(shí)代的產(chǎn)物。只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫(kù)的。如果不接受混亂,剩下95%的非結(jié)構(gòu)化數(shù)據(jù)都無(wú)法被利用,只有接受不精確性,我們才能打開一扇從未涉足的世界的窗戶。BusinessAdministration|Tian63BusinessAdministration|TianjinUniversityofFinanceandEconomics案例2無(wú)所不包的谷歌翻譯系統(tǒng)資料來(lái)源:第52頁(yè)第2章第2節(jié)——大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效IBM在名為Candide的項(xiàng)目上花費(fèi)了大概十年的時(shí)間,將大約有300萬(wàn)句之多的加拿大議會(huì)資料譯成了英語(yǔ)和法語(yǔ)并出版。翻譯的標(biāo)準(zhǔn)非常高,投入資金也很多,但取得的成效不大,最終被迫停止了該項(xiàng)目。而谷歌翻譯利用更大更雜的數(shù)據(jù)庫(kù)(上萬(wàn)億的語(yǔ)料庫(kù)),也就是全球的互聯(lián)網(wǎng)。它吸收了它能找到的所有翻譯,還會(huì)去尋找聯(lián)合國(guó)等國(guó)際組織發(fā)布的譯本。盡管其輸入源很混亂,但較其他翻譯系統(tǒng)而言,谷歌的翻譯質(zhì)量相對(duì)而言還是最好的,而且可翻譯的內(nèi)容更多。BusinessAdministration|Tian64BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK03更好:不是因果關(guān)系,而是相關(guān)關(guān)系知道“是什么”就夠了,沒(méi)必要知道“為什么”。在大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己“發(fā)聲”。BusinessAdministration|Tian65BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK03更好:不是因果關(guān)系,而是相關(guān)關(guān)系相關(guān)關(guān)系的核心是量化兩個(gè)數(shù)據(jù)值之間的數(shù)理關(guān)系相關(guān)關(guān)系強(qiáng)是指當(dāng)一個(gè)數(shù)據(jù)值增加時(shí),另一個(gè)數(shù)據(jù)值很有可能也會(huì)增加。相關(guān)關(guān)系弱就意味著當(dāng)一個(gè)數(shù)據(jù)值增加時(shí),另一個(gè)數(shù)據(jù)值幾乎不會(huì)發(fā)生變化BusinessAdministration|Tian66BusinessAdministration|TianjinUniversityofFinanceandEconomics案例3沃爾瑪,請(qǐng)把蛋撻與颶風(fēng)用品擺在一起資料來(lái)源:第71頁(yè)第3章第1節(jié)——關(guān)聯(lián)物,預(yù)測(cè)的關(guān)鍵2004年,沃爾瑪對(duì)歷史交易記錄這個(gè)龐大的數(shù)據(jù)庫(kù)進(jìn)行了觀察,這個(gè)數(shù)據(jù)庫(kù)記錄的不僅包括每一個(gè)顧客的購(gòu)物清單以及消費(fèi)額,還包括購(gòu)物籃中的物品、具體購(gòu)買時(shí)間,甚至購(gòu)買當(dāng)日天氣等。沃爾瑪公司注意到,每當(dāng)在季節(jié)性颶風(fēng)來(lái)臨之前,不僅手電筒銷量增加了,而且POP-Tarts蛋撻的銷量也增加了。因此當(dāng)季節(jié)性風(fēng)暴來(lái)臨時(shí),沃爾瑪會(huì)把庫(kù)存的蛋撻放在靠近颶風(fēng)用品的位置,以方便行色匆匆的顧客從而增加銷量。BusinessAdministration|Tian67BusinessAdministration|TianjinUniversityofFinanceandEconomics案例4美國(guó)折扣零售商塔吉特與懷孕預(yù)測(cè)資料來(lái)源:第77頁(yè)第3章第1節(jié)——關(guān)聯(lián)物,預(yù)測(cè)的關(guān)鍵塔吉特公司在完全不和準(zhǔn)媽媽對(duì)話的前提下成功的預(yù)測(cè)了一個(gè)女性會(huì)在什么時(shí)候懷孕。公司分析團(tuán)隊(duì)首先查看了簽署嬰兒禮物登記簿的女性的消費(fèi)記錄,登記簿上的婦女會(huì)在懷孕大概第三個(gè)月的時(shí)候買很多無(wú)香乳液。幾個(gè)月之后,她們會(huì)買一些營(yíng)養(yǎng)品,比如鎂、鈣、鋅。公司最終找出了大概20多種關(guān)聯(lián)物,這些關(guān)聯(lián)物可以給顧客進(jìn)行“懷孕趨勢(shì)”評(píng)分。這些相關(guān)關(guān)系甚至使得零售商能夠比較準(zhǔn)確地預(yù)測(cè)預(yù)產(chǎn)期,這樣就能夠在孕期的每個(gè)階段給客戶寄送相應(yīng)的優(yōu)惠券,這才是塔吉特公司的目的。BusinessAdministration|Tian68BusinessAdministration|TianjinUniversityofFinanceandEconomics案例4美國(guó)折扣零售商塔吉特與懷孕預(yù)測(cè)資料來(lái)源:第77頁(yè)第3章第1節(jié)——關(guān)聯(lián)物,預(yù)測(cè)的關(guān)鍵杜西格在《習(xí)慣的力量》一書中講到了接下來(lái)發(fā)生的事情。一天,一個(gè)男人沖進(jìn)了一家位于明尼阿波利斯市郊的塔吉特商店,要求經(jīng)理出來(lái)見他。他氣憤地說(shuō):“我女兒還是高中生,你們卻給她郵寄嬰兒服和嬰兒床的優(yōu)惠券,你們是在鼓勵(lì)她懷孕嗎?”而當(dāng)幾天后,經(jīng)理打電話向這個(gè)男人致歉時(shí),這個(gè)男人的語(yǔ)氣變得平和起來(lái)。他說(shuō):“我跟我的女兒談過(guò)了,她的預(yù)產(chǎn)期是8月份,是我完全沒(méi)有意識(shí)到這個(gè)事情的發(fā)生,應(yīng)該說(shuō)抱歉的人是我。”BusinessAdministration|Tian69BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK大數(shù)據(jù)的核心建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測(cè)!BusinessAdministration|Tian70第二部分大數(shù)據(jù)時(shí)代的商業(yè)變革第二部分大數(shù)據(jù)時(shí)代的商業(yè)變革71BusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK第二部分大數(shù)據(jù)時(shí)代的商業(yè)變革數(shù)據(jù)化:一切皆可“量化”價(jià)值:“取之不盡,用之不竭”的數(shù)據(jù)創(chuàng)新角色定位:數(shù)據(jù)、技術(shù)與思維的三足鼎立456BusinessAdministration|Tian72BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK04數(shù)據(jù)化:一切皆可“量化”大數(shù)據(jù)發(fā)展的核心動(dòng)力來(lái)源于人類測(cè)量、記錄和分析世界的渴望。信息技術(shù)變革隨處可見,但是如今的信息技術(shù)變革的重點(diǎn)在“T”(技術(shù))上,而不是在“I”(信息)上?,F(xiàn)在,我們是時(shí)候把聚關(guān)燈打向“I”,開始關(guān)注信息本身了。BusinessAdministration|Tian73BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics案例5大數(shù)據(jù)的早期實(shí)踐資料來(lái)源:第98頁(yè)第4章第1節(jié)——莫里的導(dǎo)航圖,大數(shù)據(jù)的最早實(shí)踐之一曾經(jīng),一位美國(guó)海軍軍官在上任為圖表和儀器廠負(fù)責(zé)人時(shí),利用以前海軍的航海日志、地圖和圖表等數(shù)據(jù)整理成全新的航海圖,整合之后,這些數(shù)據(jù)顯示出了更有價(jià)值的模式,也提供了更有效的航海路線。多年后,當(dāng)他前去到歐洲為他繪制的圖表尋求國(guó)際支持的時(shí)候,四個(gè)國(guó)家授予了他爵士爵位,包括梵蒂岡在內(nèi)的其他八個(gè)國(guó)家還頒給了他金牌。即使到今天,美國(guó)海軍頒布的導(dǎo)航圖上仍然有他的名字。BusinessAdministration|Tian74BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics案例6數(shù)據(jù),從最不可能的地方提取出來(lái)資料來(lái)源:第102頁(yè)第4章第2節(jié)——日本教授的坐姿研究與汽車防盜系統(tǒng)日本先進(jìn)工業(yè)技術(shù)研究所的教授越水重臣所做的一個(gè)研究就是一個(gè)人的坐姿。很少有人會(huì)認(rèn)為一個(gè)人的坐姿能表現(xiàn)出什么信息,但其實(shí)當(dāng)一個(gè)人坐著的時(shí)候,他的身形、姿勢(shì)和重量分布都可以量化和數(shù)據(jù)化。研究者通過(guò)在汽車座椅下部安裝總共360個(gè)壓力傳感器以測(cè)量人對(duì)椅子施加壓力的方式。把人體坐姿特征轉(zhuǎn)化成了數(shù)據(jù),并且用0~256這個(gè)數(shù)值范圍對(duì)其量化,這樣就會(huì)產(chǎn)生獨(dú)屬于每個(gè)乘車者的精確數(shù)據(jù)資料。BusinessAdministration|Tian75BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics案例6數(shù)據(jù),從最不可能的地方提取出來(lái)資料來(lái)源:第102頁(yè)第4章第2節(jié)——日本教授的坐姿研究與汽車防盜系統(tǒng)這個(gè)研究并不愚蠢。這項(xiàng)技術(shù)可以作為汽車防盜系統(tǒng)安裝在車上。有了這個(gè)系統(tǒng)之后,汽車就能識(shí)別出駕駛者是不是車主,如果不是,系統(tǒng)就會(huì)要求司機(jī)輸入密碼;如果司機(jī)無(wú)法準(zhǔn)確輸入密碼汽車就會(huì)自動(dòng)熄火。把一個(gè)人的坐姿轉(zhuǎn)化為數(shù)據(jù)后,這些數(shù)據(jù)就孕育出了一些切實(shí)可行的服務(wù)和一個(gè)前景光明的產(chǎn)業(yè)。比方說(shuō),通過(guò)匯集這些數(shù)據(jù),我們可以利用事故發(fā)生之前的一些姿勢(shì)變化情況,分析出坐姿和行駛安全之間的關(guān)系。這個(gè)系統(tǒng)同樣可以在司機(jī)疲勞駕駛的時(shí)候發(fā)出警示或者自動(dòng)剎車。同時(shí),這個(gè)系統(tǒng)不但可以發(fā)現(xiàn)被盜車輛,而且可以通過(guò)收集到的數(shù)據(jù)識(shí)別出盜賊的身份。BusinessAdministration|Tian76BusinessAdministration|TianjinUniversityofFinanceandEconomics案例7收集用戶地理位置數(shù)據(jù)的能力資料來(lái)源:第118頁(yè)第4章第5節(jié)——當(dāng)方位變成數(shù)據(jù)從個(gè)人層面上來(lái)說(shuō),根據(jù)他所居住的地點(diǎn)和他要去的地方的預(yù)測(cè)數(shù)據(jù),可以為他提供定制廣告。而且,這些信息匯集起來(lái)可能會(huì)揭示事情的發(fā)展趨勢(shì)。公司可以利用大量的位置數(shù)據(jù)預(yù)測(cè)交通情況,你也許無(wú)法想象,這是通過(guò)高速公路上的手機(jī)而不是汽車的數(shù)量和移動(dòng)速度預(yù)測(cè)出來(lái)的。AirSage每天通過(guò)處理來(lái)自上百萬(wàn)手機(jī)用戶的150億條位置信息,為超過(guò)100個(gè)美國(guó)城市提供實(shí)時(shí)交通信息。BusinessAdministration|Tian77BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK05價(jià)值:“取之不盡,用之不竭”的數(shù)據(jù)創(chuàng)新數(shù)據(jù)就像一個(gè)神奇的鉆石礦,當(dāng)它的首要價(jià)值被發(fā)掘后仍能不斷給予。它的真實(shí)價(jià)值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而絕大部分都隱藏在表面之下。BusinessAdministration|Tian78BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics案例8亞馬遜,讓數(shù)據(jù)的價(jià)值再大一點(diǎn)資料來(lái)源:第136頁(yè)第5章第1節(jié)——數(shù)據(jù)的再利用亞馬遜早期與AOL達(dá)成了一項(xiàng)協(xié)議,為AOL電子商務(wù)網(wǎng)站提供后臺(tái)技術(shù)服務(wù)。在許多人眼里,這只是一個(gè)普通的外包協(xié)議,而亞馬遜真正的用意在于掌握用戶的數(shù)據(jù):他們?cè)诳词裁?、買什么?!斑@些數(shù)據(jù)可以幫助亞馬遜提高它的推薦引擎性能。”亞馬遜前首席科學(xué)家韋斯岸一語(yǔ)道破??蓱z的AOL從來(lái)沒(méi)有意識(shí)到這一點(diǎn),只看到了銷售這個(gè)基本用途所帶來(lái)的利益,而聰明的亞馬遜卻知道如何從二次利用中獲利。BusinessAdministration|Tian79BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics案例9驗(yàn)證碼和數(shù)據(jù)的再利用資料來(lái)源:第128頁(yè)第5章第1節(jié)——ReCaptcha與數(shù)據(jù)再利用為了區(qū)分計(jì)算機(jī)和人類的辨識(shí)程度,馮·安創(chuàng)作了驗(yàn)證碼,但是,當(dāng)他意識(shí)到每天有這么多人要浪費(fèi)10秒鐘的時(shí)間輸入這堆惱人的字母,而隨后大量的信息被隨意地丟棄時(shí),他找到了能使人的計(jì)算能力得到更有效利用的方法,即ReCaptcha。在這里數(shù)據(jù)的主要用途是證明用戶是人,但它也有第二個(gè)目的:破譯數(shù)字化文本中不清楚的單詞。2009年谷歌收購(gòu)了馮·安的公司,并將這一技術(shù)用于圖書掃描項(xiàng)目。BusinessAdministration|Tian80BusinessAdministration|TianjinUniversityofFinanceandEconomics案例10丹麥癌癥協(xié)會(huì):手機(jī)是否增加致癌率資料來(lái)源:第139頁(yè)第5章第2節(jié)——重組數(shù)據(jù)丹麥擁有1985年手機(jī)推出以來(lái)所有手機(jī)用戶的數(shù)據(jù)庫(kù),同時(shí)記錄了所有癌癥患者的信息。結(jié)合這兩個(gè)數(shù)據(jù)集后,研究人員開始尋找兩者的關(guān)系。兩個(gè)數(shù)據(jù)集都采用了嚴(yán)格的質(zhì)量標(biāo)準(zhǔn),信息的收集不存在偏差。最重要的是,這項(xiàng)研究并沒(méi)有基于任何樣本,卻很接近“樣本=總體”的準(zhǔn)則,即包括了幾乎所有癌癥患者和移動(dòng)用戶。最后,研究沒(méi)有發(fā)現(xiàn)使用移動(dòng)電話和癌癥風(fēng)險(xiǎn)增加之間存在任何關(guān)系。BusinessAdministration|Tian81BusinessAdministration|TianjinUniversityofFinanceandEconomics案例11微軟與谷歌的拼寫檢查資料來(lái)源:第145頁(yè)第5章第5節(jié)——數(shù)據(jù)廢氣“數(shù)據(jù)廢氣”是用戶在線交互的副產(chǎn)品,包括瀏覽了哪些頁(yè)面、停留多久、鼠標(biāo)光標(biāo)停留的位置、輸入了什么信息等。谷歌擁有世界上最完整的拼寫檢查器,依據(jù)的是其每天處理的30億查詢中輸入搜索框中的錯(cuò)誤拼寫。谷歌的拼寫檢查系統(tǒng)顯示,那些“不合標(biāo)準(zhǔn)”、“不正確”或“有缺陷”的數(shù)據(jù)也是非常有用的,因?yàn)樗芸赡芘c正確的拼寫高度相關(guān)。谷歌不僅利用錯(cuò)別字開發(fā)了世界上最好、最新式的拼寫檢查器來(lái)提高搜索質(zhì)量,而且將其應(yīng)用于許多其他服務(wù)中,如搜索的“自動(dòng)完成”功能、Gmail、谷歌文檔甚至翻譯系統(tǒng)。BusinessAdministration|Tian82BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomicsAREVOLUTIONTHATWILLTRANSFROMHOWWELIVE,WORK,ANDTHINK06角色定位:數(shù)據(jù)、技術(shù)與思維的三足鼎立微軟以1.1億美元的價(jià)格購(gòu)買了大數(shù)據(jù)公司Farecast,而兩年后谷歌則以7億美元的價(jià)格購(gòu)買了給Farecast提供數(shù)據(jù)的ITASoftware公司。如今,我們正處在大數(shù)據(jù)時(shí)代的早期,思維和技術(shù)是最有價(jià)值的,但是最終大部分的價(jià)值還是必須從數(shù)據(jù)本身中挖掘。BusinessAdministration|Tian83BusinessAdministration|TianjinUniversityofFinanceandEconomicsBusinessAdministration|TianjinUniversityofFinanceandEconomics案例12大數(shù)據(jù)可以變革公司的贏利模式和傳統(tǒng)交流方式資料來(lái)源:第171頁(yè)第6章第4節(jié)——大數(shù)據(jù)思維公司和個(gè)人如今的汽車裝滿了芯片、傳感器和各種軟件,一經(jīng)啟動(dòng),它們就會(huì)及時(shí)把汽車狀況信息發(fā)送到制造商的電腦上。而這些設(shè)備監(jiān)控到的汽車零部件的工作狀況,能夠在整合之后用來(lái)提高汽車的質(zhì)量,因此,能夠掌握這些數(shù)據(jù)的公司擁有

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論