大數據及其現實應用-講座_第1頁
大數據及其現實應用-講座_第2頁
大數據及其現實應用-講座_第3頁
大數據及其現實應用-講座_第4頁
大數據及其現實應用-講座_第5頁
已閱讀5頁,還剩98頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

大數據及其現實應用管理學院周功建開放作業(yè)題目結合自己的專業(yè)特點,寫一篇大數據應用論文!要求:找準大數據在本專業(yè)的一個具體應用點進行展開,將自己設定為某公司的首席數據運營官,用大數據的思維幫助企業(yè)提高數據應用能力和業(yè)務分析水平。討論大數據的時點上市時間公司創(chuàng)新時代鼎盛期1996雅虎網頁聚合WEB1.08年2004谷歌主題詞聚合WEB1.58年2012FACEBOOK使用者聚合WEB2.08年?2020??數據聚合?WEB3.0??大數據熱反映出人們在猜測追尋下一個大創(chuàng)新內容提示認識大數據大數據帶來的變革大數據的商業(yè)價值大數據的運用案例分析迎接大數據時代到來的條件硬件成本的降低網絡帶寬的提升云計算的興起網絡技術的發(fā)展智能終端的普及電子商務、社交網絡、電子地圖等的全面應用物聯網迎接大數據時代到來的條件硬件成本的降低網絡帶寬的提升云計算的興起網絡技術的發(fā)展智能終端的普及電子商務、社交網絡、電子地圖等的全面應用物聯網迎接大數據時代到來的條件硬件成本的降低網絡帶寬的提升云計算的興起網絡技術的發(fā)展智能終端的普及電子商務、社交網絡、電子地圖等的全面應用物聯網迎接大數據時代到來的條件硬件成本的降低網絡帶寬的提升云計算的興起網絡技術的發(fā)展智能終端的普及電子商務、社交網絡、電子地圖等的全面應用物聯網迎接大數據時代到來的條件硬件成本的降低網絡帶寬的提升云計算的興起網絡技術的發(fā)展智能終端的普及電子商務、社交網絡、電子地圖等的全面應用物聯網迎接大數據時時代到來的條條件硬件成本的降降低網絡帶寬的提提升云計算的興起起網絡技術的發(fā)發(fā)展智能終端的普普及電子商務、社社交網絡、電電子地圖等的的全面應用物聯網迎接大數據時時代到來的條條件硬件成本的降降低網絡帶寬的提提升云計算的興起起網絡技術的發(fā)發(fā)展智能終端的普普及電子商務、社社交網絡、電電子地圖等的的全面應用物聯網如今,我們處處在大數據時時代當前互聯網條條件下大數據據的典型代表表1-用戶行為數據據(精準廣告投放放、內容推薦薦、行為習慣慣和喜好分析析、產品優(yōu)化化等)2-用戶消費數據據(精準營銷、信信用記錄分析析、活動促銷銷、理財等)3-用戶地理位置置數據(o2o推廣,商家推推薦,交友推推薦等)4-互聯網金融數數據(P2P,小額貸款,,支付,信用用,供應鏈金金融等)5-用戶社交數據據(趨勢分析、、流行元素分分析、受歡迎迎程度分析、、輿論監(jiān)控分分析、社會問問題分析等)擁抱大數據什么是大數據據百度百科:大數據(bigdata),或稱巨量資資料,指的是是所涉及的資資料量規(guī)模巨大到無法透過目目前主流軟件件工具,在合合理時間內達達到擷取、管管理、處理、、并整理成為為幫助企業(yè)經經營決策更積積極目的的資訊。維基百科:大數據是由數數量巨大、結結構復雜、類類型眾多數據據構成的數據集合,是基于云計計算的數據處處理與應用模模式,通過數數據的整合共共享,交叉復復用形成的智力資源和知識服務能力。我的觀點:大數據是由由大量異構的的數據組成的的數據集合,它是可以應應用合理的數數學算法或工工具從中找出出有價值的信信息,為人們們帶來利益的的一門新興學科。大數據與傳統數據的區(qū)別?小明去了一百百次書店傳統數據:要回答的問題題是他第一百百零一次買不不買書,即業(yè)業(yè)績和經營指指標的問題;;大數據:要回答的是他他第一百零一一次買什么書書,需要將什什么樣的內容容推薦給他。。群體和個體的的區(qū)別傳統定義上,,更多關注的是是一類人群,,用同一類規(guī)規(guī)則制訂套餐餐給他們;互聯網時代,,要把每個人都都精準刻畫出出來,進行精精準匹配。19大數據與傳統數據庫的區(qū)別大數據是在傳傳統數據庫學學科的分支——數據倉庫與數數據挖掘的基基礎上進一步步發(fā)展起來的的。但有兩點點比較主要的的不同:結構化程度傳統數據庫保存的是結構構化或者半結結構化的數據據,以二維表表或者標準XML文件的方式存存儲數據,由由于結構清晰晰,處理相對對容易;大數據面向的是一切切計算機可以以存儲的數據據格式,包括括互聯網上的的各種網頁、、圖片、音頻頻、視頻,包包括辦公文檔檔、報表,包包括人們在搜搜索引擎中輸輸入的關鍵詞詞、在社交網網絡中的留言言、喜好,也也包括各種傳傳感器自動收收集的監(jiān)控結結果等等,顯顯然不同的格格式處理起來來更加困難。。異常數據的處處理傳統數據庫通常把異常數數據先剔除,,應用在需要要高精確度的的領域,如銀銀行對每個賬賬戶的管理;;大數據則允許異常數數據存在,更更多應用在預預測方面,找找出大量數據據中隱藏的關關聯關系,少少量異常數據據不會對總體體結果產生影影響。理解大數據大數據=海量數據+復雜類型的數數據大數據包括::交易數據和交交互數據集在在內的所有數數據集大數據的構成成海量交易數據據:企業(yè)內部的經經營交易信息息主要包括聯聯機交易數據據和聯機分析析數據,是結結構化的、通通過關系數據據庫進行管理理和訪問的靜靜態(tài)、歷史數數據。通過這這些數據,我我們能了解過過去發(fā)生了什什么。海量交互數數據:源于Facebook、Twitter、LinkedIn及其他來源源的社交媒媒體數據構構成。它包包括了呼叫叫詳細記錄錄CDR、設備和傳傳感器信息息、GPS和地理定位位映射數據據、通過管管理文件傳傳輸ManageFileTransfer協議傳送的的海量圖像像文件、Web文本和點擊擊流數據、、科學信息息、電子郵郵件等等。??梢愿嬖V訴我們未來來會發(fā)生什什么。海量數據處處理:大數據的涌涌現已經催催生出了設設計用于數數據密集型型處理的架架構。例如如具有開放放源碼、在在商品硬件件群中運行行的ApacheHadoop。“大量化(Volume)、多樣化(Variety)、快速化(Velocity)、價值密度度低(Value)”就是““大數據””的顯著特特征,或者者說,只有有具備這些些特點的數數據,才是是大數據。。VolumeVelocityValueVariety大數據的4V特征Value價值挖掘大數據據的價值類類似沙里淘淘金,從海量數據據中挖掘稀稀疏但珍貴貴的信息.價值密度低低,是大數據的的一個典型型特征.Variety多樣性企業(yè)內部的的經營交易易信息;物聯網世界界中商品,物流信息;互聯網世界界中人與人人交互信息息,位置信息等等是大數據據的主要來來源.能夠在不同同的數據類類型中,進行交叉分分析的技術術,是大數據的的核心技術術之一.語義分析技技術,圖文轉換技技術,模式識別技技術,地理信息技技術等,都會在大數數據分析時時獲得應用用.SocialMediaMachine/SensorDOC/MediaWebClickstreamAppsCallLogLog結構化、半結構化、非結構化數數據Velocity速度1s是臨界點.對于大數據據應用而言言,必須要在1秒鐘內形成成答案,否則處理結結果就是過過時和無效效的.實時處理的的要求,是區(qū)別大數數據引用和和傳統數據據倉庫技術術,BI技術的關鍵鍵差別之一一.Volume數據量PB是大數據層層次的臨界界點.KB->MB->GB->TB->PB->EB->ZB->YB->NB->DB大數據的儲儲存與處理理/運算大數據儲存存大數據處理理數據分享數據檢索數據分析數據展現分布式軟件件架構并行計算框框架分布式存儲儲橫向擴容(Scale-out)架構和大數據相相關的技術術大數據必然然無法用單單臺的計算算機進行處處理,必須須采用分布式架構構。對海量數據據進行分布布式數據挖挖掘,必須須依托云計計算的分布式處理理、分布式數據據庫和云存儲、虛擬化技術術。1.云計算云計算是分布式處理理(DistributedComputing)、并行處理(ParallelComputing)和網格計算(GridComputing)的發(fā)展,是是透過網絡將將龐大的計計算處理程程序自動分分拆成無數數個較小的的子程序,,再交由多多部服務器器所組成的的龐大系統統經計算分分析之后將將處理結果果回傳給用用戶。**云計算算與大數據據的區(qū)分::第一,在概念上兩者有所不不同,云計計算改變了了IT,而大數據據則改變了了業(yè)務。然然而大數據據必須有云云作為基礎礎架構,才才能得以順順暢運營。。第二,大數數據和云計計算的目標受眾不同,云計計算是CIO等關心的技技術層,是是一個進階階的IT解決方案。。而大數據據是CEO關注的、是是業(yè)務層的的產品,而而大數據的的決策者是是業(yè)務層。。2.分布式處理理技術Hadoop是一個實現現了MapReduce模式的能夠夠對大量數數據進行分分布式處理理的軟件框框架。HDFS:Hadoop分布式文件件系統(DistributedFileSystem)MapReduce:并行計算框框架HBase:類似GoogleBigTable的分布式NoSQL列數據庫。。Hive:數據倉庫工工具,由Facebook貢獻。Zookeeper:分布式鎖設設施,提供供類似GoogleChubby的功能,由由Facebook貢獻。Avro:新的數據序序列化格式式與傳輸工工具,將逐逐步取代Hadoop原有的IPC機制。Pig:大數據分析析平臺,為為用戶提供供多種接口口。Ambari:Hadoop管理工具,,可以快捷捷的監(jiān)控、、部署、管管理集群。。Sqoop:用于在Hadoop與傳統的數數據庫間進進行數據的的傳遞3.云存儲云存儲是在在云計算(cloudcomputing)概念上延伸伸和發(fā)展出出來的一個個新的概念念,是一種種新興的網網絡存儲技技術,是指指通過集群應用、網絡技術或分布式文件件系統等功能,將將網絡中大大量各種不不同類型的的存儲設備備通過應用用軟件集合合起來協同同工作,共共同對外提提供數據存儲和業(yè)務訪問問功能的一一個系統。。淘寶的大數數據技術架架構參考資料推推薦延深閱讀150年后,當互互聯網將這這個世界緊緊密連接起起來的時候候,新的物物種誕生了了。我們稱之為為生命的信信息過程數數十億年前前控制了地地球的大氣氣層?,F在在,另一個個信息過程程——科技元素,,正在重新新征服地球球。最需要讀這這本書的,,應該是打打價格戰(zhàn)打打暈了頭,,占領市場場醒后卻發(fā)發(fā)現沒有利利潤的商人人;或者是是想以數字字技術新法法取勝,希希望像喬布布斯那樣贏贏的雄心勃勃勃的年輕輕人。大數據能給給我們帶來來什么??內容提示認識大數據據大數據帶來來的變革大數據的商商業(yè)價值大數據的運運用案例分分析一.大數據帶來來全新的生活方式大數據時代代的物聯網網,帶給我我們智能家家居。大數據帶來來全新的生活方式購物:不受時空限限制,隨時時隨地購物物。在看不到商商品的情況況下,口碑碑就是質量量。大數據帶來來全新的生活方式旅行:足不出戶,,安排好一一切。大數據帶來來全新的生活方式信息:人人都是傳傳媒。大數據帶來來全新的生活方式社交:你所有的朋朋友都能在在網絡上找找到。二.大數據帶來來全新的思維方式1.分析事物時時,依賴該該事物的所所有數據,,不再是進進行樣本分分析。2.在大數據時時代,允許許不精確。。3.更注重相關關關系,而而不是因果果關系。1.“更多”——不是隨機樣樣本,而是是全體數據據當數據處理理技術已經經發(fā)生翻天天覆地的變變化時,在在大數據時時代進行抽抽樣分析就就像在汽車車時代騎馬馬一樣。一一切都改變變了,我們們需要的是是所有的數數據,“樣樣本=總體體”。讓數據“發(fā)發(fā)聲”小數據時代代的隨機采采樣,最少少的數據獲獲得最多的的信息全數據模式式,樣本==總體大數據帶來來全新的思維方式2.“更雜”——不是精確性性,而是混混雜性執(zhí)迷于精確確性是信息息缺乏時代代和模擬時時代的產物物。只有5%的數據是有有框架且能能適用于傳傳統數據庫庫的。如果果不能接受受混亂,剩剩下95%的非框架數數據都無法法被利用,,只有接受受不精確性性,我們才才能打開一一扇從未涉涉足的世界界的窗戶。。允許不精確確大數據的簡簡單算法比比小數據的的復雜算法法更有效紛繁的數據據越多越好好混雜性,不不是竭力避避免,而是是標準途徑徑新的數據庫庫設計的誕誕生大數據帶來來全新的思維方式3.“更好”——不是因果關關系,而是是相關關系系知道“是什什么”就夠夠了,沒必必要知道““為什么”!在大數據時時代,我們們不必非得得知道現象象背后的原原因,而是是要讓數據據自己“發(fā)發(fā)聲”。關聯物,預預測的關鍵鍵“是什么””,而不是是“為什么么”改變,從操操作方式開開始大數據,改改變人類探探索世界的的方法大數據帶來來全新的思維方式1.“數據化””——一切皆可““量化”大數據發(fā)展展的核心動動力來源于于人類測量量、記錄和和分析世界界的渴望。。信息技術術變革隨處處可見,但但是如今信信息技術變變革的重點點在“T”(技術))上,而不不是在“I”(信息)上。?,F在,我我們是時候候把聚光燈燈打向“I”,開始關關注信息本本身了。數據,從最最不可能的的地方提取取出來數據化,不不是數字化化量化一切,,數據化的的核心當文字變成成數據當方位變成成數據當溝通成為為數據一切事物的的數據化三.大數據帶來來新的商業(yè)變革2.“價值”——“取之不盡盡,用之不不竭”的數數據創(chuàng)新數據就像一一個神奇的的鉆石礦,,當它的首首要價值被被發(fā)掘后仍仍能不斷給給予。它的的真實價值值就像漂浮浮在海洋中中的冰山,,第一眼只只能看到冰冰山的一角角,而絕大大部分都隱隱藏在表面面之下。數據創(chuàng)新1:數據的再再利用數據據創(chuàng)創(chuàng)新新2:重重組組數數據據數據據創(chuàng)創(chuàng)新新3:可可擴擴展展數數據據數據據創(chuàng)創(chuàng)新新4:數數據據的的折折舊舊值值數據據創(chuàng)創(chuàng)新新5:數數據據廢廢氣氣數據據創(chuàng)創(chuàng)新新6:開開放放數數據據給數數據據估估值值大數數據據帶帶來來新新的的商業(yè)業(yè)變變革革3.“角角色色定定位位””———數據據、、技技術術與與思思維維的的三三足足鼎鼎立立微軟軟以以1.1億美美元元的的價價格格購購買買了了大大數數據據公公司司Farecast,而而兩兩年年后后谷谷歌歌則則以以7億美美元元的的價價格格購購買買了了給給Farecast提供供數數據據的的ITASoftware公司司。。如如今今,,我我們們正正處處在在大大數數據據時時代代的的早早期期,,思思維維和和技技術術是是最最有有價價值值的的,,但但是是最最終終大大部部分分價價值值還還是是必必須須從從數數據據本本身身來來挖挖掘掘。。大數數據據價價值值的的3大構構成成大數數據據掌掌控控公公司司大數數據據技技術術公公司司大數數據據思思維維公公司司和和個個人人全新新的的數數據據中中間間商商專家家的的消消亡亡與與數數據據科科學學家家的的崛崛起起大數數據據,,決決定定企企業(yè)業(yè)的的競競爭爭力力大數數據據帶帶來來新新的的商業(yè)業(yè)變變革革大數數據據價價值值鏈鏈的的三三種種存存在在模模式式數據據數據據的的掌掌控控者者,,擁擁有有或或者者可可以以收收集集大大量量數數據據的的公公司司。。海海量量的的數數據據就就是是財財富富,,可可以以考考慮慮自自己己分分析析或或者者賣賣數數據據給給其其他他公公司司。。金融融機機構構,,電電信信行行業(yè)業(yè),,政政府府機機構構等等。。技術術技術術供供應應商商或或者者分分析析公公司司。。掌掌握握了了從從海海量量數數據據中中分分析析出出有有用用信信息息的的技技能能或或者者工工具具,,但但本本身身不不一一定定擁擁有有數數據據。。IBM,Oracle等。思維維有創(chuàng)創(chuàng)新新思思維維的的人人或或者者公公司司。。他他們們對對大大數數據據敏敏感感,,有有怎怎樣樣挖挖掘掘數數據據的的新新價價值值的的獨獨特特想想法法。。Google,Amazon等。。Netflix并不不是是任任何何一一個個電電視視臺臺,,而而是是電電視視臺臺和和電電影影院院的的平平臺臺,,是是北北美美最最大大的的付付費費訂訂閱閱視視頻頻網網站站。。基基于于其其3000萬北北美美用用戶戶觀觀看看視視頻頻時時留留下下的的行行為為數數據據,,預預測測出出凱凱文文·史派派西西、、大大衛(wèi)衛(wèi)·芬奇奇和和“BBC出品品”三種種元元素素結結合合在在一一起起的的電電視視劇劇產產品品將將會會大大火火特特火火。。此此外外,,Netflix還通通過過“大數數據據”觀測測到到另另一一流流行行趨趨勢勢::越越來來越越多多的的人人不不再再像像30年前前那那樣樣,,在在固固定定晚晚上上的的固固定定時時刻刻守守在在電電視視機機前前,,等等著著收收看看電電視視劇劇的的最最新新劇劇集集,,而而是是“攢”起來來,,直直到到整整季季劇劇情情全全部部播播放放完完畢畢之之后后,,才才選選一一個個自自己己方方便便的的時時間間段段和和地地點點,,在在方方便便的的設設備備((多多數數是是網網絡絡設設備備,,如如電電腦腦、、iPad)上上一一次次性性觀觀看看。?!都埮婆莆菸荨返臄禂祿鞄彀肆?000萬用用戶戶的的收收視視選選擇擇、、400萬條評論論、300萬次主題題搜索。。最終,,拍什么么、誰來來拍、誰誰來演、、怎么播播,都由由數千萬萬觀眾的的客觀喜喜好統計計決定。。從受眾眾洞察、、受眾定定位、受受眾接觸觸到受眾眾轉化,,每一步步都由精精準細致致高效經經濟的數數據引導導,從而而實現大大眾創(chuàng)造造的C2B,即由用用戶需求求決定生生產。1.“風險””——讓數據主主宰一切切的隱憂憂我們時刻刻都暴露露在“第第三只眼眼”之下下:亞馬馬遜監(jiān)視視著我們們的購物物習慣,,谷歌監(jiān)監(jiān)視著我我們的網網頁瀏覽覽習慣,,而微博博似乎什什么都知知道,不不僅竊聽聽到了我我們心中中的“TA”,還有有我們的的社交關關系網。。無處不在在的“第第三只眼眼”我們的隱隱私被二二次利用用了預測與懲懲罰,不不是因為為“所做做”,而而是因為為“將做做”數據獨裁裁掙脫大數數據的困困境四.大數據帶帶來新的的管理變革革2.“掌控””——責任與自自由并舉舉的信息息管理當世界開開始邁向向大數據據時代時時,社會會也將經經歷類似似的地殼殼運動。。在改變變人類基基本的生生活與思思考方式式的同時時,大數數據早已已在推動動人類信信息管理理準則上上重新定定位。然然而,不不同于印印刷革命命,我們們沒有幾幾個世紀紀的時間間去適應應,我們們也許只只有幾年年時間。。管理變革革1:個人隱隱私保護護,從個個人許可可到讓數數據使用用者承擔擔責任管理變革革2:個人動動因VS預測分析析管理變革革3:擊碎黑黑盒子,,大數據據程序員員的崛起起管理變革革4:反數據據壟斷大大亨大數據帶帶來新的的管理變革革3.全新的管管理模式式除了上帝帝,任何何人都必必須用數數據來說說話。案例:google的設計師師卓越的管管理者必必須要利利用數據據進行決決策。案例:克強指數數問題一::數據從從哪里來來?問題二::數據怎怎么用??大數據帶帶來新的的管理變革革內容提示示認識大數數據大數據帶帶來的變變革大數據的的商業(yè)價價值大數據的的運用案案例分析析大數據的的應用通過用戶戶行為分分析實現現精準營營銷是大大數據的的典型應應用,但但是大數數據在各各行各業(yè)業(yè)特別是是公共服服務領域域具有廣廣闊的應應用前景景消費行業(yè)業(yè)金融服務務食品安全全醫(yī)療衛(wèi)生生軍事交通環(huán)保保電子商務務氣象1.醫(yī)療機構構將實時時的監(jiān)測測用戶的的身體健健康狀況況;2.教育機構構更有針針對的制制定用戶戶喜歡的的教育培培訓計劃劃;3.服務行業(yè)業(yè)為用戶戶提供即即時健康康的符合合用戶生生活習慣慣的食物物和其它它服務;;4.社交網絡絡能為你你提供合合適的交交友對象象,并為為志同道道合的人人群組織織各種聚聚會活動動;5.政府能在在用戶的的心理健健康出現現問題時時有效的的干預,,防范自自殺,刑刑事案件件的發(fā)生生;6.金融機機構能能幫助助用戶戶進行行有效效的理理財管管理,,為用用戶的的資金金提供供更有有效的的使用用建議議和規(guī)規(guī)劃;;7.道路交交通、、汽車車租賃賃及運運輸行行業(yè)可可以為為用戶戶提供供更合合適的的出行行線路路和路路途服服務安安排;;……大數據據的市市場空空間及及對社社會的的貢獻獻大數據據的商商業(yè)價價值政府、、金融融、電電信等等行業(yè)業(yè)投資資建立立大數數據的的處理理分析析手段段,實實現綜綜合治治理、、業(yè)務務開拓拓等目目標;;應用用到制制造等等更多多行業(yè)業(yè)?;ヂ摼W網公司司受益益于大大數據據馬云的的判斷斷來自自于數數據分分析商業(yè)價價值之之——淘寶雙“十十一””背后后的技技術討討論用戶行行為分分析中國工工程院院院士士鄔賀賀銓說說道,,“智慧城城市是是使用用智能能計算算技術術使得得城市市的關關鍵基基礎設設施的的組成成和服服務更更智能能、互互聯和和有效效,隨隨著智智慧城城市的的建設設,社社會將將步入入“大數據據”時代。?!敝腔壅罩腔劢唤煌ㄖ腔垭婋娋W智慧教教育智慧醫(yī)醫(yī)療……公共管管理部部門受受益于于大數數據根據國國家信信息中中心信信息化化研究究部統統計,,目前前我國國提出出智慧慧城市市建設設的城城市總總數已已達到到154個,預預計投投資規(guī)規(guī)模超超過1.5萬億元元。智慧城城市必必將產產生大大數據據,利利用大大數據據的思思維來來改變變公共共管理理部門門的形形象。。醫(yī)療可可利用用多種種大數數據手手段臨床操操作——1、療效效比較較研究究2、臨床床決策策支持持系統統3、醫(yī)療療數據據透明明度4、遠程程醫(yī)療療監(jiān)護護5、針對對患者者情況況的先先進分分析付款/定價——1、自動動化系系統2、醫(yī)保保系統統研發(fā)——1、預測測模型型2、改進進臨床床試驗驗設計計的統統計工工具和和算法法3、臨床床實驗驗數據據分析析4、個體體化醫(yī)醫(yī)療5、疾病病模式式分析析新業(yè)務務模型型——1、患者者臨床床記錄錄和需需求數數據的的聚合合2、在線線平臺臺和社社區(qū)公共衛(wèi)衛(wèi)生醫(yī)療行行業(yè)受受益于于大數數據電子病病歷醫(yī)療行行業(yè)產產生大大數據據(電電子病病歷)),利利用大大數據據的思思維將將會給給醫(yī)療療行業(yè)業(yè)帶來來變革革。旅游業(yè)業(yè)在大大數據據時代代的發(fā)發(fā)展旅游業(yè)業(yè)發(fā)展展趨勢勢是::網絡絡化、、散客客化、、大眾眾化。。在大數數據時時代,,必須須運用用大數數據思思維,,推行行旅游游的數數字化化管理理,開開展數數字化化營銷銷,為為旅客客提供供精準準的個個性化化服務務。制造業(yè)業(yè)在大大數據據時代代的發(fā)發(fā)展今后大大數據據將成成為繼繼石油油之后后的工工業(yè)新新鮮血血液,,對于于大數數據的的良好好應用用,能能夠對對市場場、銷銷售、、生產產等各各個部部門產產生積積極影影響,,優(yōu)化化各個個環(huán)節(jié)節(jié)的工工作效效率;制造原原理、、制造造模式式、制制造工工藝和和生產產工具具都將將發(fā)生生根本本性改改變,,以前前難以以制造造的產產品、、實現現不了了的功功能將將獲得得突破破,網網絡式式創(chuàng)新新將釋釋放全全社會會的創(chuàng)創(chuàng)新能能量,,產品品和技技術變變革周周期將將顯著著縮短短。通通過對對數據據的實實時采采集、、準確確把握握、深深度挖挖掘、、分析析優(yōu)化化,制制造業(yè)業(yè)將整整體再再提升升實現現轉型型升級級。內容提提示認識大大數據據大數據據帶來來的變變革大數據據的商商業(yè)價價值大數據據的運運用案案例分分析穿孔卡卡片與與美國國人口口普查查美國在在1880年進行行的人人口普普查,,耗時時8年才完完成數數據匯匯總。。因此此,他他們獲獲得的的很多多數據據都是是過時時的。。1890年進行行的人人口普普查,,預計計要花花費13年的時時間來來匯總總數據據。后來,,美國國人口口普查查局通通過用用赫爾爾曼-霍爾瑞瑞斯發(fā)發(fā)明的的穿孔孔卡片片制表表機來來進行行1890年的人人口普普查,,耗時時一年年。73麻省理理工與與通貨貨緊縮縮預測測軟件件美國勞勞工統統計局局的人人員每每個月月都要要公布布消費費物價價指數數(CPI),這這是用用來測測試通通貨膨膨脹率率的。。政府通通過人人工采采集價價格信信息數數據每每年大大概需需要花花費兩兩億五五千萬萬美元元。這這些數數據是是精確確的也也是有有序的的,但但是數數據往往往會會有幾幾周的的滯后后。麻省理理工學學院((MIT)的兩兩位經經濟學學家,,通過過一個個軟件件在互互聯網網上每每天可可以收收集到到50萬種商商品的的價格格,他他們能能比官官方數數據提提前發(fā)發(fā)現通通貨緊緊縮趨趨勢。。74Hitwise,通過過流量量判斷斷消費費者喜喜好數據創(chuàng)創(chuàng)新再再利用用的一一個典典型例例子是是搜索索關鍵鍵詞。。消費者者和搜搜索引引擎之之間的的瞬時時交互互形成成了一一個網網站和和廣告告的列列表,,實現現了那那一刻刻的特特定功功能。。這些些信息息除了了實現現基本本用途途之外外,它它還可可以變變得非非常有有價值值。如數據據代理理益百百利旗旗下的的網頁頁流量量測量量公司司Hitwise,讓客客戶采采集搜搜索流流量來來揭示示消費費者的的喜好好。75無所不不包的的谷歌歌翻譯譯系統統2006年,谷谷歌公公司開開始涉涉足機機器翻翻譯。。這被被當作作實現現“收收集全全世界界的數數據資資源,,并讓讓人人人都可可享受受這些些資源源”這這個目目標的的一個個步驟驟。谷歌翻翻譯利利用一一個更更大更更繁雜雜的數數據庫庫,也也就是是全球球的互互聯網網。谷歌翻翻譯系系統為為了訓訓練計計算機機,會會吸收收它能能找到到的所所有翻翻譯。。它增增加了了很多多各種種各樣樣的數數據,,還接接受了了有錯錯誤的的數據據。谷歌語語料庫庫的內內容來來自于于未經經過濾濾的網網頁內內容,,所以以會包包含各各種錯錯誤。。但谷谷歌語語料庫庫是其其他語語料庫庫的好好幾百百萬倍倍大,,這樣樣的優(yōu)優(yōu)勢完完全壓壓倒了了缺點點76谷歌,,從大大的““噪音音”數數據中中受益益谷歌知道人人們在搜索索時點擊的的是第1頁的第8個鏈接還是是第8頁的第1個鏈接,或或者是干脆脆放棄了所所有搜索點點擊。谷歌就是依依據用戶的的點擊情況況通過排名名算法自動動地在隨后后的搜索中中將信息排排位?!皵祿U氣氣”:看似似“沒用””的,“錯錯誤”的數數據。77IBM,電動汽車車動力與電電力供應系系統優(yōu)化預預測基于大量的的信息輸入入,如汽車車的電池電電量、汽車車的位置、、一天中的的時間以及及附近充電電站的可用用插槽等,,IBM開發(fā)了一套套復雜的預預測模型。。它將這些數數據與電網網的電流消消耗以及歷歷史功率使使用模式相相結合。通通過分析來來自多個數數據源的巨巨大實時數數據流和歷歷史數據,,能夠確定定司機為汽汽車電池充充電的最佳佳時間和地地點,并揭揭示充電站站的最佳設設置點。78物聯網物聯網(InternetofThings,縮寫IOT)是一個基基于互聯網網、傳統電電信網等信信息承載體體,讓所有有能夠被獨獨立尋址的的普通物理理對象實現現互聯互通通的網絡。。在物聯網上上,每個人人都可以應應用電子標標簽將真實實的物體上上網聯結,,在物聯網網上都可以以查找出它它們的具體體位置。通過物聯網網可以用中中心計算機機對機器、、設備、人人員進行集集中管理、、控制,也也可以對家家庭設備、、汽車進行行遙控,以以及搜尋位位置、防止止物品被盜盜等各種應應用。79RFID技術RFID是RadioFrequencyIdentification的縮寫,即即射頻識別別,俗稱電電子標簽。。RFID是一種簡單單的無線系系統,由一一個詢問器器(或閱讀器)和很多應答答器(或標簽)組成。該系系統用于控控制、檢測測和跟蹤物物體。RFID技術在超市市和圖書館館中的應用用80車聯網未來車聯網網技術將重重新定義汽汽車DNA。借助無線線通訊,城城市內車與與車之間,,車與建筑筑之間,車車與人之間間都將建立立更加智能能緊密的互互聯。通過裝載在在車輛上的的電子標簽簽利用無線線射頻等識識別技術,,實現在信信息網絡平平臺上對所所有車輛的的屬性信息息和靜、動動態(tài)信息進進行提取和和有效利用用,并根據據不同的功功能需求對對所有車輛輛的運行狀狀態(tài)進行有有效的監(jiān)管管和提供綜綜合服務。。81無人駕駛無人駕駛被被人認為是是車聯網的的終極目標標無人駕駛車車依賴的技技術很多,,比如導航航、雷達、、龐大數據據計算等,,要實現這這些技術需需要和物聯聯網緊密結結合起來。。無人駕駛是是通過車載載傳感系統統感知道路路環(huán)境,自自動規(guī)劃行行車路線并并控制車輛輛到達預定定目標的智智能汽車。。82自動泊車系系統自動泊車系系統,顧名名思義駕駛駛者雙手可可以離開方方向盤,在在車輛停好好之前要做做的只是等等待。自動泊車系系統主要由由兩部分組組成:控制制單元和位位于前后保保險杠以及及兩側的超超聲波雷達達探頭。按動自動泊泊車輔助系系統激活按按鈕之后,,雷達探頭頭可在車輛輛行駛時對對車輛兩側側進行掃描描??刂茊卧獙走_反饋饋的信息進進行分析,,從而估算算出車位是是否足以容容納車輛停停放。自動泊車系系統隨后將將通過助力力轉向系統統對車輛行行駛方向進進行干預,,并以控制制單元規(guī)劃劃好的路徑徑將車輛停停入車位。。83日本先進工工業(yè)技術研研究院的坐坐姿研究與與汽車防盜盜系統該研究所教教授把每個個駕車者的的坐姿量化化為精確的的數據,使使其對司機機識別的正正確率高達達98%。這項技術作作為汽車防防盜系統,,一旦識別別駕車者不不是車主,,就會自動動熄火。這一技術還還可匯集事事故發(fā)生前前駕車者的的姿勢變化化數據,分分析坐姿與與行駛安全全的關系,,在司機疲疲勞駕駛時時發(fā)出警示示或自動剎剎車。84UPS快遞——大數據技術術下的最佳佳行車路徑徑UPS快遞多效地地利用了地地理定位數數據。為了了使總部能能在車輛出出現晚點的的時候跟蹤蹤到車輛的的位置和預預防引擎故故障,它的的貨車上裝裝有傳感器器、無線適適配器和GPS。同時,這這些設備也也方便了公公司監(jiān)督管管理員工并并優(yōu)化行車車線路。UPS為貨車定制制的最佳行行車路徑是是根據過去去的行車經經驗總結而而來的。2011年,UPS的駕駛員少少跑了近4828萬公里的路路程,節(jié)省省了300萬加侖的燃燃料并且減減少了3萬公噸的二二氧化碳排排放量。85UPS與汽車修理理預測UPS國際快遞公公司從2000年就開始使使用預測性性分析來監(jiān)監(jiān)測自己全全美60000輛車規(guī)模的的車隊,這這樣就能及及時地進行行防御性的的修理。通過監(jiān)測車車輛的各個個部位,UPS只需要更換換需要更換換的零件,,從而節(jié)省省了好幾百百萬美元。。86“量化自我我”通過一種非非干預的手手段,把一一些所謂的的醫(yī)療傳感感器放到我我們的身邊邊,比如我我們戴一個個腕表、一一枚戒指、、一個耳塞塞、一副眼眼鏡等,通通過這些設設備我們可可以了解自自己的心跳跳、血壓情情況,甚至至包括我們們體表的健健康狀況,,從而對一一些大?。ǎㄈ绨d癇等等)進行早早期預測。。美國Fitbit公司近期就就推出了一一款免費的的蘋果手機機應用,用用戶可用于于記錄食物物和液體攝攝入量,從從而跟蹤其其活動水平平和營養(yǎng)攝攝入情況,,通過分析析這些數據據可以很好好的控制體體重。87小兒床墊通過床墊上上的壓力與與濕度傳感感器分析,,來判斷小小孩子有沒沒有比較嚴嚴重的打鼾鼾或者睡姿姿不正確等等問題。88在線教育如著名的在在線教育公公司Coursera,已經和普普林斯頓、、伯克利、、賓夕法尼尼亞大學等等30多所大學合合作,在互互聯網上免免費開放大大學課程分布在世界界各地的學學習者不僅僅可以在同同一時間實實時聽取同同一位老師師的授課,,還和在校校生一樣,,做同樣的的作業(yè)、接接受同樣的的評分和考考試。在線教育是是一個“行行為評價和和誘導”的的智能平臺臺89在線教育服服務Knewton在線教育服服務Knewton是大數據應應用于教育育行業(yè)的典典型,通過過數據分析析區(qū)分出每每個學生的的優(yōu)缺點,,從而給學學生有效的的指導。美國最大的的公立大學學亞利桑那那州公立大大學曾運用用這一系統統來提高學學生的數學學水平,全全校2000名學生使用用該系統兩兩學期之后后,該大學學的輟學率率下降了56%,畢業(yè)率從從64%升高到75%。90購買飛機票票同一架飛機機上的座位位,票價卻卻千差萬別別,個中原原因,只有有航空公司司知道。奧倫-埃齊奧尼開開發(fā)了一個個系統,用用來推測當當前網頁上上的機票價價格是否合合理,預測測當前的機機票價格在在未來一段段時間內會會上漲還是是下降,從從而幫助乘乘客明智購購票。這個預測系系統建立在在41天內價格波波動產生的的12000個價格樣本本基礎之上上。91Farecast是一個對機機票價格進進行預測的的公司,幫幫助消費者者抓住最佳佳購買機票票的時機,,使乘客節(jié)節(jié)省很多錢錢。最初預測系系統建立在在41天之內的12000個價格樣本本基礎上,,數據是從從旅游網站站上抓取的的,如今已已經擁有超超過2000億條飛行記錄錄。系統只推測機票的價格格何時最便便宜,不關心是什什么原因導致的價格格下降。Farecast→Bing航班延誤之之候機經濟濟學美國建立了了一個統一一的數據開開放門戶網網站——Data.Gov。Data.Gov上線以后,,美國交通通部開放了了全美航班班起飛、到到達、延誤誤的數據。。航班延誤時時間的分析析系統(Flyontime.us):幫助消消費者找到到表現最佳佳,最符合合自己需要要的航班。。該系統向全全社會免費費開放,任任何人都可可以通過它它查詢分析析全國各次次航班的延延誤率及機機場等候時時間。93The-N與電影票房房預測The-N在好萊塢電電影上映之之前,就能能利用海量量數據和特特定算法預預測出一部部電影的票票房。該公司擁有有一個包括括了過去幾幾十年美國國所有商業(yè)業(yè)電影大約約3000萬條記錄的的數據庫;;數據庫里里有所有關關于預算、、電影流派派、拍攝、、陣容、獲獲得獎項和和收入等數數據。94VISA&MasterCard與商戶推薦薦像VISA和MasterCard這樣的信用用卡發(fā)行商商,它們能能夠從自己己的服務網網獲取更多多的交易信信息和顧客客的消費信信息它們的商業(yè)業(yè)模式從單單純的處理理支付行為為轉變成了了收集數據據一個稱為MasterCardAdvisors的部門收集集和分析了了來自210個國家的15億信用卡用用戶的650億條交易記記錄,用來來預測商業(yè)業(yè)發(fā)展和客客戶的消費費趨勢。然然后,它把把這些分析析結果賣給給其他公司司95FICO,“我們知知道你明天天會做什么么”2011年,FICO提出了“遵遵從醫(yī)囑評評分”——它分析一系系列的變量量來確定這這個人是否否會按時吃吃藥,包括括一些看起起來有點怪怪異的變量量。比方說,一一個人在某某地居住了了多久,這這個人結婚婚了沒有,,他多久換換一個工作作以及他是是否有私家家車。這個評分會會幫助醫(yī)療療機構節(jié)省省開支,因因為它們會會知道哪些些人需要得得到它們的的用藥提醒醒。有私家家車和使用用抗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論