大數(shù)據(jù)的十大來源及其應(yīng)用價值模板_第1頁
大數(shù)據(jù)的十大來源及其應(yīng)用價值模板_第2頁
大數(shù)據(jù)的十大來源及其應(yīng)用價值模板_第3頁
大數(shù)據(jù)的十大來源及其應(yīng)用價值模板_第4頁
大數(shù)據(jù)的十大來源及其應(yīng)用價值模板_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

大數(shù)據(jù)的十大來源及其應(yīng)月價值

當(dāng)你開車路過一家餐廳的停車場時,你的手機屏幕上彈出了這家餐廳的當(dāng)日特價菜品舉薦,

這種體驗是不是很棒?假如賭場老板把發(fā)牌人遺忘付給你的20美元親自送還給你,你的心

里是不是有點兒小激烈?假如在線視頻嬉戲能夠把和我們玩法相近的用戶即刻告知我們,這

世界會不會變得很奇妙?你是不是要下調(diào)汽車保險費率?大數(shù)據(jù)能讓這一切變成現(xiàn)實。

網(wǎng)絡(luò)數(shù)據(jù)即使不是最原始為大數(shù)據(jù)源,也是運用最廣泛、認(rèn)可度最高的大數(shù)據(jù)源。除此之外,

還有很多大數(shù)據(jù)源,它們都有各自的運用價值。其中一些廣為人知,而另一些幾乎沒出名氣。

我們在此要借用本章的篇幅一起來回顧除網(wǎng)絡(luò)數(shù)據(jù)以外的其他9種大數(shù)據(jù)源以及它們的用

途。我們將站在一個較高的層次上講解這部分內(nèi)容,意圖是在簡潔描述各類數(shù)據(jù)源的基礎(chǔ)上,

回顧每種大數(shù)據(jù)源的應(yīng)用與商業(yè)含義。

我們發(fā)覺了一個特別明顯的趨勢,各行各業(yè)雖然生成了很多大數(shù)據(jù)源,但其底層的支撐技術(shù)

卻是相同的。而且,不同行業(yè)還可以運用相同的大數(shù)據(jù)源。大數(shù)據(jù)并非只有單一的用途,它

的影響將會特別深遠。

我們將要探討以下幾種大數(shù)據(jù)源。

汽車保險業(yè):車載信息服務(wù)數(shù)據(jù)的價值。

多個行業(yè):文本數(shù)據(jù)的價值。

多個行業(yè):時間數(shù)據(jù)與位置數(shù)據(jù)的價值。

零售制造業(yè):RFID數(shù)據(jù)的價值。

電力行業(yè):智能電網(wǎng)數(shù)據(jù)的價值。

博彩業(yè):籌碼跟蹤數(shù)據(jù)的價值。

工業(yè)發(fā)動機和設(shè)備:傳感瑞數(shù)據(jù)的價值。

視頻嬉戲:遙測數(shù)據(jù)的價值。

電信業(yè)與其他行業(yè):社交網(wǎng)絡(luò)數(shù)據(jù)的價值。

汽車保險業(yè):車載信息服務(wù)數(shù)據(jù)的價值

車載信息服務(wù)在汽車保險行業(yè)中的關(guān)注度特別高。車載信息服務(wù)是通過汽車內(nèi)置的傳感器和

黑盒來收集和駕馭車輛的相關(guān)信息。我們可以配置不同的方案,運用黑盒來監(jiān)測全部的汽車

數(shù)據(jù)。我們可以監(jiān)測車速、行駛里程,以及汽車是否安裝了緊急制動系統(tǒng)。車載信息服務(wù)數(shù)

據(jù)能夠幫助保險公司更好地理解客戶的風(fēng)險等級,并設(shè)置合理的保險費率。假如徹底地忽視

隱私問題,車載信息服務(wù)裝置可以跟蹤到汽車去過的全部地點、何時到達的、以多快的速度、

運用了汽車的哪些功能等,

車載信息服務(wù)可以潛在地降低司機的保險費率,并提升保險公司的收益。它是怎樣做到在降

低費率的同時提升收益呢?答案就在于保險公司要依據(jù)風(fēng)險評估來進行保險定價。傳統(tǒng)的風(fēng)

險評估方法運用的是年齡、人口統(tǒng)計特征以及個人意外損害歷史這類數(shù)據(jù),它們只能供應(yīng)高

層次的概要信息。對于駕駛記錄沒有任何問題的車主,傳統(tǒng)方法根本沒方法把他們和旁邊的

其他人區(qū)分開。

保險公司要有備無患,并做好最壞的準(zhǔn)備。它們要弄清晰哪些人放在哪個風(fēng)險范圍上是最平

安的,一般狀況下,它們會先假定這些人的風(fēng)險是位于該風(fēng)險范圍較高的一端。汽車保險公

司對車主的行為習(xí)慣和實際風(fēng)險了解得越具體,風(fēng)險范圍就會越窄,同時認(rèn)定范圍內(nèi)出現(xiàn)須

要提升費率的最壞狀況的可能性就會比較小。這就是為什么可以同時降低保險費率和提升收

益的緣由。假如保險公司認(rèn)為投保個體的風(fēng)險較好,那么保險公司將可以更好地了解每個人

的風(fēng)險狀況,預(yù)料必需支出的保費就不會發(fā)生太大變更。

全球很多國家的保險公司都在運用車載信息服務(wù),而且數(shù)最越來越多。早期項目的留意力放

在從汽車上收集最少的信息,例如,它們并不關(guān)切汽車去過什么地方。早期項目跟蹤的是汽

車開了多遠、什么時候開的車、是否超速和是否運用了大量的緊急制動。這些信息都是特別

基本的信息,不牽涉到個人隱私,是有意設(shè)計成這樣的。因為避開了收集高度敏感的信息,

所以才會被廣泛地接受。這個道理也同樣適用于商業(yè)車隊。假如保險公司了解到公司車隊更

多的用車狀況,那么它為公司車隊確定保險費率也就更簡潔。

車載信息服務(wù)數(shù)據(jù)最初是作為一種工具出現(xiàn)的,它可以耨助車主和公司獲得更好的、更有效

的車輛保險。再過一段時間,等到很多交通工具都安裝了車載信息服務(wù)裝置后,那時保險業(yè)

以外的行業(yè)也可以運用車載信息服務(wù)數(shù)據(jù)了。現(xiàn)在,公共汽車已經(jīng)有了車載計算機管理系統(tǒng),

但是車載信息服務(wù)設(shè)備可以將其提升到一個新的層次.車載信息服務(wù)數(shù)據(jù)還有一些好玩的應(yīng)

用,我們來看一下這些應(yīng)用。

運用車載信息服務(wù)數(shù)據(jù)

假如車載信息服務(wù)真的起先大規(guī)模應(yīng)用,確定會出現(xiàn)很多令人興奮的分析應(yīng)川。想象一下,

以后全國有數(shù)以千萬計的汽車都安裝了車載信息服務(wù)裝置,那時候第三方探討公司會以匿名

的方式為客戶收集特別具體的車載通信數(shù)據(jù)。與為保險收集的有限數(shù)據(jù)不同,這時數(shù)據(jù)收集

是以分鐘或秒為頻率,且收集內(nèi)容包括但不限于速度、位置、方向和其他有用的信息。

無論交通是否堵塞,無論什么日期,這種數(shù)據(jù)反饋方式都會供應(yīng)大量的車載通信信息。探討

人員可以知道每輛車在道珞上的行駛速度,他們還可以知道車流起先的時間、結(jié)束的時間,

以及持續(xù)的時間。這種真實的交通流信息視圖將會多么令人驚異!試想這會對交通堵塞和道

路系統(tǒng)規(guī)劃的探討產(chǎn)生多么大的影響!

無心插柳柳成陰

車載信息服務(wù)數(shù)據(jù)的多種用途只是一個例子,它說明白匕以用最初預(yù)見不到的方式來運用大

數(shù)據(jù)。對于某種特定的數(shù)據(jù)源,我們最終發(fā)覺它最有效的用途可能與其創(chuàng)建之初的用途大相

徑庭。面對我們遇到的每一類大數(shù)據(jù)源,我們要開拓思路,多想想常規(guī)之外的其他用途。

假如探討人員能夠駕馭大量汽車在每一個高峰時段、每一天、每個城市中的動向,他們就能

特別清晰地推斷出車流產(chǎn)生的前因后果。此外,還能查明下述問題的答案。

?個在路中心的輪胎會對交通產(chǎn)生什么影響?

左側(cè)車道堵車會發(fā)生什么?

假如路口的交通燈不同步,會產(chǎn)生何種結(jié)果?

哪些十字路口雖然依據(jù)預(yù)期設(shè)定方式工作,但通行時間的設(shè)計仍舊不合理?

假如某條道路堵塞,堵塞會以多快的速度擴散到其他道路?

即使我們集中精力投入到昂貴的測試中,現(xiàn)在要想有效地探討諸如此類的問題也幾乎是不行

能的。除非我們支配人手來實際地監(jiān)測每一條道路,記錄下全部的信息,只有這樣我們才能

解決交通堵塞的問題?;蛘撸覀兛梢园惭b大量的傳感器來監(jiān)測過往的車輛,還可以安裝視

頻攝像頭,但這些選擇因為成本問題被嚴(yán)峻限制了推廣。

交通道路工程師做夢都想得到我們所講的車載通信信息,假如車載通信裝置變得隨處可見,

那任何交通擁堵的地方都能被發(fā)覺。城市道路和交通管理系統(tǒng)的革新,以及城市道路建設(shè)規(guī)

劃,都將惠及一般大眾。車載通信剛起先出現(xiàn)時是為了滿足保險定價的需求,但有了它還可

以緩解交通壓力和駕駛員堵車時著急等待的心情,它的存在終將使高速馬路的管理模式發(fā)生

革命性的變更。

多個行業(yè):文本數(shù)據(jù)的價值

文本是最大的也是最常見的大數(shù)據(jù)源之一。想想我們四周有多少文本信息的存在,電子郵件、

短信、微博、社交媒體網(wǎng)站的帖子、即時通信、實時會議以及可以轉(zhuǎn)換成文本的錄音信息。

文本數(shù)據(jù)足現(xiàn)在結(jié)構(gòu)化程發(fā)最低的,也是最大的大數(shù)據(jù)源。幸運的足,我們在駕馭文本數(shù)據(jù)、

利用文本數(shù)據(jù)來更好地做商業(yè)決策方面已經(jīng)做了很多工作。

文本分析一般會從解析文本起先,然后將各種單詞、短語以及包含文本的部分給予語義。我

們可以通過簡潔的詞頻統(tǒng)計,或更困難的操作來進行文本分析。自然語言處理中已經(jīng)有很多

諸如此類的分析了,這里我們就不再贅述。文本挖掘工具是主流分析套件中一個不行或缺的

組成部分。此外,我們還能找到很多獨立的文本挖掘工具包。其中一些文本分析工具運用基

于規(guī)則的方法,用戶須要調(diào)整軟件才能找到自己感愛好的模式。另一些工具則運用機器學(xué)習(xí)

和其他算法自動地發(fā)覺數(shù)據(jù)模式。每種方法都各有利弊,其相關(guān)論述已經(jīng)超出了本書的范圍。

我們關(guān)切的是如何運用生成的結(jié)果,而不是運用工具產(chǎn)生結(jié)果的過程。

做完文本解析和分類以后,我們就可以分析這些過程所產(chǎn)生的結(jié)果了,文本挖掘過程的輸出

結(jié)果通常是其他分析流程的輸入。例如,假如能夠分析出客戶運用電子郵件的情感,就能利

用一個變后將客戶的情感標(biāo)記為正面情感或負(fù)面情感。這種標(biāo)記本身是一種結(jié)構(gòu)化的數(shù)據(jù),

可以作為分析流程的輸入,運用非結(jié)構(gòu)化的文本創(chuàng)建結(jié)構(gòu)化的數(shù)據(jù),這個過程通常稱為信息

提取。

另一個例子是,假定我們能夠在客戶與公司往來的郵件中識別出他們對公司某些產(chǎn)品的評

價,我們就能利用一系列變量來標(biāo)識客戶的產(chǎn)品評價。這些變量本身也是結(jié)構(gòu)化的度量指標(biāo),

可以用來做分析。上述這些例子說明白如何捕獲非結(jié)構(gòu)化數(shù)據(jù)片段,并從中提取出相關(guān)的結(jié)

構(gòu)化數(shù)據(jù)。

從非結(jié)構(gòu)化文本中提取結(jié)構(gòu)數(shù)據(jù)

文本分析的例子很好地說明白該過程:獲得非結(jié)構(gòu)化數(shù)據(jù),然后處理該數(shù)據(jù),最終創(chuàng)建出可

以用于分析和報表過程的結(jié)構(gòu)化數(shù)據(jù)。駕馭大數(shù)據(jù)的一個重要部分是,利用這種創(chuàng)建性的方

式將非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)變成可用于分析的數(shù)據(jù)。

說明文本數(shù)據(jù)事實上是相當(dāng)困難的。強調(diào)的詞匯和語境不同,同一個單詞表達出來的意思就

不同。面對純文本,我們根本不知道重點在哪里,也不知道整個語境。這說明我們得事先進

行一些假設(shè),我們會在第6章中更具體地探討這個問題。

文本分析既是一門藝術(shù),也是一門科學(xué),總會存在確定的不確定性。文本分析往往會有分類

錯誤和含義模糊的問題。沒錯,假如我們在文本集合中發(fā)覺了更好的決策支持模式,那就應(yīng)

當(dāng)運用它。文本分析的目標(biāo)是改進你的決策,但并不是令你的決策變得完備。文本數(shù)據(jù)可以

有效地提升決策效果,它能供應(yīng)比沒有它時更好的結(jié)果,即使數(shù)據(jù)有噪音或含義模糊時,這

一點也成立。

運用文本數(shù)據(jù)

一種H前很流行的文本分析應(yīng)川是所謂的情感分析。情感分析是從大量人群中挖掘出總體觀

點,并供應(yīng)市場對某個公司的評論、看法和感受等相關(guān)信息。情感分析通常運用社會化媒體

網(wǎng)站的數(shù)據(jù)。以下是情感分析的幾個例子。

公司或產(chǎn)品的口碑怎么樣?

大家正在探討的是公司的哪些活動?

大家對公司、產(chǎn)品和服務(wù)的評價是好是壞?

如前所述,文本分析的難點在于詞匯和語境是相關(guān)的。我們要考慮到這個問題,但大量的評

價會讓客戶情感的傾向變得明確。假如我們可以解讀出人們在社交媒體上所說內(nèi)容、與客服

互動信息的趨勢,這會對規(guī)劃下一步的工作有很大的價值。

假如公司可以駕馭每一個客戶的情感信息,就能了解客尸的意圖和看法。與運用網(wǎng)絡(luò)數(shù)據(jù)推

斷客戶意圖的方法類似,了解客戶對某種產(chǎn)品的總體情感是正面情感還是負(fù)面情感也是很有

價值的信息。假如這名客戶此時還沒有購買該產(chǎn)品,那價值就更大了。情感分析供應(yīng)的信息

可以讓我們知道要勸服這名客戶購買該產(chǎn)品的難易程度。

文本數(shù)據(jù)的另一個用途是模式識別。我們對客戶的投訴、修理記錄和其他的評價進行排序,

期望在問題變大之前,能夠更快地識別和修正問題。產(chǎn)品首次發(fā)布,然后起先出現(xiàn)投訴,文

本分析可以識別出客戶在哪些方面存在問題。我們甚至可以做到在客服電話接二連三打進來

之前,先把問題識別出來,這樣我們就能更快地、更主動地做出響應(yīng)。公司可以剛好地做出

反應(yīng),解決產(chǎn)品將來發(fā)行版本中同樣的問題,也能主動與客戶進行接觸,緩解他們當(dāng)下遇到

困難時的焦躁心情。

欺詐檢測也是文本數(shù)據(jù)的重要應(yīng)用之一。在健康險或傷殘保險的投訴事務(wù)中,運用文本分析

技術(shù)可以解析出客戶的評論和理由。文本分析可以將欺詐模式識別出來,標(biāo)記出風(fēng)險的凹凸。

面對高風(fēng)險的投訴,須要更細(xì)致地檢查。另一方面,投訴在某種程度上還能自動地執(zhí)行。假

如系統(tǒng)發(fā)覺了投訴模式、詞匯和短語沒有問題,就可以認(rèn)定這些投訴是低風(fēng)險的,并可以加

速處理,同時將更多的資源投入高風(fēng)險的投訴中。

法律事務(wù)也會從文本分析中受益。依據(jù)慣例,任何法律案件在上訴前都會索取相應(yīng)的電子郵

件和其他通信歷史記錄。這些通信文本會被批量地檢查,識別出與本案相關(guān)的那些語句。例

如,哪些電子郵件中有隱藏的內(nèi)幕消息?哪些人在和別人溝通時說的是假話?威逼背后的實

質(zhì)是什么?

在法律案件中應(yīng)用文本分析的做法稱為電子偵察。全部預(yù)先進行的分析將幫助起訴獲得勝

利。不運用文本分析,僅通過人工的方式將無法閱讀全部的所需文檔。即使我們可以做到人

工閱讀那些文檔,但因為任務(wù)本身過于單調(diào)枯燥,我們很可能會漏掠其中的一些關(guān)鍵信息、。

文本數(shù)據(jù)可能會對全部的行業(yè)都產(chǎn)生影響。它可能是如今運用最廣泛的一類大數(shù)據(jù)。對企業(yè)

來講,駕馭如何收集、解析和分析文本是很重要的。文本是我們必需駕馭的一種大數(shù)據(jù)源。

多個行業(yè):時間數(shù)據(jù)與位置數(shù)據(jù)的價值

隨著全球定位系統(tǒng)(GPS)、個人GPS設(shè)備、手機的出現(xiàn),時間和位置的信息始終在增加。

從Foursquare到GooglePlaces,再到FacebookPlaces,它們供應(yīng)了大量的服務(wù)與應(yīng)用,

可以記錄每個人在某個時間點的位置“手機應(yīng)用程序可以記錄我們的位置和移動的軌跡。即

使手機沒有正式開啟GPS,我們還是可以運用基站信號來獲得相當(dāng)精確的位置信息。

消費者應(yīng)用程序中有一些新奇的運用這些信息的方法,這些方法可以捕獲到消費者允許其捕

獲的信息。例如,有?些應(yīng)用使我們可以追蹤熬煉中行進的路途,路途的長度,以及走完該

路途所須要的時間。事實上,假如攜帶了手機,我們就能記錄去過的每一個地方。我們還可

以選擇把數(shù)據(jù)公開給他人,當(dāng)更多的人向公眾公開了自己的時間和位置數(shù)據(jù),就會出現(xiàn)一些

特別好玩的事情。

很多公司已經(jīng)起先意識到駕馭客戶的時間與位置數(shù)據(jù)的成力,它們起先嘗試從客戶那里收集

這類信息。當(dāng)然,這類信息必需建立在篩選的基礎(chǔ)上,棄且必需制定明確的隱私政策,并嚴(yán)

格地遵守這些政策。很多公司推出了令人難以抗拒的位置價值服務(wù),吸引用戶把時間和位置

信息開放給它們。

我們并非只想了解消費者的時間和位置信息。卡車車隊的領(lǐng)導(dǎo)也想駕馭每輛卡車在某個時間

點的位置,比薩店確定想知道每名外送人員某個時間在什么地方,養(yǎng)寵物的人確定想知道寵

物在外面的什么地方,大型宴會中組織人員須要知道侍者四處走動的效率和響應(yīng)顧客的速

度。

從收集個人、資產(chǎn)的時間和位置數(shù)據(jù)起先,企業(yè)可以快速地進入大數(shù)據(jù)領(lǐng)域。假如這些信息

能夠頻繁地更新就更好了,知道每輛卡車每天早晚的位置是一回事兒,知道每輛卡車每秒鐘

在哪兒就是另外一回事兒了。時間和位置數(shù)據(jù)被采納、應(yīng)用的程度將越來越高,其造成的影

響也將越來越大。

運用時間和位置數(shù)據(jù)

時間和位置數(shù)據(jù)是對隱私最敏感的一類大數(shù)據(jù)。我們面對的不僅有隱私問題,還有道德和倫

理問題。我們是否要在孩子們的胳膊上安裝芯片,以便當(dāng)他們迷路時可以追蹤到他們?老年

癡呆患者離家出走或者擅自離開護理機構(gòu)時我們應(yīng)當(dāng)怎么做?當(dāng)然,時間和位置數(shù)據(jù)被濫用

的可能性會相當(dāng)高。但從好的方面想,它們被合理運用的可能性同樣也會很高。下面我們來

看一些例子。

可能很快人們就會在警察局和消防部門注冊,并供應(yīng)自己口常會去哪些地方的信息。這樣,

假如遇到洪水、火災(zāi)或封路這類大事務(wù),人們會收到警察局和消防部門發(fā)送的警告信息,告

知他們即將路過的地方有狀況,提示他們繞道。假如人們可以主動避開是非之地,就能使交

通中斷的時間降到最低,這樣每個人的時間都能節(jié)約下來。最終,在得到你的許可后,當(dāng)?shù)?/p>

政府甚至可以接收你的實時位置信息。

一種初露端倪的數(shù)據(jù)運用方法是開發(fā)對時間和位置信息敏感的消息通知,這個市場的將來空

間很大。通知不再局限于當(dāng)天或本周,而是依據(jù)客戶的時間和位置信息供應(yīng)最適合的消息通

知?,F(xiàn)在的做法一般是由客戶簽到并告知他們的位置,這樣他們就能接收到通知信息了。公

司能夠持續(xù)地跟蹤到客戶的動向,以做出相應(yīng)的反應(yīng)。

例如,可能用戶會告知你,他要在5:30分別開辦公室回家,大約5:45到6:00之間會開車

通過5號出口。他要找胞方吃飯,并且想了解你的商店或餐館那個時間有什么食物。你須

要在那個時間那個地點供應(yīng)匹配他的需求的可口飯菜。其次天早上才通過電子郵件告知他相

關(guān)的信息明顯已經(jīng)太遲了,我們要的是當(dāng)他通過那個地方的那一刻就主動推送給他通知信

息。

依據(jù)地點和時間主動推送通知信息

營銷領(lǐng)域慢慢顯露出來的一個趨勢是,只對剛好處在某個時間段和某個地點的客戶才針對性

地推送通知信息。與依據(jù)大范圍的時間和地點發(fā)送的通知相比,這種通知的效果更好,針對

性更強。早期采納這種作法的企業(yè)已經(jīng)取得了令人驚訝的效果。

當(dāng)然管理這種通知的困難性要高不少,因為我們要做的不只是跟蹤每個人當(dāng)周的服務(wù)舉薦這

么簡潔。我們須要關(guān)切的是每個用戶每時每刻在什么地方,我們在這個時間點為他們舉薦什

么東西最合適。依據(jù)時間和位置推送通知的確大大地增加了困難性,并且變得難以管理。但

我們信任假以時日,假如我們做得不錯,這種方式的轉(zhuǎn)化率應(yīng)當(dāng)會遠遠超過傳統(tǒng)的特性化舉

薦。歷史閱歷反復(fù)地告知我們,假如通知信息越精準(zhǔn),轉(zhuǎn)化率就會越高。

運用此類數(shù)據(jù)的另一種模式是增加型社交網(wǎng)絡(luò)分析。無線運營公司可以依據(jù)語音和文本溝通

信息識別出用戶間的關(guān)系,借助時間和位置數(shù)據(jù)可以識別出哪些人在同??時間出現(xiàn)在了同??

個地方。例如,哪些人在聽音樂會或看電影?哪些人要去觀看某一場體育競賽?哪些人在同

一時間同一餐館就餐?

假如能識別出哪曲人大約在同一時間同一地點出現(xiàn),就能識別出有哪些彼此不相識或者在同

一個社交圈子里的人,但是他們都有著很多共同的愛好。想象一下,假如婚介服務(wù)能用這樣

的信息幫助我們找到自己的另一半那該有多好!我們可以激勵人們建立聯(lián)系,給他們供應(yīng)符

合個人身份或團體身份的產(chǎn)品舉薦。

時間和位置數(shù)據(jù)不僅可以幫助我們理解客戶的歷史模式,還可以精確地預(yù)料客戶將來會出現(xiàn)

在什么地方。對于有固定習(xí)慣的客戶尤其如此。假如我們知道某個人會在哪里出現(xiàn),要往哪

里去,我們就能預(yù)料出他們10分鐘或一個小時以后會由現(xiàn)在哪里。假如我們知道客戶以前

在同一條路上去過哪里,我們就能更精確地做出他現(xiàn)在要去往何處的預(yù)料。我們最差也能大

大地削減列表上的候選路途,這樣就能支持更精準(zhǔn)的營銷。

將來幾年間,時間和位置數(shù)據(jù)的應(yīng)用會經(jīng)驗爆炸性的增長,面對消費者的選擇流程和激勵措

施終將成熟?,F(xiàn)在我們要當(dāng)心行事,并在我們運用這些信息之前,獲得用戶的許可。運用時

間和位置數(shù)據(jù)的消息通知將會更有針對性、更特性化。在不遠的將來,假如通知信息不是依

據(jù)時間和位置推送的,或許會被認(rèn)為很士。

零售制造業(yè):RFID數(shù)據(jù)的價值

無線射頻標(biāo)簽,即RFID標(biāo)簽,是安裝在裝運托盤或產(chǎn)品外包裝上的一種微型標(biāo)簽。RFID標(biāo)

簽上有一個唯一的序列號,這個序列號與UPC類似的通用產(chǎn)品標(biāo)識碼不同。換言之,RFID標(biāo)

簽不僅能夠識別出托盤上裝的是Model123電腦,還能浜別出托盤上裝運的是獨一無二的、

特定的一套Model123電腦。

RFID讀卡器發(fā)出信號,RFID標(biāo)簽返回響應(yīng)信息。假如多個標(biāo)簽都在讀卡器讀取范圍內(nèi),它

們同樣會對同一查詢做出響應(yīng),這樣辨識大量物品就會變得比較簡潔。即使當(dāng)這些東西堆疊

在一起或者放到了墻后面,只要信號可以穿透,我們就能得到響應(yīng)信息、。有了RFID標(biāo)簽,

我們就不再須要人工記錄和盤點每個商品,這樣清點商品的時間就會縮短。

多數(shù)用于高價值應(yīng)用外的RFID標(biāo)簽都是被動式的無源標(biāo)簽,意味著這些標(biāo)簽是沒有內(nèi)置電

池的。讀卡器的無線電波產(chǎn)生磁場,該磁場給標(biāo)簽供應(yīng)了足夠的能量,使得標(biāo)簽可以將內(nèi)置

信息發(fā)送出去。RFID技術(shù)已經(jīng)出現(xiàn)很長時間了,但成本問題限制了該應(yīng)用的進一步推廣。

今口,無源標(biāo)簽的成本只有幾美分,而且價格還在不斷下跌。隨著階格的不斷下跌,實際應(yīng)

用狀況將會出現(xiàn)持續(xù)增長?,F(xiàn)在的RFID技術(shù)還有一些問題,例如,液體會屏蔽標(biāo)簽的信號。

隨著時間的推移,這些技術(shù)問題都將會得到有效的解決。

有些RFID應(yīng)用很多人都曾經(jīng)接觸過,其中之一就是自動收費標(biāo)簽。有了它,司機通過高速

馬路收費站的時候就不須要再停車了。它的工作原理是,交通管理局在所發(fā)的卡中植入了

RFID標(biāo)簽,同時高速馬路上安裝了讀卡器;當(dāng)汽車開過時,標(biāo)簽會把汽車數(shù)據(jù)傳到讀卡器,

這樣我們開車通過收費站就被記錄下來了。

RFID數(shù)據(jù)的另一個重要應(yīng)用是資產(chǎn)跟蹤。例如,一家公司想把其擁有的每一個PC、桌椅、

電視等資產(chǎn)都貼上標(biāo)簽。這些標(biāo)簽可以很好地幫助我們進行庫存跟蹤。跟蹤這些物品。假如

物品移出指定區(qū)域,它們就會發(fā)送警告信息。例如,我們可以把讀卡器放在出口處,假如公

司資產(chǎn)在沒有被事先批準(zhǔn)的狀況下出門,警報很快就會響起來,這樣就能起到平安警示的作

用了。這種作法類似于零售商店里的物品標(biāo)簽,假如標(biāo)簽變?yōu)闊o效,警報就會被拉響。

RFID最大的應(yīng)用之一是制造業(yè)的托盤跟蹤和零售業(yè)的物品跟蹤。例如,制造商發(fā)往零售商

的每?個托盤上都有標(biāo)簽,這樣可以很便利地記錄哪些貨物在某個配送中心或者商店。最終,

商店中價格很低的商品也可以配備RFID芯片,或者運用一種類似的新技術(shù)。現(xiàn)在我們已經(jīng)

明白了RFID數(shù)據(jù)是什么,下面我們來看一看RFID數(shù)據(jù)可以從哪些方面來改善當(dāng)前的商業(yè)

模式。

運用無線射頻標(biāo)簽數(shù)據(jù)

RFID的一種增值應(yīng)用是識別零售商貨架上有沒有相應(yīng)的商品。假如讀卡器能夠連綿不斷地

確定貨架上每種商品的存量,當(dāng)須要重新配貨的時候,我們就能得到精確的信息。運用RFID

可以更好地跟蹤貨架的供應(yīng)狀況,因為商品脫銷和有商品可供應(yīng)的狀態(tài)是完全不同的。一種

可能的狀況是,商店貨架上沒有該商品了,但后面貯存室里還有5件該商品。

在這種狀況下,任何傳統(tǒng)的商品脫銷分析都會顯示貨架上現(xiàn)在仍有存貨,因此不須要擔(dān)憂。

當(dāng)銷售業(yè)績起先下滑時,人們才會發(fā)覺問題所在。假如有RFID標(biāo)簽,就可以跟蹤到貯存室

中還有5件該商品,但貨架上卻沒有該商品了。這樣,我們只須要簡潔地從貯存室把商品

搬到貨架上就能解決問題,這個例子在成本和技術(shù)上有一些挑戰(zhàn),但現(xiàn)在大家正在努力克服

這些困難。

RFID還能很好地幫助我們跟蹤促銷展示影響的效果。通常在促銷過程中,商品要擺在商店

的很多地點進行展示。從傳統(tǒng)的POS數(shù)據(jù)中,我們可以知道促銷商品的銷量,但我們不知

道銷售來自于哪個展示點。通過RFID標(biāo)簽我們可以識別出商品是從哪個展示點銷售出去的,

這樣我們就能評估不同的地點對銷售效果的影響。

RFID假如和其他數(shù)據(jù)結(jié)合起來,就能發(fā)揮更大的威力。假如公司可以收集配送中心里的溫

度數(shù)據(jù),當(dāng)出現(xiàn)掉電或者其他極端事務(wù)時,我們就能跟蹤到商品的損壞程度?;蛟S倉庫某一

區(qū)域在停電期間的溫度高達90攝氏度,且時間長達90分鐘。有了RFID,我們就能精確地

知道在那個時刻哪些托盤位于配送中心的那個區(qū)域內(nèi),然后我們就能實行相應(yīng)的行動。倉庫

數(shù)據(jù)還可以和裝運數(shù)據(jù)匹配起來,假如商品發(fā)生了損壞,公司可以有針對性地召回商品,并

通知零售商當(dāng)商品抵達時再次對商品進行開箱檢查。

組合顯神通

就像很多其他大數(shù)據(jù)源一樣,RFID數(shù)據(jù)本身并不能發(fā)揮全部的威力。當(dāng)與其他數(shù)據(jù)組合起

來運用時,它們就能發(fā)揮作用。大數(shù)據(jù)戰(zhàn)略的目標(biāo)是把大數(shù)據(jù)和其他數(shù)據(jù)整合到同一個處理

流程中,這一點再怎么強調(diào)也不為過。運用大數(shù)據(jù)并不是一個孤立的工作。

RFID還有一些操作型應(yīng)用。有些配送中心商品管理不嚴(yán)格,導(dǎo)致商品損壞程度很高。對于

某些團隊,甚至某些工人來說的確如此。人力資源(HR)系統(tǒng)會報告誰在隨意時間點上工

作。當(dāng)RFID數(shù)據(jù)和這類數(shù)據(jù)組合起來,就能顯示出商品何時被移動了,還能識別出損壞、

損耗、偷竊商品概率更高的員工。數(shù)據(jù)的組合運用,使我們能夠?qū)嵭懈鼜姶?、質(zhì)量更高的行

動。

RFID有一種特別好玩的將來應(yīng)用是跟蹤商店購物活動,就像跟蹤Web購物行為一樣。假如

RFID讀卡器植入購物車中,我們就能精確地知道哪些客戶把什么東西放進了購物車,也能

精確地知道他們的放入依次。即使并非每種物品都配有標(biāo)簽,我們?nèi)耘f可以識別出購物車經(jīng)

過的道路。通過在店面中運用RFID,Web數(shù)據(jù)所能帶來的諸多好處都將變成現(xiàn)實。最終兩

個例子必需考慮隱私問題,因為或許顧客根本不想讓他們的購物行為被跟蹤。我們可以采納

“匿名”購物的方法,不對產(chǎn)生數(shù)據(jù)的人進行方位識別。

RFID的最終一種應(yīng)用是識別欺詐犯罪活動,歸還偷盜物品。假如物品貼有RFID標(biāo)簽,零售

商可以通過標(biāo)簽的ID進行識別,確定返還物品是否屬于偷走的同一批產(chǎn)品,并實行適當(dāng)?shù)?/p>

行動。事實上,關(guān)鍵在于RFID的ID可以作為收據(jù)的一部分,協(xié)助返還流程。零售商知道

購買商品上貼的是哪個RFID標(biāo)簽,而不是像平常那樣只知道你購買了某種商品。當(dāng)我們來

到退貨臺,要把貼有那個標(biāo)簽的商品退還。我們確定不能從貨架上拿下來另外一個一模一樣

的商品,假裝跟收據(jù)一起返還。以這種方式來運用RFID,欺詐將會變得無比困難。

將來幾年RFID有可能會對制造業(yè)和零伐業(yè)產(chǎn)生巨大的影響。與很多人的期望不同,RFID的

接受速度要慢一些。但RFID標(biāo)簽價格在持續(xù)下跌,標(biāo)簽和讀卡器的質(zhì)量卻在不斷上升,從

經(jīng)濟的角度考慮,RFID的應(yīng)用將會更加廣泛。

電力行業(yè):智能電網(wǎng)數(shù)據(jù)的價值

智能電網(wǎng)是下一代電力基礎(chǔ)設(shè)施。與我們四周常常見到的高壓電傳輸相比,智能電網(wǎng)更先進

更牢靠。智能電網(wǎng)有特別困難的監(jiān)控、通信和發(fā)電系統(tǒng),可以供應(yīng)穩(wěn)定如一的服務(wù),假如出

現(xiàn)停電和其他問題,可以更好更快地復(fù)原。各類傳感器和監(jiān)控設(shè)備記錄了電網(wǎng)本身和流經(jīng)電

流的很多信息。

智能電網(wǎng)中的?個環(huán)節(jié)是我們常常提到的智能電表。智能電表是?種傳統(tǒng)電表的替代品。從

外觀上看,智能電表和我們始終運用的電表沒有什么不同,但智能電表的功能更強大。以前

抄表人員都是每隔幾周或幾個月就挨家挨戶地抄電表,而智能電表可以每隔15分鐘到一個

小時從每一個家庭或企業(yè)自動地收集數(shù)據(jù),甚至可以跨區(qū)或者跨電網(wǎng)收集數(shù)據(jù)。

雖然我們這里關(guān)注的是智能電表,但在智能電網(wǎng)中大量運用的傳感器也值得一提。這些遍布

智能電網(wǎng)但我們卻看不到的傳感器,它們收集到的數(shù)據(jù)從規(guī)模上使智能電表數(shù)據(jù)黯然失色。

傳感器每秒鐘要從發(fā)電系統(tǒng)讀取60次同步相量測量值,與記錄家用電器開關(guān)狀態(tài)的家庭網(wǎng)

絡(luò)一樣,它們都是大數(shù)據(jù)的例子。一般人開不知道這些傳感器的存在,但它們對電網(wǎng)來說特

別重要。傳感器要讀取全部的電流數(shù)據(jù)和智能電網(wǎng)的設(shè)格狀態(tài),數(shù)據(jù)量特別特別大。

智能電網(wǎng)技術(shù)已經(jīng)在歐洲和美洲的某些地方起先運用了.我們信任在不久的將來,世界上每

一處電網(wǎng)都會被智能電網(wǎng)取代。電力公司因為運用了智能電網(wǎng),它們所駕馭的耗電數(shù)據(jù)量會

以指數(shù)級增長。這類數(shù)據(jù)要怎樣運用?下面我們來看一下。

運用智能電網(wǎng)數(shù)據(jù)

從用電管理的角度來看,智能電表數(shù)據(jù)可以幫助人們更好地理解電網(wǎng)中客戶的需求層次。此

外,這些數(shù)據(jù)也可以使消費者受益。例如業(yè)主可以選擇把待測試的電器打開,與此同時保持

其他電器的穩(wěn)定,這時從智能電表處可以監(jiān)控到具體的電力消耗狀況,這樣我們就可以明確

地測量出各種電器原委消耗了多少電量。

世界各國的電力公司現(xiàn)在都已經(jīng)在主動地轉(zhuǎn)向這樣的定價模型,即按時間或需求量的變更來

定價,智能電網(wǎng)的出現(xiàn)加速了這種趨勢。電力公司的主要目標(biāo)之一是利用新的定價程序來影

響客戶行為,削減高峰時段的用電量。為了應(yīng)對用電高峰須要另建發(fā)電站,須要?大筆錢而

且還會對環(huán)境造成很大的影響。假如用電成本可以敏捷地依據(jù)時間來設(shè)定,并由智能電表來

測量,我們就可以促使客戶變更他們的用電行為。較低的峰值和較為平穩(wěn)的用電需求等同于

更少的對新基礎(chǔ)設(shè)施的需求和更低的成本。

當(dāng)然電力公司通過智能電表供應(yīng)的數(shù)據(jù)還能識別出其他的各類趨勢。哪些地方的用電量有所

I可落?哪些消費者每天或每周的用電需求比較相同?電力公司可以依據(jù)運用模式對客戶進

行分類,可以選擇針對某些特定的群體開發(fā)產(chǎn)品和活動。運用這些數(shù)據(jù)我們還可以識別模式

出現(xiàn)異樣的那些地方,它們揭示了須要解決的問題。

事實上,電力公司有實力執(zhí)行其他行業(yè)已經(jīng)運用多年的客戶分析工作。例如,電話公司知道

我們月底的全部賬單,但并不知道我們具體的通話。零售商店只知道整體銷售狀況,而不知

道任何購買的細(xì)微環(huán)節(jié)信息。一家金融機構(gòu)知道我們的月終余額,但并不了解我們這個月的

資金流淌狀況。從很多方面講,電力公司面對的這類數(shù)據(jù)對于理解客戶而言仍略顯不足。它

們也有簡潔的月終匯總數(shù)據(jù),但這種月結(jié)數(shù)據(jù)往往是估計值而不是實際的耗電量。

大數(shù)據(jù)可以變更一個行業(yè)

有時候,大數(shù)據(jù)真的可以變更一個行業(yè),可以把分析應(yīng)用提升到一個全新的高度。甩力行業(yè)

運用的智能電網(wǎng)數(shù)據(jù)就是一個這樣的例子。不再受每月一次抄表的限制,耗電信息會以秒鐘

或分鐘為間隔被測量。遍布電網(wǎng)的精致傳感微,使數(shù)據(jù)的運用變得與以往完全不同。以此開

展的數(shù)據(jù)分析會在費率套餐、用電管理等諸多方面產(chǎn)生很多創(chuàng)新。

有「智能電表數(shù)據(jù),我們就可以進行全新的分析,使大眾全都受益。消費者可以依據(jù)自己的

運用模式定制費率套餐,就像車載信息服務(wù)支持特性化的汽車保險費率那樣。高峰時段用電

客戶比非高峰時段用電客戶的收費要氤面對這樣的刺激政策,我們會變更自己的用電模式,

可能我們會在下午晚些時候再運用洗碗機而不是吃完午飯就立刻運用。

電力公司也會有更精確的需求預(yù)料?,它們能更清晰地以別出需求來自于哪些地方。它們還能

了解某一類客戶在某個時間的用電需求。電力公司可以運用不同的方法來驅(qū)動各種行為,使

需求更加平穩(wěn),并降低異樣需求峰值出現(xiàn)的頻率。全部這些都會使對昂貴的新發(fā)電設(shè)備的需

求受到抑制。

每一個家庭、每一個行業(yè)都能感受到智能電表數(shù)據(jù)產(chǎn)生的威力,這些數(shù)據(jù)能夠讓我們更好地

跟蹤、更主動地管理用電狀況。我們不僅能節(jié)約用電,也能使這個世界更加低碳,還可以幫

助大家省錢。假如我們能清晰地知道自己的耗電量比預(yù)期要多,我們確定就會依據(jù)須要做出

適當(dāng)?shù)恼{(diào)整。假如只運用每月賬單,我們將無法識別出這種機會。但是,智能電表數(shù)據(jù)將使

這一切變得簡潔。

博彩業(yè):籌碼跟蹤數(shù)據(jù)的價值

前面我們已經(jīng)探討了RFID技術(shù)是如何應(yīng)用在零售業(yè)和制造業(yè)的。RFID技術(shù)的用途事實上更

廣泛,很多應(yīng)用都會產(chǎn)生大數(shù)據(jù)。RFID標(biāo)簽的另外一種應(yīng)用是貼在賭場用的籌碼上面。每

一個籌碼,特殊是高價值的籌碼都有自己的內(nèi)置標(biāo)簽,這樣賭場就可以通過標(biāo)簽的串行編號

實現(xiàn)唯一的識別。

賭場里川的老虎機已經(jīng)被跟蹤了很多年。一旦我們在老虎機上刷了常常運用的玩家卡或者信

用卡,那我們每次搬動手柄按下按鍵的動作就會被跟蹤。當(dāng)然你的賭注和你贏的錢也會被跟

蹤。雖然老虎機模式的分析歷史悠久,但賭場仍舊沒有從桌面嬉戲中捕獲到足夠多的維微環(huán)

節(jié)。現(xiàn)在這個過程正在發(fā)生變更,標(biāo)簽己經(jīng)起先被植入嬉戲籌碼。

以前賭場會用功能強大的平安攝像頭網(wǎng)絡(luò)跟蹤籌碼,地勤人員的工作是保證籌碼上下左右的

移動是合理的。賭臺經(jīng)理要找尋??停浪闼麄兊钠骄蹲⒑屯娴臅r間,并給這種常客嘉獎。

雖然賭臺經(jīng)理精于此道,同時還能獲得其他人員的幫助,但嬉戲嘉獎多多少少總會不夠精確。

假如被監(jiān)視的玩家碰巧比平常投注多那么一點或少那么一點,就會發(fā)生這種不精確的狀況。

有些玩家假如認(rèn)為他們自己正在被監(jiān)視,他們會利用系統(tǒng)規(guī)則增加投注來牟利。

同類技術(shù)可以驅(qū)動多種大數(shù)據(jù)流

零售商和制造商都運用了RFID技術(shù)。博彩行業(yè)也是如此。它們運用RFID的方法有很多不

同之處,但也有很多相像之處。最好玩的是,一種技術(shù)可以在不同的行業(yè)運用,形成各個行

業(yè)獨特的大數(shù)據(jù)源。

籌碼跟蹤是一種特殊的RFID應(yīng)用,除了這個例子外,RFID還有很多其他的應(yīng)用。這個例子

說明白一些底層相同的技術(shù)可以支持不同的大數(shù)據(jù)流,這些大數(shù)據(jù)流本質(zhì)相同,但范圍和應(yīng)

用卻完全不同。讓我們興奮的是,這種基礎(chǔ)技術(shù)有著完全不同的用處,產(chǎn)生了多種行業(yè)里形

式各異的大數(shù)據(jù)。

運用籌碼跟蹤數(shù)據(jù)

運用籌碼標(biāo)簽的一個明顯優(yōu)點是可以精確地跟蹤每位玩家下的賭注。標(biāo)簽可以保證玩家在常

常性的玩家活動中賺到全部的積分,不會多也不會少。這就給玩家和賭場同時帶來了好處。

對于賭場而言,資源可以更精確地配置給正確的玩家,過度嘉獎錯誤的玩家和過少嘉獎?wù)_

的玩家都會導(dǎo)致有限營銷資源的非最優(yōu)安排,而玩家產(chǎn)然希望他們的積分恒久精確無誤。

有了玩家的賭注數(shù)據(jù),賭場就可以更好地對玩家進行分類,以理解投注模式。誰會每次先下

注5美元,但幾乎每隔一段時間就把投注升到100美元呢?誰會每次下注10美元?可以

依據(jù)這些模式對玩家進行分類。投注模式還能揭示21點博彩嬉戲中誰在算牌,因為假如玩

家運用算牌技巧的話,某種賭注模式就會凸顯出來。

賭場運用籌碼跟蹤技術(shù),玩家想要主動欺瞞賭場將會變得更困難,甚至連莊家想犯錯都比較

困難。因為籌碼的投注和分紅都可以被跟蹤到,我們可以很簡潔地回過頭來對比視頻,檢查

21點某一次出牌或者分紅的結(jié)果。即使胳膊和頭攔住了我們的視線,看不清晰拿起來或者

放下去的籌碼,但RFID數(shù)據(jù)依舊可以供應(yīng)細(xì)微環(huán)節(jié)信息。賭場可以識別發(fā)生的錯誤或者欺

詐。譬如說當(dāng)莊家往另一個方向看的時候,玩家放下了一筆籌碼。

時段分析可以識別出莊家或玩家犯下異樣錯誤的數(shù)目。它可以幫助我們處理欺詐活動,或者

對犯下大量簡潔錯誤的莊家進行額外培訓(xùn)。籌碼計算錯誤也會因之而下降,統(tǒng)計大量各種面

額的籌碼是特別單調(diào)的工作,人們往往會在這個過程中犯錯,RFID支持更快更精確的計算。

將前面這個例子講得更深化一點兒,對小偷來說,跟蹤每個籌碼的舉措具有相當(dāng)強的威懾作

用。假如一摞籌碼被偷走了,那些籌碼的標(biāo)識就會被標(biāo)記成“已被偷”。假如有人進來兌換

這些籌碼,甚至拿著這些籌碼坐到桌子旁邊,系統(tǒng)就會留意到,并拉響平安警報。假如小偷

偷走或者更換了這些籌碼,那標(biāo)簽就不能被讀取。賭場清晰籌碼的ID,它們希望全部的籌

碼都報告一個合法的ID。假如某個籌碼沒有報告ID,或者報告的ID不合法,那它們就會實

行措施。

就像其他行業(yè)一樣,賭場對欺詐行為阻擋得越多,分紅就會越合理,風(fēng)險也就會越低。因為

費用支出比較少,這樣我們就有實力給玩家供應(yīng)更好的服務(wù)和投注賠率。對于賭場和玩家而

言,這是雙贏.

工業(yè)發(fā)動機和設(shè)備:傳感器數(shù)據(jù)的價值

世界各地安裝了很多困難的機器和發(fā)動機,例如,£機、火車、軍車、建筑設(shè)備、鉆孔設(shè)備

等。因為造價昂貴,保持這些設(shè)備的穩(wěn)定運轉(zhuǎn)是特別重要的。近些年來,從飛機發(fā)動機到坦

克等各種機器上也起先運用嵌入式傳感器,目標(biāo)是以秒或亳秒為單位來監(jiān)控設(shè)備的狀態(tài)。

監(jiān)測工作可以做得相當(dāng)細(xì),特殊是在測試和開發(fā)過程中。例如,當(dāng)新的發(fā)動機開發(fā)出來,就

得依靠獲得到的足夠多的刖微環(huán)節(jié)信息,來檢查發(fā)動機是否可以依據(jù)預(yù)期設(shè)定的方式工作。

?旦新發(fā)動機進入市場,再想更換有缺陷的部件的花費會相當(dāng)高,因此我們須要事先具體地

進行性能分析。監(jiān)測是一項不斷持續(xù)的活動。或許我們并不須要持續(xù)收集每一亳秒的細(xì)微環(huán)

節(jié)信息,但假如能夠收集到大量的細(xì)微環(huán)節(jié)信息,我們就可以評估該設(shè)備的生命周期,識別

出重復(fù)出現(xiàn)的問題。

例如,發(fā)動機傳感器可以收集到從溫度到每分鐘轉(zhuǎn)數(shù)、燃料攝入率再到油壓級別等信息,而

數(shù)據(jù)可以依據(jù)預(yù)先設(shè)定的頻率獲得。當(dāng)讀數(shù)頻率、讀取指標(biāo)數(shù)量和監(jiān)控項目數(shù)量增加時,數(shù)

據(jù)量會快速增加。為什么我們要關(guān)切這?一點?下面我們來看一些例子。

運用傳感器數(shù)據(jù)

發(fā)動機的結(jié)構(gòu)很困難,有很多移動部件,必需在高溫下運轉(zhuǎn),會經(jīng)驗各種各樣的運轉(zhuǎn)狀況。

因為它們的成本太高,所以期望壽命越長越好。因此,穩(wěn)定的、可預(yù)料的性能就變得異樣重

要,因為機器的壽命依靠于此。例如,對故障飛機進行保養(yǎng)修理會花掉航空公司或者空軍部

隊?筆不小的錢,但這種事情我們還必需做,因為我們要識別出飛機是否存在平安隱患。因

此,飛機或者£機發(fā)動機以及其他設(shè)備的停機時間確定要降到最低,航空公司或者空軍部隊

對此都有特別迫切的需求。

停機時間最小化策略包括準(zhǔn)備備件或后備發(fā)動機快速割接時須要修理的設(shè)備、從診斷結(jié)果中

快速識別須要更換的部件、針對問題部件投資開發(fā)更牢靠的新版本。要想有效實施這3種

策略,必需得有數(shù)據(jù)。我們要用數(shù)據(jù)生成診斷算法,或者用數(shù)據(jù)作為輸入來診斷某個特定的

問題。工程部門可以運用傳感器數(shù)據(jù)精確地定位問題的緣由,設(shè)計新的措施支持更長、更牢

靠的操作。不管發(fā)動機是飛機的,還是船只的,或者是陸地設(shè)備的,這些考慮因素都適用。

通過提取和分析具體的發(fā)動機運轉(zhuǎn)數(shù)據(jù),我們可以精確地定位那些會導(dǎo)致馬上失效的某些模

式。然后我們就能識別出會降低發(fā)動機壽命的時間分段模式以及更加常見的修理。多個變量

的排列組合數(shù)目,特殊是一段時間內(nèi)的排列組合數(shù)目,使得這類數(shù)據(jù)分析活動變成了一項挑

戰(zhàn)。這個過程不僅會涉及到大數(shù)據(jù),就連隨之開發(fā)出來的分析也會變得異樣困難和困難。以

下是我們可以探討的一些問題。

壓力隧然下降是否表示確定就會出問題?

溫度在幾小時內(nèi)持續(xù)下降是否意味著還有其他問題?

振動水平異樣是否意味著有問題?

發(fā)動機啟動時的飛速轉(zhuǎn)動是否讓某些部件的性能嚴(yán)峻受損,而且還會增加修理的次數(shù)?

幾個月內(nèi)油壓始終比較低,是否會使發(fā)動機的某些部件受損?

結(jié)構(gòu)化數(shù)據(jù)內(nèi)缺少結(jié)構(gòu)性

傳感器數(shù)據(jù)給我們帶來了i個特別艱難的挑戰(zhàn)。雖然我們收集到的數(shù)據(jù)是結(jié)構(gòu)化的,獨立的

數(shù)據(jù)元素也很好理解,但元素之間的時間關(guān)系和模式卻根本無法理解,延時和無法測量的外

部因素增加了問題的困難性。假如要考慮全部的信息,識別各種數(shù)據(jù)長期的作用效果,這個

過程會異樣困難。擁有結(jié)構(gòu)化數(shù)據(jù)并不確定能夠保證分析方法就是高度結(jié)構(gòu)化和標(biāo)準(zhǔn)化的。

在出現(xiàn)嚴(yán)峻問題的時候,先回頭去檢查當(dāng)時發(fā)生了什么,始終檢杳到問題自己露出馬腳,這

種做法會特別奏效。傳感器的作用類似于依靠飛機黑匣子的幫助診斷失事緣由。發(fā)動機傳感

器數(shù)據(jù)可以用于診斷活動和探討行為。從概念上講,相對于從前我們講到的汽車保險案例中

的信息服務(wù)設(shè)備,我們這里探討的傳感器是一種更困難的形式。傳感器不斷感知四周環(huán)境并

獲得數(shù)據(jù)信息,這是大數(shù)據(jù)世界中反復(fù)探討的一個主題。雖然我們這里探討的是發(fā)動機,但

傳感器還有數(shù)不清的各類用途,這里探討的原則也同樣適用。

假如大量傳感器都長時間重復(fù)著傳感器數(shù)據(jù)收集流程,那會產(chǎn)生大量豐富的分析數(shù)據(jù)。只要

好好地分析這些數(shù)據(jù),就能發(fā)覺設(shè)備的缺陷,就有機會主動修復(fù)這些問題。我們還可以把設(shè)

備中的弱點先行識別出來3隨后,我們可以制定好流程,緩解這些發(fā)覺帶來的問題。這些措

施帶來的收益不止是平安級別的提升,還會讓我們的成本下降。運用傳感器數(shù)據(jù),發(fā)動機和

設(shè)備都會更加平安,能夠供應(yīng)服務(wù)的時間就會比較長,這樣運營會比較平穩(wěn),成本也會比較

低。這是一種通血的做法。

視頻嬉戲:遙測數(shù)據(jù)的價值

遙測數(shù)據(jù)是視頻嬉戲產(chǎn)業(yè)的?個術(shù)語,用來描述捕獲嬉戲活動的狀況。其概念與我們在第2

章所講的網(wǎng)絡(luò)大數(shù)據(jù)無異,這是因為遙測數(shù)據(jù)收集的是玩家在嬉戲中的活動狀況。遙測數(shù)據(jù)

的收集對象多數(shù)狀況是在線嬉戲而非掌上嬉戲。

在曲棍球競賽中,遙測數(shù)據(jù)收集的是運動員在擊球進門時,何時進的球,用的哪種擊球方法,

球速多少。在斗爭嬉戲中,遙測數(shù)據(jù)收集的是用哪種槍械開的火,在哪里開的火,向哪個方

向開的火,槍械對各種東西的破壞程度。從理論上講,相關(guān)場景和活動的全部細(xì)微環(huán)節(jié)都能

夠被收集到。

視頻嬉戲制造商從中不僅可以很簡潔地了解到有多少客戶購買了嬉戲軟件,還能知道嬉戲被

玩了多少個小時。運用遙測數(shù)據(jù),嬉戲制造商可以了解到客戶的私人信息,他們實際的玩法,

他們是如何與自己創(chuàng)建的嬉戲進行交互的。我們收集到的嬉戲數(shù)據(jù)可能會很大,但視赧嬉戲

行業(yè)已經(jīng)起先主動地分析這些數(shù)據(jù)了。遙測數(shù)據(jù)對很多領(lǐng)域都產(chǎn)生了影響。從遙測數(shù)據(jù)的優(yōu)

勢和用途來看,很簡潔發(fā)覺它和網(wǎng)絡(luò)數(shù)據(jù)之間的相像性。下面我們來看一些例子。

運用遙測數(shù)據(jù)

很多嬉戲都通過訂閱模式掙錢,因此維持刷新率對這些嬉戲就會特別重要。通過挖掘玩家的

嬉戲模式,我們就可以了解到哪些嬉戲行為是與刷新率相關(guān)的,哪嗚是無關(guān)的。例如,或許

在體育嬉戲競賽時,運用某些協(xié)助功能會大大提升刷新率。嬉戲制造商會實行措施來吸引玩

家嘗試競賽,以誘使他們運用以前不曾運用過的功能。

遙測數(shù)據(jù)只會越來越大

現(xiàn)在,遙測數(shù)據(jù)捕獲的對象大多是限制手柄或鍵盤行為。隨著交互式嬉戲的發(fā)展,它們可以

做到跟蹤玩家的動作,而不是依靠于限制手柄,數(shù)據(jù)量也會因此激增。了解玩家在什么時間

按下了什么按鈕,這類數(shù)據(jù)顯要比了解他身體上的某個部位在某個時刻的空間位置以及移動

方向和速度小得多。

比較新的嬉戲往往喜愛讓玩家花一點小錢在嬉戲過程中購買物品,這就是所謂的微交易

(microtransaction)o例如,-種特殊的武器只賣10美分。我們可以對嬉戲進行分析,識

別出在哪些地方這類微交易的勝利率會比較高?;蛟S嬉戲中的某個地點供應(yīng)一種特別順手的

武器,這種武器會引起玩家的瘋搶。我們可以運用屏幕的快速提示來告知玩家現(xiàn)在有武器可

以購買,這樣很多玩家都會選擇購買該武器裝備。

與其他行業(yè)類似,在視頻嬉戲產(chǎn)業(yè)中,客戶滿足度同樣也是一個大問題。視頻嬉戲的獨特之

處在于要設(shè)置一條特別特別精彩的行進路途。嬉戲要給玩家供應(yīng)挑戰(zhàn)機會,但挑戰(zhàn)不能過度,

過度的挑戰(zhàn)會讓玩家有挫畋感進而放棄嬉戲。假如嬉戲過于簡潔或者過于困難,玩家就會感

到厭倦并轉(zhuǎn)向其他嬉戲。

通過嬉戲分析,我們能夠識別出嬉戲中哪些關(guān)卡每名玩家都能輕松過關(guān),哪些關(guān)卡即使是最

頂級的玩家也很難受關(guān)。我們可以增加或削減這些地方的敵人,盡量使難度等級比較平衡。

平衡的嬉戲難度等級可以為玩家供應(yīng)更加一樣的體驗,乜會讓他們更有滿足感。這樣會導(dǎo)致

更高的刷新率和更多的購買行為。

通過遙測數(shù)據(jù),玩家還可以依據(jù)嬉戲風(fēng)格進行分類。運用這類信息既可以設(shè)計出更優(yōu)秀的嬉

戲,又能交叉銷售現(xiàn)有的產(chǎn)品。其中某個玩家族群可以全身心地投入到嬉戲通關(guān)中,而另一

個玩家族群可以負(fù)責(zé)在通關(guān)前收集全部的獎品,最終一個玩家族群則可以在收關(guān)前探究關(guān)卡

中的全部角落。通過這種組合,每個玩家都可以在嬉戲中運用自己最喜愛的嬉戲方法進行訓(xùn)

練。

遙測數(shù)據(jù)能夠了解到玩家的認(rèn)知層次,基于此可以變更整個嬉戲業(yè)。嬉戲業(yè)已經(jīng)起先運用遙

測數(shù)據(jù),信任在不久的將來這個領(lǐng)域?qū)玫介L足的發(fā)展。依據(jù)遙測數(shù)據(jù)分析的效果,嬉戲

制作和推廣的方式將會發(fā)生巨大的變更。

電信業(yè)與其他行業(yè):社交網(wǎng)絡(luò)數(shù)據(jù)的價值

與傳統(tǒng)數(shù)據(jù)相比,社交網(wǎng)絡(luò)數(shù)據(jù)本身就是一種大數(shù)據(jù)源,即使從很多方面來看,它更像是一

種分析方法學(xué)。其中的緣由在于,執(zhí)行社交網(wǎng)絡(luò)分析的過程須要處理已經(jīng)無比浩大的數(shù)據(jù)集,

此外,還要運用行之有效的方法將處理規(guī)模提升幾個數(shù)量級。

有人會爭論說,移動運營商拿到的全部移動電話的話單或者短信記錄本身就是大數(shù)據(jù),且這

種數(shù)據(jù)可以用于多種用途,但是,社交網(wǎng)絡(luò)分析關(guān)注多個關(guān)系維度而非單個維度,從而可以

做到更上一層樓。這也就是社交網(wǎng)絡(luò)分析可以把傳統(tǒng)的數(shù)據(jù)源變成大數(shù)據(jù)的緣由。

對于現(xiàn)代電話公司,僅僅看通話量是不夠的,電話公司還須要把通話作為獨立實體進行分析。

社交網(wǎng)絡(luò)分析首先要看有哪些人參加了通話,然后再用更深化的視角進行分析。我們不僅要

知道自己給誰打了電話,還要知道我致電的那個人還給誰打了電話,這些人接下來又打給了

什么人,依此類推。要想得到社交網(wǎng)絡(luò)的全景圖,我們就得觸及系統(tǒng)能夠處理的上限。多層

客戶與客戶之間的導(dǎo)航關(guān)聯(lián)以及多層通話都會使得數(shù)據(jù)量倍增。此外,它還增加了分析的難

度,尤其是運用傳統(tǒng)工具時的分析難度。

同樣的概念也適用于社交網(wǎng)絡(luò)站點。通過分析社交網(wǎng)絡(luò)中的某個成員,不難分析出這個成員

有多少美聯(lián)美系,她發(fā)短它的頻率,她訪問站點的頻率,以及其他一些指標(biāo)。但足,當(dāng)成員

與其摯友、與摯友的摯友、與摯友的摯友的摯友都有關(guān)聯(lián)關(guān)系時,這時了解網(wǎng)絡(luò)邊界所須要

的處理量就會大得多。

一千個成員或用戶不難跟琮。但是,他們之間的干脆關(guān)聯(lián)關(guān)系會上升到百萬級別,而再考慮

到“摯友的摯友”則會升至十億級別。這就是社交網(wǎng)絡(luò)分析是一個大數(shù)據(jù)問題的緣由所在。

今日,已經(jīng)有了大量的應(yīng)用來分析這種關(guān)聯(lián)關(guān)系。

運用社交網(wǎng)絡(luò)數(shù)據(jù)

社交網(wǎng)絡(luò)數(shù)據(jù)及分析有一些影響深遠的應(yīng)用,其中一種重要的應(yīng)用正在變更著公司評價客戶

的行為。和以前只看個人的狀況不同,現(xiàn)在參考的是他們的網(wǎng)絡(luò)整體價值。我們這里談的例

子也同樣適用于很多其他的行業(yè),在這些行業(yè)里我們同樣須要了解人與人或者群體與群體之

間的關(guān)系,但現(xiàn)在我們關(guān)注的是手機用戶,因為在這里這種方法的應(yīng)用范圍最廣。

假定電信運營商有一個價值相對較低的用戶。這名用戶只有基本的通話需求,不會為運營商

帶來任何增值收入。事實也是,不能創(chuàng)建利潤的客戶就是沒有價值的。運營商以往的作法是,

只依據(jù)他或她的個人賬戶來對其進行評價。以前假如這名客戶打電話投訴或者威逼要更換運

營商,公司可能不會挽留他,因為它們認(rèn)為這名客戶并不值得挽留。

運用社交網(wǎng)絡(luò)分析技術(shù),雖然我們的客戶通話賬單看似價值不高,但我們可以識別出客戶曾

經(jīng)和某些人通過電話,而這些人是有著廣泛交際圈的重量級人物。換句話說,客戶聯(lián)系對運

營商而言是特別有價值的信息。探討表明,?旦某位成員離開通話的圈子,其他成員很可能

會跟著離開,更多的成員起先離開,就像傳染病一樣。很快,圈內(nèi)成員起先雪崩般地離開,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論