大數(shù)據(jù)導論(第2版) 課件 項目4 大數(shù)據(jù)方法的驅(qū)動力_第1頁
大數(shù)據(jù)導論(第2版) 課件 項目4 大數(shù)據(jù)方法的驅(qū)動力_第2頁
大數(shù)據(jù)導論(第2版) 課件 項目4 大數(shù)據(jù)方法的驅(qū)動力_第3頁
大數(shù)據(jù)導論(第2版) 課件 項目4 大數(shù)據(jù)方法的驅(qū)動力_第4頁
大數(shù)據(jù)導論(第2版) 課件 項目4 大數(shù)據(jù)方法的驅(qū)動力_第5頁
已閱讀5頁,還剩157頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

項目4大數(shù)據(jù)方法的驅(qū)動力目錄1任務4.1:理解采用大數(shù)據(jù)的商業(yè)動機2任務4.2:理解大數(shù)據(jù)規(guī)劃考慮3任務4.3:熟悉大數(shù)據(jù)商務智能【導讀案例】大數(shù)據(jù)企業(yè)的縮影——谷歌討論:(1)谷歌是一家國際化的重要的大數(shù)據(jù)企業(yè)。請通過網(wǎng)絡搜索,了解谷歌企業(yè)開展的重要技術和業(yè)務,并請扼要記錄:(2)在谷歌琳瑯滿目的先進技術中,你特別感興趣的有哪些?(3)除了谷歌,你還知道哪些重量級的國際化大數(shù)據(jù)企業(yè)?(4)請簡單記述你所知道的上一周內(nèi)發(fā)生的國

際、國內(nèi)或者身邊的大事。【任務描述】(1)深刻理解2012年大數(shù)據(jù)跨界年度的內(nèi)涵;(2)熟悉世界級大數(shù)據(jù)企業(yè)谷歌、亞馬遜、領英等的大數(shù)據(jù)行動;(3)理解采用大數(shù)據(jù)的商業(yè)動機與驅(qū)動力?!局R準備】將數(shù)據(jù)變成競爭優(yōu)勢在當今世界的許多組織中,業(yè)務可以像其所采用的技術那樣進行“架構”。這種觀念上的轉變體現(xiàn)在企業(yè)架構領域的不斷擴大,即過去只與技術架構緊密結合,而現(xiàn)在還包含業(yè)務架構。盡管人們還只是從一個機械的視角來審視一批批的業(yè)務,即一條條指令由行政人員發(fā)布給主管,再傳遞給前線的員工們,但是,基于鏈接與評測的反饋循環(huán)機制為管理決策的有效性提供了保障?!局R準備】將數(shù)據(jù)變成競爭優(yōu)勢這種從決策到實施再到對結果的測評的循環(huán)使得企業(yè)有機會不斷優(yōu)化其運營。事實上這種機械化的管理觀點正在被一種更加有機的管理觀點所取代,這種新的管理觀點能夠?qū)?shù)據(jù)轉化為知識與見解來驅(qū)動商業(yè)行為。但是這種新觀點有一個問題在于,傳統(tǒng)商業(yè)幾乎僅僅是由其信息系統(tǒng)的內(nèi)部數(shù)據(jù)所驅(qū)動的,但如今的公司想要在更像生態(tài)系統(tǒng)的市場中實現(xiàn)其業(yè)務模型,僅僅靠內(nèi)部數(shù)據(jù)是不夠的。因此,商業(yè)組織需要通過吸收外來數(shù)據(jù)來直接感知那些影響其收益能力的因素。這種對外來數(shù)據(jù)的使用導致了“大數(shù)據(jù)”數(shù)據(jù)集的誕生?!局R準備】將數(shù)據(jù)變成競爭優(yōu)勢在這一節(jié)中,我們來了解著名互聯(lián)網(wǎng)企業(yè)的大數(shù)據(jù)行動,探索采用大數(shù)據(jù)解決方案和技術背后的商業(yè)動機和驅(qū)動力。大數(shù)據(jù)被廣泛采用是以下幾種力量共同作用的結果:市場動態(tài)、對業(yè)務架構(BA)的理解和形式表達、對公司提供價值的能力與其業(yè)務流程管理(BPM)緊密相連的認知,此外還有信息與通信技術(ICT)方面的創(chuàng)新以及萬物互聯(lián)(IoE)的概念等。大數(shù)據(jù)的跨界年度4.1.14.1.1大數(shù)據(jù)的跨界年度《紐約時報》把2012年稱為“大數(shù)據(jù)的跨界年度”。大數(shù)據(jù)之所以會在2012年進入主流大眾的視野,緣于三種趨勢的合力。第一,許多高端消費公司加大了對大數(shù)據(jù)的應用。社交網(wǎng)絡巨擘臉書使用大數(shù)據(jù)來追蹤用戶。通過識別你熟悉的其他人,臉書可以給出好友推薦建議。用戶的好友數(shù)目越多,他與臉書的黏度就越高。好友越多同時也就意味著用戶分享的照片越多、發(fā)布的狀態(tài)更新越頻繁、玩的游戲也越多樣化。4.1.1大數(shù)據(jù)的跨界年度商業(yè)社交網(wǎng)站領英則使用大數(shù)據(jù)為求職者和招聘單位之間建立關聯(lián)。有了領英,獵頭公司只需要一個簡單搜索,就可以找到潛在雇員并與他們進行聯(lián)系。同樣,求職者也可以通過聯(lián)系網(wǎng)站上的其他人,將自己推銷給潛在的負責招聘的經(jīng)理。領英的首席執(zhí)行官杰夫?韋納曾談到該網(wǎng)站的未來發(fā)展及其經(jīng)濟圖表——一個能實時識別“經(jīng)濟機會趨勢”的全球經(jīng)濟數(shù)字圖表。實現(xiàn)該圖表及其預測能力時所面臨的挑戰(zhàn)就是一個大數(shù)據(jù)問題。4.1.1大數(shù)據(jù)的跨界年度第二,臉書與領英兩家公司都是在2012年上市的。臉書在納斯達克上市,領英在紐約證券交易所上市。從表面上來看,谷歌和這兩家公司都是消費品公司,而實質(zhì)上,它們是名副其實的大數(shù)據(jù)企業(yè)。除了這兩家公司以外,Splunk公司(一家為大中型企業(yè)提供運營智能的大數(shù)據(jù)企業(yè))也在2012年完成了上市。這些企業(yè)

的公開上市使華爾街對大數(shù)據(jù)業(yè)務的興趣

日漸濃厚。

圖4-2Splunk公司4.1.1大數(shù)據(jù)的跨界年度因此,硅谷的風險投資家們開始前赴后繼地為大數(shù)據(jù)企業(yè)提供資金,硅谷甚至有望在未來幾年取代華爾街。作為臉書的早期投資者,AccelPartners投資機構在2011年末宣布為大數(shù)據(jù)提供1億美元的投資,2012年年初,AccelPartners支出了第一筆投資。著名的風險投資公司安德森?霍洛維茨、Greylock公司也針對這一領域進行了大量的投資。4.1.1大數(shù)據(jù)的跨界年度第三,商業(yè)用戶,例如亞馬遜、臉書、領英和其他以數(shù)據(jù)為核心的消費產(chǎn)品,也開始期待以一種同樣便捷的方式來獲得大數(shù)據(jù)的使用體驗。既然互聯(lián)網(wǎng)零售商亞馬遜可以為用戶推薦一些閱讀書目、電影和產(chǎn)品,為什么這些產(chǎn)品所在的企業(yè)卻做不到呢?比如,為什么汽車租賃公司不能明智地決定將哪一輛車提供給租車人呢?畢竟,該公司擁有客戶的租車歷史和現(xiàn)有可用車輛庫存記錄。隨著新技術的出現(xiàn),公司不僅能夠了解到特定市場的公開信息,還能了解到有關會議、重大事項及其他可能會影響市場需求的信息。通過將內(nèi)部供應鏈與外部市場數(shù)據(jù)相結合,公司可以更加精確地預測出可用的車輛類型和可用時間。4.1.1大數(shù)據(jù)的跨界年度類似地,通過將這些內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)相結合,零售商每天都可以利用這種混合式數(shù)據(jù)確定產(chǎn)品價格和擺放位置。通過考慮從產(chǎn)品供應到消費者的購物習慣這一系列事件的數(shù)據(jù)(包括哪種產(chǎn)品賣得比較好),零售商就可以提升消費者的平均購買量,從而獲得更高的利潤。谷歌的大數(shù)據(jù)行動4.1.24.1.2谷歌的大數(shù)據(jù)行動谷歌(Google)的規(guī)模使其得以實施一系列大數(shù)據(jù)方法,而這些方法是大多數(shù)企業(yè)根本不曾具備的。谷歌的優(yōu)勢之一是擁有一支軟件工程師隊伍,他們能為企業(yè)提供前所未有的大數(shù)據(jù)技術。多年來,谷歌還不得不處理大量的非結構化數(shù)據(jù),例如網(wǎng)頁、圖片等,它不同于傳統(tǒng)的結構化數(shù)據(jù)。谷歌的另一個優(yōu)勢是它的基礎設施(見圖4-3)。就谷歌搜索引擎本身的設計而言,數(shù)不勝數(shù)的服務器(據(jù)估計總數(shù)超過100萬個)保證了谷歌搜索引擎之間的無縫連接。如果出現(xiàn)更多的處理或存儲信息需求,抑或某臺服務器崩潰時,谷歌的工程師們只需添加服務器就能保證搜索引擎的正常運行。4.1.2谷歌的大數(shù)據(jù)行動圖4-3谷歌的機房4.1.2谷歌的大數(shù)據(jù)行動谷歌在設計軟件的時候一直沒有忘記自己所擁有的強大的基礎設施。MapReduce和GoogleFileSystem就是兩個典型的例子?!哆B線》雜志在2012年暑期的報道稱,這兩種技術“重塑了谷歌建立搜索索引的方式”。許多公司現(xiàn)在都開始接受基于MapReduce和GoogleFileSystem開發(fā)的一個開源衍生產(chǎn)品Hadoop,Hadoop能夠在多臺計算機上實施分布式大數(shù)據(jù)處理。4.1.2谷歌的大數(shù)據(jù)行動當其他公司剛剛開始利用Hadoop開源代碼時,谷歌已經(jīng)開始將重點轉移到其他新技術上了,這在同行中占據(jù)了絕對優(yōu)勢。這些新技術包括內(nèi)容索引系統(tǒng)Caffeine、映射關系系統(tǒng)Pregel以及量化數(shù)據(jù)查詢系統(tǒng)Dremel。如今,谷歌正在進一步開放數(shù)據(jù)處理領域,并將其和更多第三方共享,例如它的BigQuery服務。該項服務允許使用者對超大量數(shù)據(jù)集進行交互式分析,其中“超大量”意味著數(shù)十億行的數(shù)據(jù),BigQuery就是基于云的數(shù)據(jù)分析需求。此前,許多第三方企業(yè)只能通過購買昂貴的安裝軟件來建立自己的基礎設施進行大數(shù)據(jù)分析。隨著BigQuery這一類服務的推出,企業(yè)可以對大型數(shù)據(jù)集進行分析,而無須巨大的前期投資。4.1.2谷歌的大數(shù)據(jù)行動除此以外,谷歌還擁有大量的機器數(shù)據(jù),這些數(shù)據(jù)是人們在谷歌網(wǎng)站進行搜索及經(jīng)過其網(wǎng)絡時所產(chǎn)生的。每當用戶輸入一個搜索請求時,谷歌就會知道他在尋找什么,所有人類在互聯(lián)網(wǎng)上的行為都會留下“足跡”,而谷歌具備絕佳的技術對這些“足跡”進行捕捉和分析。不僅如此,除搜索之外,谷歌還有許多獲取數(shù)據(jù)的途徑。企業(yè)會安裝“谷歌分析”(GoogleAnalytics)之類的產(chǎn)品來追蹤訪問者在其站點的“足跡”,而谷歌也可獲得這些數(shù)據(jù)。利用“谷歌廣告聯(lián)盟”(GoogleAdsense),網(wǎng)站還會將來自谷歌廣告客戶網(wǎng)的廣告展示在其各自的站點上,因此,谷歌不僅可以洞察自己網(wǎng)站上廣告的展示效果,對其他廣告發(fā)布站點的展示效果也一覽無余。4.1.2谷歌的大數(shù)據(jù)行動將所有這些數(shù)據(jù)集合在一起,我們可以看到:企業(yè)不僅可以從最好的技術中獲益,同樣還可以從最好的信息中獲益。在信息技術方面,許多企業(yè)可謂耗資巨大,然而谷歌所進行的龐大投入和所獲得的巨大成功,卻罕有企業(yè)能望其項背。亞馬遜的大數(shù)據(jù)行動4.1.34.1.3亞馬遜的大數(shù)據(jù)行動互聯(lián)網(wǎng)零售商亞馬遜(Amazon,見圖4-4)同時也是一個推行大數(shù)據(jù)的大型技術公司,它已經(jīng)采取一些積極的舉措,很可能成為谷歌數(shù)據(jù)驅(qū)動領域的最大競爭伙伴。截至2015年亞馬遜的營收就超過1000億美元,超過了沃爾瑪,成為世界最大的零售商。如同谷歌一樣,亞馬遜也要處理海量數(shù)據(jù),只不過它處理的數(shù)據(jù)帶有更強的電商傾向。每次,當消費者們在亞馬遜網(wǎng)站上搜索想看的電視節(jié)目或想買的產(chǎn)品時,亞馬遜就會增加對該消費者的了解?;谙M者的搜索行為和產(chǎn)品購買行為,亞馬遜可以知道接下來應該為消費者推薦什么產(chǎn)品。4.1.3亞馬遜的大數(shù)據(jù)行動圖4-4互聯(lián)網(wǎng)零售商——亞馬遜4.1.3亞馬遜的大數(shù)據(jù)行動亞馬遜的聰明之處還遠不止于此。它會在網(wǎng)站上持續(xù)不斷地測試新的設計方案,從而找出轉化率最高的方案。你認為亞馬遜網(wǎng)站上的某段頁面文字只是碰巧出現(xiàn)的嗎?其實,亞馬遜整個網(wǎng)站的布局、字體大小、顏色、按鈕以及其他所有設計,都是在經(jīng)過多次審慎測試后的最優(yōu)結果。4.1.3亞馬遜的大數(shù)據(jù)行動以嘗試設計新按鈕為例,這種測試的思路如下:首先隨機選擇少量(例如5%)的用戶,讓他們看到新的按鈕設計,如果這部分人的點擊率高于對照用戶,就逐漸提高新按鈕覆蓋的用戶比例,并測試其表現(xiàn)的穩(wěn)定性;在相當比例用戶中,具有穩(wěn)定性且更佳表現(xiàn)的新設計將會替代原有的設計。對于亞馬遜這樣的大型企業(yè),即便是千分之一的用戶,數(shù)量也非??捎^。如果他們拿出10%的流量用作測試,而每個基礎測試桶只需要千分之一的用戶量,就意味著亞馬遜時時刻刻都可以測試上百個新算法和新設計的效果。阿里巴巴集團的算法部門也使用類似的思路和技術進行效果測試。4.1.3亞馬遜的大數(shù)據(jù)行動數(shù)據(jù)驅(qū)動的方法并不僅限于以上領域。根據(jù)一位前亞馬遜員工的說法,亞馬遜的企業(yè)文化就是冷冰冰的數(shù)據(jù)驅(qū)動文化。數(shù)據(jù)會告訴你什么是有效的、什么是無效的,新的商業(yè)投資項目必須要有數(shù)據(jù)支撐。對數(shù)據(jù)的長期關注使亞馬遜能夠以更低的價格提供更好的服務。消費者往往會直接去亞馬遜網(wǎng)站搜索商品并進行購買而繞過了谷歌之類的搜索引擎。爭奪消費者控制權的努力還在持續(xù),如今蘋果、亞馬遜、谷歌以及微軟這4家公認的巨頭不僅在互聯(lián)網(wǎng)上進行競爭,還將其這樣的競爭延伸到了移動領域。4.1.3亞馬遜的大數(shù)據(jù)行動隨著消費者把越來越多的時間花費在手機和平板電腦等移動設備上,他們坐在計算機前的時間變得越來越少了,因此,那些能成功地讓消費者購買其移動設備的企業(yè),將會在銷售和獲取消費者行為信息方面具備更大的優(yōu)勢。企業(yè)掌握的消費者群體和個體信息越多,它就越能更好地制定內(nèi)容、廣告和產(chǎn)品。4.1.3亞馬遜的大數(shù)據(jù)行動令人難以置信的是,從支撐新興技術企業(yè)的基礎設施到消費內(nèi)容的移動設備,亞馬遜的觸角已伸到更為廣闊的領域。亞馬遜在幾年前就預見了將作為電子商務平臺基礎結構的服務器和存儲基礎設施開放給其他人的價值?!皝嗰R遜網(wǎng)絡服務”(AmazonWebService,AWS)是亞馬遜公司知名的面向公眾的云服務提供者,能為新興企業(yè)和老牌公司提供可擴展的運算資源。有分析者估計AWS每年的銷售額超過15億美元。4.1.3亞馬遜的大數(shù)據(jù)行動這種計算資源為企業(yè)開展大數(shù)據(jù)行動鋪平了道路。當然,企業(yè)依然可以繼續(xù)投資建立以私有云為形式的自有基礎設施,而且很多企業(yè)還會這樣做。但是如果企業(yè)想盡快利用額外的、可擴展的運算資源,它們還可以方便、快捷地在亞馬遜的公共云上使用多個服務器。如今,亞馬遜AWS帶來的結果是,大數(shù)據(jù)分析不再需要企業(yè)在IT上投入固定成本。如今,獲取數(shù)據(jù)、分析數(shù)據(jù)都能夠在云端簡單、迅速地完成。換句話說,如今,企業(yè)有能力獲取和分析大規(guī)模的數(shù)據(jù)——而在過去,它們則會因為無法存儲而不得不拋棄它。將信息變成一種競爭優(yōu)勢4.1.44.1.4將信息變成一種競爭優(yōu)勢數(shù)十年來,人們對所謂的“信息技術”的關注一直偏重于其中的“技術”部分,首席信息官(CIO)的職責就是購買和管理服務器、存儲設備和網(wǎng)絡。而如今,信息以及對信息的分析、存儲和預測的能力,正成為一種競爭優(yōu)勢。圖4-5大數(shù)據(jù)將“信息技術”的焦點從“技術”轉變?yōu)椤靶畔ⅰ?.1.4將信息變成一種競爭優(yōu)勢信息技術剛剛興起的時候,較早應用信息技術的企業(yè)能夠更快地發(fā)展,超越他人。微軟在20世紀90年代就樹立并鞏固了它的地位,這不僅得益于它開發(fā)了世界上應用最為廣泛的操作系統(tǒng),還在于當時它在公司內(nèi)部將電子郵件作為標準的溝通機制。事實上,在許多企業(yè)仍在猶豫是否采用電子郵件的時候,電子郵件已經(jīng)成為微軟討論招聘、產(chǎn)品決策、市場戰(zhàn)略等事務的標準溝通機制。雖然群發(fā)電子郵件的交流在如今已是司空見慣,但在當時,這樣的舉措讓微軟較之其他未采用電子郵件的公司具有更多的速度和協(xié)作優(yōu)勢。4.1.4將信息變成一種競爭優(yōu)勢接受大數(shù)據(jù)并在不同的組織之間民主化地使用數(shù)據(jù),將會給企業(yè)帶來與之相似的優(yōu)勢。諸如谷歌和臉書之類的企業(yè)已經(jīng)從“數(shù)據(jù)民主”中獲益。通過將內(nèi)部數(shù)據(jù)分析平臺開放給所有跟自己公司相關的分析師、管理者和執(zhí)行者,谷歌、臉書以及其他一些公司已經(jīng)讓組織中的所有成員都能提出跟商業(yè)有關的數(shù)據(jù)問題、獲得答案并迅速行動。正如臉書的前任大數(shù)據(jù)領導人阿施什?圖蘇爾所言,新技術已經(jīng)將我們的話題從“儲存什么數(shù)據(jù)”轉化到“我們怎樣處理更多的數(shù)據(jù)”這一話題上了。4.1.4將信息變成一種競爭優(yōu)勢以臉書為例,它將大數(shù)據(jù)推廣成為內(nèi)部的服務,這意味著該服務不僅是為工程師設計的,也是為終端用戶,即生產(chǎn)線管理人員設計的,他們需要運用“查詢”來找出有效的方案。因此,管理者們不再需要花費幾天或是幾周的時間,來找出網(wǎng)站的哪些改變最有效,或者哪些廣告方式的效果最好。他們可以使用內(nèi)部的大數(shù)據(jù)服務,而這些服務本身就是為了滿足他們的需求而設計的,這使得數(shù)據(jù)分析的結果很容易在員工之間共享。4.1.4將信息變成一種競爭優(yōu)勢我們正處在信息技術的時代,這些企業(yè)能夠更快地處理數(shù)據(jù),而公共數(shù)據(jù)資源和內(nèi)部數(shù)據(jù)資源一體化將帶來獨特的洞見,使他們能夠遠遠超越競爭對手。正如“大數(shù)據(jù)創(chuàng)新空間曲線”的創(chuàng)始人和首席技術官安德魯?羅杰斯所言,“你分析數(shù)據(jù)的速度越快,它的預測價值就越大”。企業(yè)如今正在漸漸遠離批量處理數(shù)據(jù)的方式(即先存儲數(shù)據(jù),之后再慢慢進行分析處理)而轉向?qū)崟r分析數(shù)據(jù)來獲取競爭優(yōu)勢。對于高管們而言,好消息是:來自于大數(shù)據(jù)的信息優(yōu)勢不再只屬于谷歌、亞馬遜之類的大企業(yè)。Hadoop之類的開源技術讓其他企業(yè)可以擁有同樣的優(yōu)勢。無論是老牌財富100強企業(yè)還是新興初創(chuàng)公司,都能夠以合理的價格利用大數(shù)據(jù)來獲得競爭優(yōu)勢。4.1.4將信息變成一種競爭優(yōu)勢1.數(shù)據(jù)價格下降,數(shù)據(jù)需求上升與以往相比,大數(shù)據(jù)帶來的顛覆不僅是可以獲取和分析更多數(shù)據(jù)的能力,更重要的是,獲取和分析等量數(shù)據(jù)的價格也正在顯著下降。但是價格“蒸蒸日下”,需求卻蒸蒸日上。這種關系正如所謂的“杰文斯悖論”一樣??萍歼M步使儲存和分析數(shù)據(jù)的方式變得更有效率,與此同時,公司也將對此做出更多的數(shù)據(jù)分析——這就是為什么大數(shù)據(jù)能夠帶來商業(yè)上的顛覆性變化。4.1.4將信息變成一種競爭優(yōu)勢從亞馬遜到谷歌,從IBM到惠普和微軟,大量的大型技術公司紛紛投身于大數(shù)據(jù);而基于大數(shù)據(jù)解決方案,更多初創(chuàng)型企業(yè)如雨后春筍般涌現(xiàn),提供基于云服務和開源的大數(shù)據(jù)解決方案。與此同時,小公司則以垂直行業(yè)的關鍵應用為重。有些產(chǎn)品可以優(yōu)化銷售效率,而有些產(chǎn)品則通過將不同渠道的營銷業(yè)績與實際的產(chǎn)品使用數(shù)據(jù)相聯(lián)系,來為未來營銷活動提供建議。這些大數(shù)據(jù)應用程序意味著小公司不必在內(nèi)部開發(fā)或配備所有大數(shù)據(jù)技術;在大多數(shù)情況下,它們可以利用基于云端的服務來解決數(shù)據(jù)分析需求。4.1.4將信息變成一種競爭優(yōu)勢2.大數(shù)據(jù)應用程序的興起大數(shù)據(jù)應用程序在大數(shù)據(jù)空間掀起了又一輪波浪。投資者相繼將大量資金投入到現(xiàn)有的基礎設施中,又為Hadoop軟件的商業(yè)供應商Cloudera等提供了投資。與此同時,企業(yè)并沒有停留在大數(shù)據(jù)基礎設施上,而是將重點轉向了大數(shù)據(jù)的應用。4.1.4將信息變成一種競爭優(yōu)勢過去,企業(yè)必須利用一種由網(wǎng)絡設備和IT系統(tǒng)中的服務器生成的腳本文件來分析日志文件。這是一種人工處理程序,IT管理員不僅要維護服務器、網(wǎng)絡工作設備和軟件的基礎設施,還要建立自己的腳本工具,從而確定因這些系統(tǒng)所引發(fā)的問題的根源。這些系統(tǒng)會產(chǎn)生海量的數(shù)據(jù);每當用戶登陸或訪問一個文件時,一旦軟件出現(xiàn)警告或顯示錯誤,管理者就需要對這些數(shù)據(jù)進行處理,他們必須弄清楚究竟是怎么一回事。4.1.4將信息變成一種競爭優(yōu)勢有了大數(shù)據(jù)應用程序之后,企業(yè)不再需要自己動手創(chuàng)建工具。他們可以利用預先設置的應用程序從而專注于他們的業(yè)務經(jīng)營。比如,利用Splunk公司的軟件,可以搜索IT日志,并直觀看到有關登陸位置和頻率的統(tǒng)計,進而輕松地找到基礎設施存在的問題。當然,企業(yè)的軟件主要是安裝類軟件,也就是說,它必須安裝在客戶的網(wǎng)站中?;谠贫说拇髷?shù)據(jù)應用程序承諾,它們不會要求企業(yè)安裝任何硬件或軟件。在某些方面,它們可以被認為是軟件即服務(Softwareasaservice,SaaS)后的下一個合乎邏輯的步驟。軟件即服務是通過互聯(lián)網(wǎng)向客戶交付產(chǎn)品的一種新形式,現(xiàn)已經(jīng)發(fā)展得較為完善。4.1.4將信息變成一種競爭優(yōu)勢十幾年前,客戶關系管理(CRM)軟件服務提供商Salesforce首先推出了“無軟件”的概念,這一概念已經(jīng)成為基于云計算的客戶關系管理軟件的事實標準,這種軟件會幫助企業(yè)管理他們的客戶列表和客戶關系。通過軟件運營服務轉化后,軟件可以被隨時隨地地使用,企業(yè)幾乎不需要對軟件進行維護。大數(shù)據(jù)應用程序把著眼點放在這些軟件存儲的數(shù)據(jù)上,從而改變了這些軟件公司的性質(zhì)。換句話說,大數(shù)據(jù)應用程序具備將技術企業(yè)轉化為“有價值的信息企業(yè)”的潛力。4.1.4將信息變成一種競爭優(yōu)勢例如,oPower公司可以改變能量的消耗方式。通過與75家不同的公用事業(yè)企業(yè)合作,該公司可以追蹤約5000萬美國家庭的能源消耗狀況。該公司利用智能電表設備(一種追蹤家庭能源使用的設備)中儲存的數(shù)據(jù),能為消費者提供能源消耗的具體報告。即使能源消耗數(shù)據(jù)出現(xiàn)一個小小的變動,也會對千家萬戶造成很大的影響。就像谷歌可以根據(jù)消費者在互聯(lián)網(wǎng)上的行為追蹤到海量的數(shù)據(jù)一樣,oPower公司也擁有大量的能源使用數(shù)據(jù)。這種數(shù)據(jù)最終會賦予oPower公司以及諸如此類的公司截然不同的洞察力。目前該公司已經(jīng)開始通過提供能源報告來繼續(xù)建立其信息資產(chǎn),這些數(shù)據(jù)資源和分析產(chǎn)品向我們展示了未來大數(shù)據(jù)商業(yè)的雛形。4.1.4將信息變成一種競爭優(yōu)勢大數(shù)據(jù)應用程序不僅僅出現(xiàn)在技術世界里。在技術世界之外,企業(yè)還在不斷研發(fā)更多的數(shù)據(jù)應用程序,這些程序?qū)ξ覀兊娜粘I町a(chǎn)生重大的影響。舉例來說,有些產(chǎn)品會追蹤與健康相關的指標并為我們提出建議,從而改善人類的行為。這類產(chǎn)品還能減少肥胖、提高生活質(zhì)量、降低醫(yī)療成本。4.1.4將信息變成一種競爭優(yōu)勢3.實時響應,大數(shù)據(jù)用戶的新要求過去幾年,大數(shù)據(jù)一直致力于以較低的成本采集、存儲和分析數(shù)據(jù),而未來幾年,數(shù)據(jù)的訪問將會加快。我們來對比一下谷歌搜索結果的響應時間:2010年,谷歌推出了GoogleInstant,該產(chǎn)品可以在你輸入文本的同時就能看到搜索結果。通過引入該功能,一個典型用戶在谷歌給出的結果中找到自己所需要頁面的時間縮短為以前的1/5~l/7。當這一程字剛剛被引進時,人們還在懷疑是否能夠接受它。如今,短短幾年后,人們卻難以想象要是沒有這種程序生活該怎么繼續(xù)下去。4.1.4將信息變成一種競爭優(yōu)勢數(shù)據(jù)分析師、經(jīng)理及行政人員都希望能像谷歌一樣用迅捷的洞察力來了解他們的業(yè)務。隨著大數(shù)據(jù)用戶對便捷性提出的要求越來越高,僅僅通過采用大數(shù)據(jù)技術已不能滿足他們的需求。持續(xù)的競爭優(yōu)勢并非來自于大數(shù)據(jù)本身,而是更快的洞察信息的能力。GoogleInstant這樣的程序就向我們演示了“立即獲得結果”的強大之處。4.1.4將信息變成一種競爭優(yōu)勢4.企業(yè)構建大數(shù)據(jù)戰(zhàn)略據(jù)IBM稱:“我們每天都在創(chuàng)造大量的數(shù)據(jù),大約是2.5×10l8個字節(jié)——僅在過去兩年間創(chuàng)造的數(shù)據(jù)就占世界數(shù)據(jù)總量的90%?!睋?jù)福雷斯特產(chǎn)業(yè)分析研究公司估計,企業(yè)數(shù)據(jù)的總量每年以94%的增長率飆升。在這樣的高速增長之下,每個企業(yè)都需要一個大數(shù)據(jù)路線圖,至少,企業(yè)應為獲取數(shù)據(jù)制訂一種戰(zhàn)略,獲取范圍應從內(nèi)部計算機系統(tǒng)的常規(guī)機器日志一直到線上的用戶交互記錄。即使企業(yè)當時并不知道這些數(shù)據(jù)有什么用,他們也要這樣做,或許隨后他們會突然發(fā)現(xiàn)這些數(shù)據(jù)的作用。正如羅杰斯所言,“數(shù)據(jù)所創(chuàng)造的價值遠遠高于最初的預期——千萬不要隨便將它們拋棄”。4.1.4將信息變成一種競爭優(yōu)勢企業(yè)還需要制訂一個計劃來應對數(shù)據(jù)的指數(shù)型增長。照片、即時信息以及電子郵件的數(shù)量非常龐大,而由手機、GPS及其他設備構成的“傳感器”所釋放出的數(shù)據(jù)量甚至更大。在理想情況下,企業(yè)應讓數(shù)據(jù)分析貫穿于整個組織,并盡可能地做到實時分析。通過觀察谷歌、亞馬遜、臉書和其他科技主導企業(yè),你可以看到大數(shù)據(jù)之下的種種機會。管理者需要做的就是往自己所在的組織中注入大數(shù)據(jù)戰(zhàn)略。4.1.4將信息變成一種競爭優(yōu)勢成功運用大數(shù)據(jù)的企業(yè)給大數(shù)據(jù)世界添加了一個更為重要的因素:大數(shù)據(jù)的所有者。大數(shù)據(jù)的所有者是指首席數(shù)據(jù)官(CDO)或主管數(shù)據(jù)價值的企業(yè)高層。如果你不了解數(shù)據(jù)意味著什么,世界上所有的數(shù)據(jù)對你來說將毫無價值可言。擁有大數(shù)據(jù)所有者不僅能幫助企業(yè)進行正確的策略定位,還可以引導企業(yè)獲取所需的洞察力。谷歌和亞馬遜這樣的企業(yè)應用大數(shù)據(jù)進行決策已有多年,它們在數(shù)據(jù)處理上已經(jīng)取得了不少成果。而現(xiàn)在,你也可以擁有同樣的能力。市場動態(tài)4.1.54.1.5市場動態(tài)全球經(jīng)濟因為眾多因素而處于眾多不確定的時期。人們普遍相信世界上主要發(fā)達國家的經(jīng)濟越來越相互依存緊密糾纏在一起,換句話來說,它們由眾多經(jīng)濟系統(tǒng)組成了一個更大的系統(tǒng)。同樣,全球的公司都在改變它們關于自我認知和獨立性的看法,因為它們意識到自己同樣也由各種復雜的產(chǎn)品和業(yè)務網(wǎng)緊緊地聯(lián)結在一起。4.1.5市場動態(tài)出于這個原因,公司需要擴大其商業(yè)智能活動的規(guī)模,且不僅僅局限于對公司信息系統(tǒng)所提供的內(nèi)部信息的反思。它們需要開放胸懷去迎接外部數(shù)據(jù)源,并由此來感知市場以及完成自我定位。對于一家公司來說,認識到引進外部數(shù)據(jù)能為其內(nèi)部數(shù)據(jù)帶來豐富的信息,可以使得它更輕易地從總結的層面,轉變?yōu)樯钊攵床斓膶用?,從而提升分析結果的含金量。一旦有了合適的、能支持復雜的模擬性能的工具,公司就能得出富于前瞻性的結果。假若這樣,這種工具不僅搭起了知識與智慧間的橋梁,同樣也提供了具有建議性的分析結果,而這便是大數(shù)據(jù)的力量――能極大豐富一個公司的視野,遠超其僅僅依賴于內(nèi)省而得到的視角。從當初僅能通過只言片語推斷市場情緒相關的信息,到能真真切切感知到市場本身。4.1.5市場動態(tài)托馬斯·達文波特及勞倫斯·普魯薩克在他們的書籍《工作知識》中提出了廣為接受的數(shù)據(jù)、信息及知識的有效定義。根據(jù)達文波特和普魯薩克所說,“數(shù)據(jù)是事件的一系列離散的、客觀的事實”。從商業(yè)方面來講,這些事件是發(fā)生在一個組織的業(yè)務流程和信息系統(tǒng)中的――它們代表了與商業(yè)實體相聯(lián)系的工作的產(chǎn)生、更改以及完成。比如說,訂單、貨運單、通知單以及客戶地址的更新。這些事件,是現(xiàn)實世界中的活動在公司信息系統(tǒng)的關系型數(shù)據(jù)庫中的反映。達文波特和普魯薩克進一步將信息定義為“有意義的數(shù)據(jù)”。被置于語境中的數(shù)據(jù)能夠起到交流的作用,它傳遞了信'息并且提醒了接收者――不管是人類還是系統(tǒng)。信息經(jīng)由知識生成的經(jīng)驗及洞察力而豐富。4.1.5市場動態(tài)作者陳述到“知識是一種有組織的經(jīng)驗、價值觀、相關信息及洞察力的動態(tài)組合,該組合的框架可以不斷地評價和吸收新的經(jīng)驗和信息”。這種從后知后覺到有先見之明的轉變可以通過圖4-6所示的DIKW(數(shù)據(jù)、信息、知識、智慧)金字塔來進行理解。注意圖中,“智慧”作為三角形的頂端,但是它的存在并不是普遍認為的由ICT(Information,Communication,Technology,信息、通信和技術)系統(tǒng)產(chǎn)生的。相反,“知識”工作者們提供了必要的洞察力和經(jīng)驗來為“知識”搭建起一個框架,從而“知識”匯集而形成“智慧”。在商業(yè)環(huán)境內(nèi),技術是用來支持“知識”的管理的,員工也有責任在工作中運用他們的競爭力和智慧,并落實到行動中。4.1.5市場動態(tài)圖4-6DIKW金字塔展示了數(shù)據(jù)是如何通過上下文被豐富,從而創(chuàng)造信息,有意義的信息足以創(chuàng)造知識,而知識集結起來產(chǎn)生智慧業(yè)務架構4.1.64.1.6業(yè)務架構人們已經(jīng)漸漸意識到了太多的公司企業(yè)架構僅僅是沒有遠見地復制其技術架構。為了要在IT高地中占有一席之地,業(yè)務架構已經(jīng)成為與技術架構互補的條件。未來的目標是企業(yè)架構會綜合業(yè)務架構與技術架構而全盤考慮。業(yè)務架構提供了一種具體地表達業(yè)務設計的方法,業(yè)務架構會幫助一個組織將其戰(zhàn)略遠景與底層執(zhí)行相統(tǒng)一,不管是技術還是人力資源。因此,業(yè)務架構包括了從抽象概念到具體概念的聯(lián)結,這里的抽象概念有業(yè)務目標、前景、策略等,具體概念有業(yè)務服務、組織架構、關鍵績效指標和應用服務等。4.1.6業(yè)務架構這些聯(lián)結作用是十分重要的,因為它們?yōu)槿绾螌I(yè)務與其相關的信息技術聯(lián)合起來提供了指導。一個公認的觀點是:公司運作如同一個分層的系統(tǒng):頂層由首席執(zhí)行者及咨詢團隊所組成;中間層由戰(zhàn)術層與管理層來掌舵,使公司的具體運行不與其戰(zhàn)略要求相悖;底層是操作層,在此執(zhí)行業(yè)務的關鍵環(huán)節(jié)并向顧客提供價值。這三層均有各自的獨立性,但是每一層的目標都受到上一層的影響,并經(jīng)常直接由上一層所決定,換句話說,是一種自上而下的結構。4.1.6業(yè)務架構從旁觀的角度來看,信息卻是通過大量衡量尺度的聚集自下而上進行流動的。監(jiān)控著操作層的業(yè)務活動產(chǎn)生了對業(yè)務和流程都適用的績效指標(PI)與尺度。它們合起來形成了戰(zhàn)術層所需要使用的關鍵績效指標(KPI)。然而這些關鍵績效指標又會在決策層與關鍵成功因素(CSF)結合,用來幫助衡量為了實現(xiàn)戰(zhàn)略目標所做出的成果。4.1.6業(yè)務架構如圖4-7所示,大數(shù)據(jù)在公司組織架構的每一層都與業(yè)務架構有所聯(lián)系。大數(shù)據(jù)能夠提高價值,因為它通過外部視角的集成提供了更多的相關信息,可以對數(shù)據(jù)轉化為信息起到幫助作用,同時也能提供從信息中提煉知識的方法。比如說,在操作層,大量的衡量尺度聚集,但那僅僅反映出在這項業(yè)務里發(fā)生了什么。本質(zhì)上,我們是通過商業(yè)概念以及相關信息將數(shù)據(jù)轉化,從而獲得信息的。而這些信息會被管理層使用,通過職員績效的角度來回答關于業(yè)務是如何展開的問題,換句話說,給予這些信息以意義。這些信息可能會被得到補充,用來解釋為何業(yè)務處于如今這個水平。當有了這些知識后,決策層就能夠有更深入的洞察力,知道為了糾正或提高業(yè)績需要改變或采用哪些策略。4.1.6業(yè)務架構圖4-7DIKW金字塔闡述了戰(zhàn)略層、戰(zhàn)術層和操作層之間的分工合作4.1.6業(yè)務架構正如同每一個分層系統(tǒng)一樣,這些層級的變化速度往往并不一樣。在商業(yè)企業(yè)的例子中,決策層往往是變動最慢的層級,而操作層是變動最快的層級。變化慢的層級為變化快的層級保證了穩(wěn)定性和發(fā)展方向。在傳統(tǒng)的組織架構中,管理層的作用是使得操作層的發(fā)展方向不與決策團隊所制定的戰(zhàn)略目標相違背。因為這種在變動速度方面的差異,可以認為這三個階層分別負責戰(zhàn)略執(zhí)行、業(yè)務執(zhí)行以及流程執(zhí)行。每一個階層都基于不同的尺度與衡量標準,并由不同的可視化結果與匯報展示所表現(xiàn)。比如說,決策層可能會依賴于平衡記分卡,而管理層會使用關鍵績效指標與職工業(yè)績的可視化結果,最后,操作層則是依靠完成業(yè)務流程的可視化結果和狀態(tài)來匯報并展示自己的表現(xiàn)。4.1.6業(yè)務架構如圖4-8所示,這是“知識的解剖”圖表的變體,展示了一個組織應該如何通過一個反饋環(huán)來創(chuàng)建一個良性循環(huán)以實現(xiàn)組織階層之間的聯(lián)結與共鳴。在圖表的右側,決策層會依照管理層戰(zhàn)略、政策以及目標這些限制條件來做決策,以形成判斷。戰(zhàn)術層隨即會將這份信息分級,以產(chǎn)生不同的權重和符合公司方向的措施。這些措施會調(diào)整操作層對于業(yè)務的執(zhí)行。接下來會使內(nèi)部利益相關者和外部的顧客在交付業(yè)務服務時的經(jīng)歷發(fā)生很大的改變。這份改變,或者說結果,應該在即將集成到關鍵績效指標(KPI)中去的績效指標(PI)的數(shù)據(jù)中看見。關鍵績效指標可以與關鍵成功因素聚合,從而使得決策隊伍的人員得知他們的策略是否奏效。隨著時間的發(fā)展,由決策層與管理層在這個循環(huán)中所注人的判斷及措施使業(yè)務服務的開展更為精煉。4.1.6業(yè)務架構圖4-8一個通過反饋循環(huán)而將組織不同層級聯(lián)合起來的高品質(zhì)循環(huán)圈的建立業(yè)務流程管理4.1.74.1.7業(yè)務流程管理隨著業(yè)務流程被執(zhí)行,業(yè)務向顧客以及利益相關者們傳遞價值。一項業(yè)務流程描述了在一個組織里,工作是如何完成的。它描述了所有工作相關的活動以及它們的關系,以及相對應的組織里的執(zhí)行者和相關資源。這些活動之間的關系可能是臨時的,比如活動A在活動B前被執(zhí)行。這些關系同樣也能夠描述活動的執(zhí)行是否是有條件的,而條件往往是基于其他活動或者項目流程之外的事件所產(chǎn)生的結果與約束。4.1.7業(yè)務流程管理業(yè)務流程管理通過采用流程優(yōu)化技術來提升公司的執(zhí)行力。業(yè)務流程管理系統(tǒng)給軟件開發(fā)者們提供了一個模型驅(qū)動的平臺,這個平臺正在成為業(yè)務應用開發(fā)環(huán)境的選擇。一份業(yè)務應用需要在人員和其他的技術主導的資源中進行調(diào)停,執(zhí)行起來符合公司條例,以及保障職員的公平分工。作為一個業(yè)務應用開發(fā)環(huán)境,一項業(yè)務流程的模型要與組織角色以及結構的模型、業(yè)務實體以及它們的關系,還有商業(yè)規(guī)律以及用戶界面相結合。開發(fā)環(huán)境將這些模型全部集成起來以創(chuàng)建一個能夠管理工作流程和工作量的業(yè)務應用。這個業(yè)務應用在一個執(zhí)行環(huán)境里完成,而這個環(huán)境能確保公司條例和安全性,并且為長期的業(yè)務流程提供狀態(tài)管理。不管是單獨的流程,還是全部的流程,他們的狀態(tài)都能經(jīng)受住業(yè)務活動監(jiān)控的質(zhì)詢,并且能夠可視化。4.1.7業(yè)務流程管理當業(yè)務流程管理與智能的業(yè)務流程管理系統(tǒng)相結合以后,流程就能夠以一個目標驅(qū)動的方式來執(zhí)行。目標是與流程碎片之間有聯(lián)系的,而這些流程碎片又是基于對目標的估價而進行動態(tài)選取與配置的。當大數(shù)據(jù)分析結果與基于目標的行為一起運用時,業(yè)務流程的執(zhí)行就能夠變得適應市場與環(huán)境條件。舉一個簡單的例子,一個顧客聯(lián)系流程有著能通過電話、電子郵件、文本信息以及傳統(tǒng)的郵件的方式來聯(lián)系顧客的流程碎片。在最初,選擇何種方式來聯(lián)系顧客是并未經(jīng)過權衡的,選擇哪種方式都是隨機的。然而,幕后一直在進行著以統(tǒng)計顧客回應的分析結果來衡量聯(lián)系方式的有效性。4.1.7業(yè)務流程管理分析結果是與選擇合適的聯(lián)系方式的目標緊密相連的。一旦有明顯的偏好,權重便會朝著有利于達成最好的回應的聯(lián)系方式改變。一份更加充滿細節(jié)的分析能夠?qū)蛻艟垲惍a(chǎn)生影響,將單獨的客戶劃歸到群組里去,而一個衡量的維度就是聯(lián)系方式。在這種情況下,聯(lián)系客戶的精度就能得到提高,這為實現(xiàn)一對一的有目標的市場營銷打開了一扇大門。【作業(yè)】討論:【實訓操作】ETI公司的背景信息討論:目錄1任務4.1:理解采用大數(shù)據(jù)的商業(yè)動機2任務4.2:理解大數(shù)據(jù)規(guī)劃考慮3任務4.3:熟悉大數(shù)據(jù)商務智能【導讀案例】谷歌搜索算法討論:(1)什么是“Google炸彈”?請簡單闡述。(2)你知道還有哪些類似的“Google炸彈”現(xiàn)象嗎?(3)你認為“Google炸彈”現(xiàn)象未來會得到控制還是得到發(fā)展?為什么?(4)請簡單記述你所知道的上一周內(nèi)發(fā)生的國際、國內(nèi)或者身邊的大事?!救蝿彰枋觥浚?)了解信息與通信技術、云計算、物聯(lián)網(wǎng)等知識對大數(shù)據(jù)方法的驅(qū)動力;(2)熟悉數(shù)據(jù)獲取與數(shù)據(jù)來源、隱私與安全等大數(shù)據(jù)規(guī)劃考慮的知識;(3)熟悉大數(shù)據(jù)管理的性能要求與管理需求?!局R準備】大數(shù)據(jù)的規(guī)劃考慮大數(shù)據(jù)項目在本質(zhì)上是戰(zhàn)略性的,并且應該是由業(yè)務驅(qū)動的。采用大數(shù)據(jù)可能具有變革性,但更常見的是具有創(chuàng)新性。變革性活動是一種旨在提高效率和有效性的低風險行為,而對于創(chuàng)新性活動而言,由于其會讓產(chǎn)品、服務和組織的結構從根本上發(fā)生變化,項目的組織者需要在心態(tài)上產(chǎn)生變化。大數(shù)據(jù)應用具有促使這種心態(tài)變化產(chǎn)生的作用。創(chuàng)新性活動需要謹慎的心態(tài):過多的控制往往會扼殺創(chuàng)新的主動性,使結果不那么令人滿意;過少又會讓一個意圖明確的項目變成一個無法產(chǎn)出令人滿意的結果的科學實驗?!局R準備】大數(shù)據(jù)的規(guī)劃考慮鑒于大數(shù)據(jù)本身的性質(zhì)及其分析能力,在項目開始的時候就有許多的問題需要考慮和規(guī)劃。例如,任何新技術的采用都需要在某種程度上符合現(xiàn)有的標準。從數(shù)據(jù)集的獲取到使用,來跟蹤其出處的問題往往會成為組織的一個新要求。數(shù)據(jù)處理的過程中誰的數(shù)據(jù)被操作,誰的身份信息被泄露,這些隱私信息的管理必須提前進行規(guī)劃。大數(shù)據(jù)甚至提供了額外的機會將信息從內(nèi)部環(huán)境遷移到遠程的可變云端環(huán)境中。事實上,以上所有的考慮都需要組織鑒別并建立一套嚴格的管理流程和決策框架,從而保證責任方能夠真正理解大數(shù)據(jù)的性質(zhì)、含義和管理需求。信息與通信技術4.2.14.2.1信息與通信技術隨著信息技術與通信技術的不斷快速發(fā)展,如今,云計算能夠為一份大數(shù)據(jù)解決方案提供三項必不可少的材料:外部數(shù)據(jù)集、可擴展性處理能力和大容量存儲。我們將在后面深入討論“大數(shù)據(jù)在云端”的相關知識。在這一節(jié)中,我們先來考察加快了大數(shù)據(jù)在商業(yè)中應用的一些信息與通信技術。4.2.1信息與通信技術1.數(shù)據(jù)分析與數(shù)字化為了找到新的洞察力,以實施更為高效的行動,使得管理過程能夠具有前瞻性地把控業(yè)務,使得最高管理層能夠更好地制定和達到他們的戰(zhàn)略方案,企業(yè)正在不斷收集、獲取、存儲、管理和處理不斷增加的海量信息。最終,企業(yè)尋找新的方法以獲取競爭優(yōu)勢,因此,對于能夠抓取有意義信息的技術的需求在不斷上升。計算方法、統(tǒng)計技術以及數(shù)據(jù)倉庫已經(jīng)能夠攜手合作,也能分別運用各自獨有的核心技術以完成大數(shù)據(jù)分析。這些領域?qū)嵺`上的成熟催生并促進了當代大數(shù)據(jù)解決方案、環(huán)境和平臺所需求的核心功能。4.2.1信息與通信技術對許多公司來說,數(shù)字媒體已經(jīng)取代了物理媒體成為實際運用的交流與交付機制。數(shù)字產(chǎn)品的應用節(jié)省了時間和成本,數(shù)字產(chǎn)品的分布依賴于早已存在的、遍布各地的互聯(lián)網(wǎng)基礎設施的支持。當用戶通過自身的數(shù)字產(chǎn)品與一項業(yè)務相連接時,便會產(chǎn)生能夠收集輔助信息的機會。比方說,要求一位用戶提供反饋,完成一份表單,或僅僅是提供一個鉤子程序來展示一份相關廣告并追蹤它的點擊率。收集輔助信息對業(yè)務來說十分重要,因為挖掘這個信息能夠?qū)崿F(xiàn)定制化的營銷、自動推薦以及優(yōu)化產(chǎn)品特征的發(fā)展。4.2.1信息與通信技術2.開源技術與商用硬件商用硬件的流行使得大數(shù)據(jù)解決方案可以在不用大量資本投資的情況下在業(yè)務中獲得應用。能夠存儲和處理各式大量信息的技術已經(jīng)變得越來越經(jīng)濟。另外,大數(shù)據(jù)解決方案經(jīng)常在商用硬件上利用開源軟件,以進一步削減成本。商用硬件與開源軟件的結合幾乎終結了大企業(yè)過去由于擁有著大量的預算而對其他規(guī)模較小的競爭者們使用“燒錢”戰(zhàn)略的優(yōu)勢。技術已經(jīng)不再帶來競爭優(yōu)勢,相反,它僅僅只是業(yè)務實施的平臺。從商業(yè)的角度來看,能夠利用開源技術與商用硬件來產(chǎn)生分析結果,并用它進一步優(yōu)化業(yè)務的執(zhí)行流程,才是通往競爭優(yōu)勢的大門。4.2.1信息與通信技術3.社交媒體社交媒體的出現(xiàn)使得顧客們能夠通過公開、公共的媒介,近乎實時地提交自己的反饋。這種轉變使得各大公司在考慮他們戰(zhàn)略規(guī)劃中的服務和產(chǎn)品供給時,加入了顧客反饋的因素。因此,公司將與日俱增的、由顧客交互產(chǎn)生的大量數(shù)據(jù)儲存在他們的客戶關系管理系統(tǒng)(CRM)內(nèi),這些數(shù)據(jù)來自社交媒體網(wǎng)站的顧客評論、抱怨和嘉獎。這些信息成就了大數(shù)據(jù)分析算法,使得它能夠表達用戶的想法,以此來提供更好的服務,增加銷售量,促成目標營銷,甚至是創(chuàng)造新的產(chǎn)品和服務。公司已經(jīng)意識到了品牌形象塑造不再由內(nèi)部營銷活動所全權支配,相反,產(chǎn)品品牌和公司名譽是由公司和它的顧客共同創(chuàng)造?;谶@個原因,各大公司對來自于社交媒體和其他外部信息源的公共信息集越來越感興趣。4.2.1信息與通信技術4.超連通社區(qū)與設備因特網(wǎng)的廣泛覆蓋以及蜂窩與Wi-Fi網(wǎng)絡的迅速普及,使得越來越多的人和他們的設備能夠在虛擬社區(qū)中持續(xù)在線。伴隨著能夠連通網(wǎng)絡的傳感器的普及,物聯(lián)網(wǎng)的基礎架構使得一大批智能聯(lián)網(wǎng)設備成型,這也導致了可用數(shù)據(jù)流的大量增長。其中一些流是公共的,而另外一些則直接通往分析公司。舉例來說,與采礦業(yè)中使用的重型設備有關的基于性能的管理合約能夠激發(fā)預防和預測性維護的最佳性能,其目的是減少計劃之外的故障檢修的需要,且避免由之耗費的停工時間。而這需要對設備產(chǎn)生的傳感器讀數(shù)進行具體分析,來對那些可以通過提前安排維護服務而解決的問題進行早期檢測。萬物互聯(lián)網(wǎng)4.2.24.2.2萬物互聯(lián)網(wǎng)信息與通信科技、市場動態(tài)、業(yè)務架構以及業(yè)務流程管理這些行業(yè)的進步匯聚起來,為如今被稱為萬物互聯(lián)網(wǎng)(IoE,簡稱“物聯(lián)網(wǎng)”)的產(chǎn)生帶來了機遇。物聯(lián)網(wǎng)將由智能聯(lián)網(wǎng)設備提供的服務結合起來并轉化為有意義的、擁有著提供獨特和充滿差別的價值主張能力的業(yè)務流程。物聯(lián)網(wǎng)是創(chuàng)新的平臺,孕育了新產(chǎn)品、新服務和商業(yè)的新利潤源。而大數(shù)據(jù)正是物聯(lián)網(wǎng)的核心部分。運行在開源技術與商用硬件上的超連通社區(qū)與設備,產(chǎn)生了能在可延伸的云計算環(huán)境中進行分析的數(shù)字化數(shù)據(jù)。這些分析的結果能夠產(chǎn)生有前瞻性的見解,例如當前流程會產(chǎn)生多少價值,以及這個流程是否應該提前尋覓機會來進一步地完善自己。4.2.2萬物互聯(lián)網(wǎng)專注于物聯(lián)網(wǎng)的公司能夠提升大數(shù)據(jù)方法來建立或優(yōu)化工作流程并將之作為外包業(yè)務流程提供給第三方。正如在2011年由RogerBurlton所編輯的“業(yè)務流程聲明”中所寫的,一個組織的業(yè)務流程正是為其顧客和其他股東產(chǎn)生價值成果的源頭。結合了對流數(shù)據(jù)和顧客環(huán)境的分析,這種將業(yè)務流程的執(zhí)行與顧客的目標相關聯(lián)的能力將是未來世界哪家公司能脫穎而出的關鍵。4.2.2萬物互聯(lián)網(wǎng)在當今傳統(tǒng)農(nóng)業(yè)設備大行其道的環(huán)境下,一個從物聯(lián)網(wǎng)中受益的例子就是精細農(nóng)業(yè)。當所有設備連接在一起成為一個系統(tǒng)時(如GPS控制牽引車,土壤濕潤與施肥傳感器,按需灌溉、施肥和施藥,以及變量播種等設備全部集合起來),便能在成本最小化的同時最大化土地產(chǎn)出。精細農(nóng)業(yè)提供了挑戰(zhàn)工業(yè)單一耕作農(nóng)場的另一種耕種方法。有了物聯(lián)網(wǎng)的幫助,一些小型農(nóng)場能夠通過提高作物種類和對環(huán)境敏感的實踐來與大農(nóng)場相抗衡。除了擁有智能聯(lián)網(wǎng)的農(nóng)業(yè)設備外,大數(shù)據(jù)分析設備和現(xiàn)場傳感器數(shù)據(jù)可以驅(qū)動一個決策支持系統(tǒng),以引導農(nóng)民充分利用他們的機器達到土地最佳產(chǎn)量。數(shù)據(jù)獲取與數(shù)據(jù)來源4.2.34.2.3數(shù)據(jù)獲取與數(shù)據(jù)來源大數(shù)據(jù)框架并不是完整的一套解決方案,為了讓數(shù)據(jù)分析的結果創(chuàng)造價值,企業(yè)需要數(shù)據(jù)管理和相應的大數(shù)據(jù)管理框架。對于負責實施、定制、填充和使用大數(shù)據(jù)框架的人來說,完善的工作流程和優(yōu)秀的職業(yè)技能是非常必要的。此外,針對大數(shù)據(jù)解決方案的數(shù)據(jù)的質(zhì)量需要進行評估。無論是多好的大數(shù)據(jù)解決方案,過時、無效或是不確定的數(shù)據(jù)都會導致低質(zhì)量的輸入,低質(zhì)量的輸入則會產(chǎn)生低質(zhì)量的結果。大數(shù)據(jù)環(huán)境的持續(xù)周期也需要提前進行計劃。使用者需要定義一個路線圖來確保任何使用環(huán)境的擴展都提前準備好以保持與企業(yè)需求的同步。4.2.3數(shù)據(jù)獲取與數(shù)據(jù)來源由于可以使用開源平臺和商用硬件,大數(shù)據(jù)的獲取本身是十分經(jīng)濟的。但是,也可能會有大量的預算被用于獲取額外的數(shù)據(jù)。商業(yè)性質(zhì)會使這些額外的數(shù)據(jù)變得非常有價值,采用數(shù)據(jù)的數(shù)量越大、種類越多,從這種模式中挖掘出隱藏信息的可能性越大。額外的數(shù)據(jù)包括政府數(shù)據(jù)資源和商用市場數(shù)據(jù)資源。政府提供的資源(如地理數(shù)據(jù))可能是免費的。但是,大多數(shù)商業(yè)相關的數(shù)據(jù)需要購買,同時,為了確保能夠第一時間獲取到數(shù)據(jù)集的更新,我們還需要持續(xù)地付款訂購。4.2.3數(shù)據(jù)獲取與數(shù)據(jù)來源數(shù)據(jù)的來源會涉及數(shù)據(jù)從何而來以及數(shù)據(jù)如何被加工等信息。來源信息能夠幫助使用者確認數(shù)據(jù)的可靠性與質(zhì)量,還能用來進行審計操作。在對大量數(shù)據(jù)進行獲取、聯(lián)合以及實行多重處理的同時,要保存這些數(shù)據(jù)的來源信息是一項復雜的任務。在分析生命周期的不同環(huán)節(jié),數(shù)據(jù)會因為被傳輸、加工和儲存而處于不同的狀態(tài)。這些狀態(tài)與傳輸中的數(shù)據(jù)(data-in-motion)、使用中的數(shù)據(jù)(data-in-use)和儲存的數(shù)據(jù)(data-at-rest)的概念一致。重要的是,無論何時,只要大數(shù)據(jù)改變了自身的狀態(tài),都必須觸發(fā)對數(shù)據(jù)來源信息的獲取,數(shù)據(jù)來源信息將作為元數(shù)據(jù)記錄下來。4.2.3數(shù)據(jù)獲取與數(shù)據(jù)來源在數(shù)據(jù)進入分析環(huán)境時,它的來源信息記錄會被獲取的系譜記錄信息所初始化。最終,獲取來源信息是為了能夠使用源數(shù)據(jù)知識來推理出生成的分析結果,并且推理出哪些步驟或算法被用來處理那些導致結果的數(shù)據(jù)。來源信息對于認識數(shù)據(jù)分析結果的價值來說至關重要。很多的科學研究項目,如果其結果經(jīng)不起推敲且不能復現(xiàn),那么這些結果就會失去其可信度。當來源信息如圖4-9中所示從生成分析結果的過程中獲取,那么,這些結果就會更可信從而更放心地使用。4.2.3數(shù)據(jù)獲取與數(shù)據(jù)來源圖4-9數(shù)據(jù)可能需要使用數(shù)據(jù)集屬性和其經(jīng)過的操作流程的細節(jié)來進行注釋不同的性能挑戰(zhàn)4.2.44.2.4不同的性能挑戰(zhàn)儀表板或者其他需要流數(shù)據(jù)和警告的應用,經(jīng)常要求實時或者接近實時的數(shù)據(jù)傳輸。很多的開源大數(shù)據(jù)解決方案與工具是批處理形式的。但是,現(xiàn)在有一套新的具有實時處理能力的開源工具用于支持流數(shù)據(jù)分析,很多現(xiàn)有的實時數(shù)據(jù)分析解決方案可供公眾使用。在事務性數(shù)據(jù)到達時,或是與先前的概要數(shù)據(jù)進行結合時,我們往往會采用這些方法來獲取接近實時的結果。由于一些大數(shù)據(jù)解決方案需要處理大量的數(shù)據(jù),性能經(jīng)常成為問題。例如,在大數(shù)據(jù)集上執(zhí)行復雜的查詢算法會導致較長的查詢時間。另一個性能挑戰(zhàn)則與網(wǎng)絡帶寬有關。隨著數(shù)據(jù)量的不斷增加,單位數(shù)據(jù)的傳輸時間可能超過數(shù)據(jù)的處理時間。不同的管理需求4.2.54.2.5不同的管理需求大數(shù)據(jù)解決方案訪問數(shù)據(jù)和生成數(shù)據(jù),所有這些都會變成有價值的商業(yè)資產(chǎn)。為了保證數(shù)據(jù)和解決方案環(huán)境以一種可控制的方式受到較好的管理、標準化和演化,一個數(shù)據(jù)管理框架是非常必要的。大數(shù)據(jù)管理框架的內(nèi)容包含:數(shù)據(jù)加標簽與使用元數(shù)據(jù)生成標簽的標準;規(guī)范可能獲得的外部數(shù)據(jù)類型;關于管理數(shù)據(jù)隱私和數(shù)據(jù)匿名化的策略;數(shù)據(jù)源和分析結果歸檔的策略;實現(xiàn)數(shù)據(jù)清洗與過濾指導方針的策略。4.2.5不同的管理需求為了控制大數(shù)據(jù)解決方案中數(shù)據(jù)的流入和流出,方法很重要,它需要考慮如何建立反饋循環(huán)使處理過的數(shù)據(jù)能夠進行重復細化。例如,迭代的方法能夠使商務人員定期為IT人員提供反饋,每個反

饋周期通過修改數(shù)據(jù)準備工作或數(shù)據(jù)分析步

驟為系統(tǒng)求精提供機會。

圖4-10每一輪循環(huán)都能對操作步驟、算法和

數(shù)據(jù)模型進行微調(diào),以改善結果的準確性,

為商業(yè)活動提供更高的價值4.2.5不同的管理需求此外,云提供遠程環(huán)境,可以為大規(guī)模存儲和處理提供IT基礎設施。無論一個組織是否已經(jīng)啟用云計算,大數(shù)據(jù)環(huán)境需要采用部分或全部基于云的托管。例如,一個在云端運行客戶關系模型(CRM)系統(tǒng)的企業(yè)為了對其客戶關系模型數(shù)據(jù)進行分析,決定加入一套大數(shù)據(jù)解決方案,這些數(shù)據(jù)能夠在企業(yè)范圍內(nèi)被共享到其主要的大數(shù)據(jù)環(huán)境中。4.2.5不同的管理需求將云環(huán)境用于支持大數(shù)據(jù)解決方案的常見理由包括:(1)內(nèi)部硬件資源不足;(2)系統(tǒng)采購的前期資本投資不可用;(3)該項目將與業(yè)務的其余部分隔離,以保證現(xiàn)有業(yè)務流程不受影響;(4)大數(shù)據(jù)計劃作為概念驗證;(5)需要處理的數(shù)據(jù)集已經(jīng)在云端;(6)大數(shù)據(jù)解決方案內(nèi)部可用計算和存儲資源的限制?!咀鳂I(yè)】討論:【實訓操作】為ETI公司確定數(shù)據(jù)特征與類型討論:目錄1任務4.1:理解采用大數(shù)據(jù)的商業(yè)動機2任務4.2:理解大數(shù)據(jù)規(guī)劃考慮3任務4.3:熟悉大數(shù)據(jù)商務智能【導讀案例】高德地圖升級易升平臺討論:(1)請簡單闡述你對移動支付應用現(xiàn)狀的觀察和分析。(2)與其他移動支付形式相比,微信支付有什么個性特點?(3)你有沒有想過,高德導航的背后,藏著一個智慧交通大數(shù)據(jù)分析?那么,在微信支付的背后呢?請簡單闡述你的看法。(4)請簡單記述你所知道的上一周內(nèi)發(fā)生的國

際、國內(nèi)或者身邊的大事?!救蝿彰枋觥浚?)熟悉OLTP與OLAP、數(shù)據(jù)倉庫與數(shù)據(jù)集市等重要概念與知識;(2)熟悉大數(shù)據(jù)商務智能的定義、概念及其相關知識;(3)了解大數(shù)據(jù)營銷的主要方法?!局R準備】熟悉大數(shù)據(jù)商務智能在一個通過分層系統(tǒng)來執(zhí)行業(yè)務的企業(yè)里,戰(zhàn)略層限制著戰(zhàn)術層,而戰(zhàn)術層領導著操作層。各層級之間能夠達到和諧一致是通過各種度量和績效指標來實現(xiàn)的,這些度量與績效指標以高屋建瓴的方式指導操作層如何去處理業(yè)務。這些度量聚合起來,再賦予一些額外的意義,便成為了關鍵績效指標(KPI),而這正是戰(zhàn)術層的管理者們賴以評價公司績效或者業(yè)務執(zhí)行的關鍵。關鍵績效指標會與其他用來評估關鍵成功因素的度量相關聯(lián)起來,最終這一系列豐富的度量指標便對應著由數(shù)據(jù)轉化為信息,由信息轉化為知識,再由知識轉化為智慧的這一過程。【知識準備】熟悉大數(shù)據(jù)商務智能在這個任務中,我們來學習一些支持這一轉變過程的企業(yè)級技術。數(shù)據(jù)存在一個組織的操作層信息系統(tǒng)之中,另外,數(shù)據(jù)庫結構利用各種查詢操作產(chǎn)生信息。處在分析鏈上層的是分析處理系統(tǒng),這些系統(tǒng)會增強多維結構的能力來回答更為復雜的查詢和提供更為深邃的眼光來指導業(yè)務操作。數(shù)據(jù)會以更大的規(guī)模從整個企業(yè)中獲取并儲存在一個數(shù)據(jù)倉庫里。管理者們正是通過這些數(shù)據(jù)倉庫來對更廣泛的公司績效和關鍵績效指標獲得更深入的理解。OLTP與OLAP4.3.14.3.1OLTP與OLAP聯(lián)機事務處理(OLTP,On-LineTransactionProcessing)系統(tǒng)是一個處理面向事務型數(shù)據(jù)的軟件系統(tǒng)?!奥?lián)機事務”這個術語意指實時完成某項活動。OLTP系統(tǒng)儲存的是經(jīng)過規(guī)范化的操作數(shù)據(jù),而這些數(shù)據(jù)是結構化數(shù)據(jù)一個常見的來源,并且也常常作為許多分析處理的輸入。大數(shù)據(jù)分析結構能夠被用來增強儲存在底層關系型數(shù)據(jù)庫的OLTP數(shù)據(jù)。以一個POS機系統(tǒng)為例,OLTP系統(tǒng)在公司業(yè)務的協(xié)助下進行業(yè)務流程的處理。OLTP系統(tǒng)支持的查詢由一些簡單的插入、刪除和更新操作組成,通常這些操作的反應時間都為亞秒級。常見的例子包括訂票系統(tǒng)、銀行業(yè)務系統(tǒng)和POS系統(tǒng)。4.3.1OLTP與OLAP聯(lián)機分析處理(OLAP,OnlineAnalyticalProcessing)系統(tǒng)被用來處理數(shù)據(jù)分析查詢。OLAP系統(tǒng)是形成商務智能、數(shù)據(jù)挖掘和機器學習處理過程中不可或缺的部分。它們與大數(shù)據(jù)有關聯(lián),因為它們既能作為數(shù)據(jù)源,也能作為接收數(shù)據(jù)的數(shù)據(jù)接收裝置。OLAP系統(tǒng)可被用于診斷性分析、預測性分析和規(guī)范性分析。OLAP系統(tǒng)依靠一個多維數(shù)據(jù)庫來完成耗時且復雜的查詢,這個數(shù)據(jù)庫為了執(zhí)行高級分析而優(yōu)化了結構。OLAP系統(tǒng)會存儲一些聚集起來且去結構化的、支持快速匯報能力的歷史數(shù)據(jù)。它們進一步運用了一些以多維結構來存儲歷史數(shù)據(jù)的數(shù)據(jù)庫,并且有基于多領域數(shù)據(jù)之間的關系來回答復雜查詢的能力。抽取、轉換和加載技術4.3.24.3.2抽取、轉換和加載技術數(shù)據(jù)抽取、轉換和加載(ETL,Extraction-Transformation-Loading)技術是一個將數(shù)據(jù)從源系統(tǒng)中加載到目標系統(tǒng)中的過程。源系統(tǒng)可以是一個數(shù)據(jù)庫、一個平面文件或者是一個應用。相似的,目標系統(tǒng)也可以是一個數(shù)據(jù)庫或者其他存儲系統(tǒng)。ETL表示了數(shù)據(jù)倉庫輸入數(shù)據(jù)的主要過程。一份大數(shù)據(jù)解決方案是圍繞著ETL的特征集來的,將各種不同類型的數(shù)據(jù)進行轉換。圖4-11展示了所需數(shù)據(jù)首先從源中進行獲取或抽取,然后,抽取物依據(jù)規(guī)則應用被修飾或轉換,最終,數(shù)據(jù)被插入到或者加載到目標系統(tǒng)中。4.3.2抽取、轉換和加載技術圖4-11一個ETL過程能夠從多項源中抽取數(shù)據(jù),并將之轉換,最后加載到一個單目標系統(tǒng)中數(shù)據(jù)倉庫與數(shù)據(jù)集市4.3.34.3.3數(shù)據(jù)倉庫與數(shù)據(jù)集市一個數(shù)據(jù)倉庫是一個由歷史數(shù)據(jù)與當前數(shù)據(jù)組成的中央的、企業(yè)級的倉庫。數(shù)據(jù)倉庫常常被商務智能用來運行各種各樣的分析查詢,并且它們經(jīng)常會與一個聯(lián)機分析處理系統(tǒng)交互來支持多維分析查詢。批處理任務會周期性地將數(shù)據(jù)從類似于企業(yè)資源計劃系統(tǒng)(ERP),客戶關系管理系統(tǒng)(CRM)和供應鏈管理系統(tǒng)(SCM)的業(yè)務系統(tǒng)中載入一個數(shù)據(jù)倉庫4.3.3數(shù)據(jù)倉庫與數(shù)據(jù)集市從不同的業(yè)務系統(tǒng)而來的與多數(shù)商業(yè)實體相關的數(shù)據(jù)會被周期性地提取、驗證、轉換,最終合并到一個單獨的去規(guī)范化的數(shù)據(jù)庫里。由于有著來自于整個企業(yè)周期性的數(shù)據(jù)輸入,一個給定的數(shù)據(jù)倉庫里的數(shù)據(jù)量會持續(xù)性地增長。隨著時間流逝,這會慢慢導致數(shù)據(jù)分析任務的反應時間越來越慢。為了解決這個缺點,數(shù)據(jù)倉庫往往包含被稱為分析型數(shù)據(jù)庫的經(jīng)過優(yōu)化的數(shù)據(jù)庫,來處理報告與數(shù)據(jù)分析的任務。一個分析型數(shù)據(jù)庫能作為一個單獨的管理系統(tǒng)存在,例如一個聯(lián)機分析處理系統(tǒng)。4.3.3數(shù)據(jù)倉庫與數(shù)據(jù)集市數(shù)據(jù)集市是存儲在數(shù)據(jù)倉庫里的一個數(shù)據(jù)子集,這個數(shù)據(jù)倉庫往往屬于一個分公司、一個部門或者特定的業(yè)務范圍。數(shù)據(jù)倉庫可以有多個數(shù)據(jù)集市。企業(yè)級數(shù)據(jù)被整合,然后商業(yè)實體被提取。特定領域的實體通過ETL過程插入到數(shù)據(jù)倉庫。一個數(shù)據(jù)倉庫的“真實”版本是依賴于干凈數(shù)據(jù)的,這是準確的和無錯的匯報的前提條件。傳統(tǒng)商務智能4.3.44.3.4傳統(tǒng)商務智能傳統(tǒng)商務智能主要使用描述性和診斷性分析來為歷史性活動或現(xiàn)今活動提供數(shù)據(jù)。它不“智能”是因為只能為正確格式的問題提供答案。能夠正確闡述問題需要對商務事物和數(shù)據(jù)本身的理解。商務智能通過即席報表或儀表板對不同的關鍵績效指標作報告。1.即席報表即席報表是一個涉及了人工處理數(shù)據(jù)來產(chǎn)生定制匯報的過程,OLAP和OLTP數(shù)據(jù)源能夠為商務智能所使用,來產(chǎn)生即席報表和儀表板。一次即席報表的重點在于它常常是基于商業(yè)中的一個特定領域的,比如它的營銷或者供應鏈管理。所生成的特定匯報是具有豐富細節(jié)的,在性質(zhì)上通常呈現(xiàn)扁平化的風格。4.3.4傳統(tǒng)商務智能2.儀表板儀表板會提供關鍵商務領域的全局視野。展示在儀表板中的信息有著實時或近實時的周期性間隔。商務智能工具使用聯(lián)機事務處理和聯(lián)機分析處理來在儀表板上展示信息,儀表板中的數(shù)據(jù)展示在性質(zhì)上是圖表狀的,常用條形圖、餅圖和儀表測量。數(shù)據(jù)倉庫和數(shù)據(jù)集市含有來自整個企業(yè)的商務實體的經(jīng)過歸一和驗證過的信息。傳統(tǒng)的商務智能在離開了數(shù)據(jù)集市的情況下并不能十分有效地工作,因為數(shù)據(jù)集市含有商務智能為了匯報用途所需的經(jīng)過優(yōu)化的和獨立的數(shù)據(jù)。如果沒有數(shù)據(jù)集市,每當需要運行一個查詢,數(shù)據(jù)就需要通過一個ETL過程,從數(shù)據(jù)倉庫中臨時提取。這會增加執(zhí)行查詢和產(chǎn)生報表所用的時間和工作。4.3.4傳統(tǒng)商務智能傳統(tǒng)商務智能用數(shù)據(jù)倉庫和數(shù)據(jù)集市來匯報和進行數(shù)據(jù)分析,因為它們允許帶了多重連接及聚合操作的復雜分析查詢的實現(xiàn)。4.3.4傳統(tǒng)商務智能3.傳統(tǒng)數(shù)據(jù)可視化數(shù)據(jù)可視化是一項能夠使用表、圖、數(shù)據(jù)網(wǎng)格、信息圖表和警報來將分析結果圖形化展示的技術。圖形化地表達數(shù)據(jù)能夠使理解匯報、觀察趨勢和鑒別模式的過程更為簡單。傳統(tǒng)的數(shù)據(jù)可視化在匯報和顯示表中所展示的大部分都是靜態(tài)的圖與表,然而數(shù)據(jù)可視化工具可以與用戶交互,并且能同時提供總結版與細節(jié)版的數(shù)據(jù)展示。它們被設計出來的使命就是為了使人們在不需要借助電子表格的情況下,更好地理解分析結果。傳統(tǒng)的數(shù)據(jù)可視化工具從關系型數(shù)據(jù)庫、聯(lián)機分析處理系統(tǒng)、數(shù)據(jù)倉庫和電子表格中查詢數(shù)據(jù),以展現(xiàn)描述性和診斷性分析結果。大數(shù)據(jù)商務智能4.3.54.3.5大數(shù)據(jù)商務智能大數(shù)據(jù)商務智能通過對數(shù)據(jù)倉庫里干凈的、統(tǒng)一的、企業(yè)范圍的數(shù)據(jù)進行操作,并將之與半結構化和非結構化的數(shù)據(jù)源結合起來,且基于傳統(tǒng)商務智能來構建。它同時包含了預測性分析和規(guī)范性分析,來加快對于商務績效的企業(yè)級理解。在傳統(tǒng)的商務智能分析通常著眼于單個的業(yè)務流程的時候,大數(shù)據(jù)商務智能分析已經(jīng)著眼于同時處理多重業(yè)務進程。這更加有助于從一個更寬闊的視角揭露企業(yè)內(nèi)的模式與異常。它同樣也會用以前未知的深入的洞察性視角和信息來實現(xiàn)數(shù)據(jù)挖掘。4.3.5大數(shù)據(jù)商務智能大數(shù)據(jù)商務智能需要對儲存在企業(yè)數(shù)據(jù)倉庫里的非結構化、半結構化和結構化數(shù)據(jù)進行分析,而這需要運用新型特征和技術的下一代數(shù)據(jù)倉庫,用以儲存來自不同源的統(tǒng)一數(shù)據(jù)格式的干凈數(shù)據(jù)。當傳統(tǒng)的數(shù)據(jù)倉庫遇上這些新型技術,便會產(chǎn)生一個混合數(shù)據(jù)倉庫。這個倉庫能夠作為結構化、半結構化和非結構化數(shù)據(jù)的統(tǒng)一的、集中的倉庫,同時也能提供大數(shù)據(jù)商務智能工具所需要的數(shù)據(jù)。這消除了大數(shù)據(jù)商業(yè)智能工具需要連接多個數(shù)據(jù)源以檢索或者訪問數(shù)據(jù)的需要。4.3.5大數(shù)據(jù)商務智能大數(shù)據(jù)解決方案所需的數(shù)據(jù)可視化功能要求能夠無縫連接結構化、半結構化和非結構化數(shù)據(jù)源,并且要求能進一步處理成千上萬的數(shù)據(jù)記錄。大數(shù)據(jù)解決方案的數(shù)據(jù)可視化工具通常使用的內(nèi)存分析技術能夠減少傳統(tǒng)的、基于磁盤的數(shù)據(jù)可視化工具所造成的延遲。4.3.5大數(shù)據(jù)商務智能大數(shù)據(jù)解決方案的高級數(shù)據(jù)可視化工具吸收了預測性和規(guī)范性數(shù)據(jù)分析和數(shù)據(jù)轉換的特征。這些工具終結了需要使用類似于抽取、轉換和加載技術的數(shù)據(jù)預處理方法的需要。這些工具同樣提供了直接連接結構化、半結構化和非結構化數(shù)據(jù)源的能力。作為大數(shù)據(jù)解決方案的一部分,高級數(shù)據(jù)可視化工具能夠?qū)⒈4嬖趦?nèi)存中為了快速訪問數(shù)據(jù)的結構化和非結構化數(shù)據(jù)相結合。然后查詢和統(tǒng)計公式能夠作為多種數(shù)據(jù)分析任務中的一種,用來以一種用戶友好的格式(如儀表板)來查看數(shù)據(jù)。4.3.5大數(shù)據(jù)商務智能大數(shù)據(jù)可視化工具的常用特征有:聚合——提供基于眾多上下文的全局性和總結性數(shù)據(jù)展示。向下鉆取——通過從總結性展示中選取一個數(shù)據(jù)子集來提供細節(jié)性展示。過濾——通過濾去并不是很需要的數(shù)據(jù)來專注于一部分數(shù)據(jù)集。上卷——將數(shù)據(jù)按照多種類別進行分組來展現(xiàn)小計與總計。假設分析——通過動態(tài)改變某些相關因素來可視化多個結果。大數(shù)據(jù)營銷4.3.64.3.6大數(shù)據(jù)營銷行之有效的大數(shù)據(jù)交流需要同時具備愿景和執(zhí)行兩個方面。愿景意味著訴說故事,讓人們從中看到希望,受到鼓舞。執(zhí)行則是指具體實現(xiàn)的商業(yè)價值,并提供數(shù)據(jù)支撐。大數(shù)據(jù)營銷由三個關鍵部分組成:愿景,價值以及執(zhí)行。號稱“世界上最大的書店”的亞馬遜,“終極駕駛汽車”的寶馬以及“開發(fā)者的好朋友”的谷歌,它們各自都有清晰的愿景。4.3.6大數(shù)據(jù)營銷但是單單明確愿景還不夠,公司還必須有伴隨著產(chǎn)品價值、作用以及具體購買人群的清晰表述。基于愿景和商業(yè)價值,公司能講述個性化的品牌故事,吸引到它們大費周折才接觸到的顧客、報道者、博文作者以及其他產(chǎn)業(yè)的成員。他們可以創(chuàng)造有效的博客、信息圖表、在線研討會、案例研究、特征對比以及其他營銷材料,從而成功地支持營銷活動——既可以幫助宣傳,又可以支持銷售團隊銷售產(chǎn)品。和其他形式的營銷一樣,內(nèi)容也需要具備高度針對性。4.3.6大數(shù)據(jù)營銷即使這樣,公司對自己的產(chǎn)品有了許多認識,但卻未能在潛在顧客登陸其網(wǎng)站時實現(xiàn)有效轉換。通常,公司花費九牛二虎之力增加了網(wǎng)站的訪問量,結果到了需要將潛在顧客轉換為真正的顧客時,卻一再出錯。網(wǎng)站設計者可能將按鈕放在非最佳位置上,可能為潛在顧客提供了太多可行性選擇,或者建立的網(wǎng)站缺乏顧客所需的信息。當顧客想要下載或者購買公司的產(chǎn)品時,就很容易產(chǎn)生各種不便。至于大數(shù)據(jù)營銷,則與傳統(tǒng)觀營銷方式?jīng)]多大關系,其更注重創(chuàng)建一種無障礙的對話。通過開辟大數(shù)據(jù)對話,我們能將大數(shù)據(jù)的好處帶給更為廣泛的人群。4.3.6大數(shù)據(jù)營銷1.像媒體公司一樣思考大數(shù)據(jù)本身有助于提升對話。營銷人員擁有網(wǎng)站訪客的分析數(shù)據(jù)、故障通知單系統(tǒng)的顧客數(shù)據(jù)以及實際產(chǎn)品的使用數(shù)據(jù),這些數(shù)據(jù)可以幫助他們理解營銷投入如何轉換為顧客行為,并由此建立良性循環(huán)。4.3.6大數(shù)據(jù)營銷隨著雜志、報紙以及書籍等線下渠道廣告投入持續(xù)下降,在線拓展顧客的新方法正不斷涌現(xiàn)。谷歌仍然是在線廣告行業(yè)的巨無霸,在線廣告收入約占其總電子廣告收入的41.3%。同時,如臉書、推特以及領英等社會化媒體不僅代表了新型營銷渠道,也是新型數(shù)據(jù)源?,F(xiàn)在,營銷不僅僅是指在廣告上投入資金,它意味著每個公司必須像一個媒體公司一樣思考、行動。它不僅意味著運作廣告營銷活動以及優(yōu)化搜索引擎列表,也包含了開發(fā)內(nèi)容、分布內(nèi)容以及衡量結果。大數(shù)據(jù)應用將源自所有渠道的數(shù)據(jù)匯集到一起,經(jīng)過分析,做出下一步行動的預測——幫助營銷人員制訂更優(yōu)的決策或者自動執(zhí)行決策。4.3.6大數(shù)據(jù)營銷2.營銷面對新的機遇與挑戰(zhàn)據(jù)產(chǎn)業(yè)研究公司高德納咨詢公司稱,到2017年,首席營銷官(CMO)花費在信息技術上的時間將比首席信息官(CIO)還多。營銷組織現(xiàn)在更加傾向于自行制訂技術決策,IT部門的參與也越來越少。越來越多的營銷人員轉而使用基于云端的產(chǎn)品以滿足他們的需求。這是因為他們可以多次嘗試,如果產(chǎn)品不能發(fā)揮效用,就直接拋棄掉。過去,市場營銷費用分三類:跑市場的人員成本;創(chuàng)建、運營以及衡量營銷活動的成本;開展這些活動和管理所需的基礎設施。4.3.6大數(shù)據(jù)營銷在生產(chǎn)實物產(chǎn)品的公司中,營銷人員花錢樹立品牌效應,并鼓勵消費者采購。消費者采購的場所則包括零售商店、汽車經(jīng)銷店、電影院以及其他實際場所,此外還有網(wǎng)上商城如亞馬遜。在出售技術產(chǎn)品的公司中,營銷人員往往試圖推動潛在客戶直接訪問他們的網(wǎng)站。例如,一家技術創(chuàng)業(yè)公司可能會購買谷歌關鍵詞廣告(出現(xiàn)在谷歌網(wǎng)站和所有谷歌出版合作伙伴的網(wǎng)站上的文字廣告),希望人們會點擊這些廣告并訪問他們的網(wǎng)站。在網(wǎng)站上,潛在客戶可能會試用該公司的產(chǎn)品,或輸入其聯(lián)系信息以下載資料或觀看視頻,這些活動都有可能促成客戶購買該公司的產(chǎn)品。4.3.6大數(shù)據(jù)營銷所有這些活動都會留下包含大量信息的電子記錄,記錄由此增長了10倍。營銷人員從眾多廣告網(wǎng)絡和媒體類型中選擇了各種廣告,他們也可能從客戶與公司互動的多種方式中收集到數(shù)據(jù)。這些互動包括網(wǎng)上聊天會話、電話聯(lián)系、網(wǎng)站訪問量、顧客實際使用的產(chǎn)品的功能,甚至是特定視頻的最為流行的某個片段等。從前公司營銷系統(tǒng)需要創(chuàng)建和管理營銷活動,跟蹤業(yè)務,向客戶收取費用,并提供服務支持的功能,公司通常采用安裝企業(yè)軟件解決方案的形式,但其花費昂貴且難以實施。IT組織則需要購買硬件、軟件和咨詢服務,以使全套系統(tǒng)運行,從而支持市場營銷、計費和客戶服務業(yè)務。4.3.6大數(shù)據(jù)營銷通過“軟件即服務”模型(SaaS,簡稱為軟營模式),基于云計算的產(chǎn)品已經(jīng)可以運行上述所有活動了。企業(yè)不必購買硬件、安裝軟件、進行維護,便可以在網(wǎng)上獲得最新和最優(yōu)秀的市場營銷、客戶管理、計費和客戶服務的解決方案。如今,許多公司擁有的大量客戶數(shù)據(jù)都存儲在云中,包括企業(yè)網(wǎng)站、網(wǎng)站分析、網(wǎng)絡廣告花費、故障通知單等。很多與公司營銷工作相關的內(nèi)容(如新聞稿、新聞報道、網(wǎng)絡研討會、幻燈片放映以及其他形式的內(nèi)容)也都在網(wǎng)上。公司在網(wǎng)上提供產(chǎn)品(如在線協(xié)作工具或網(wǎng)上支付系統(tǒng)),營銷人員就可以通過用戶統(tǒng)計和產(chǎn)業(yè)信息知道客戶或潛在客戶瀏覽過哪項內(nèi)容。4.3.6大數(shù)據(jù)營銷現(xiàn)在營銷人員的挑戰(zhàn)和機遇在于將從所有活動中獲得的數(shù)據(jù)匯集起來,使之產(chǎn)生價值。營銷人員可以嘗試將所有數(shù)據(jù)輸入電子表格中,并做出分析,以確定哪些有效,哪些無用。但是,真正理解數(shù)據(jù)需要大量的分析。比如,某項新聞發(fā)布是否增加了網(wǎng)站訪問量?某篇新聞文章是否帶來了更多的銷售線索?網(wǎng)站訪問群體能否歸為特定產(chǎn)業(yè)部分?什么內(nèi)容對哪種訪客有吸引力?網(wǎng)站上一個按鈕移動位置又是否使公司的網(wǎng)站有了更高的顧客轉化率?營銷人員的另一個問題是了解客戶的價值,尤其是他們可以帶來多少盈利。例如,一個客戶只花費少量的錢卻提出很多支持請求,可能就無利可圖。然而,公司很難將故障通知單數(shù)據(jù)與產(chǎn)品使用數(shù)據(jù)聯(lián)系起來,特定客戶創(chuàng)造的財政收入信息與獲得該客戶的成本也不能直接掛鉤。4.3.6大數(shù)據(jù)營銷3.自動化營銷大數(shù)據(jù)營銷要合乎邏輯,不僅要將不同數(shù)據(jù)源整合到一起,為營銷人員提供更佳的儀表盤和解析,還要利用大數(shù)據(jù)使營銷實現(xiàn)自動化。然而,這頗為棘手,因為營銷由兩個不同的部分組成:創(chuàng)意和投遞。4.3.6大數(shù)據(jù)營銷營銷的創(chuàng)意部分以設計和內(nèi)容創(chuàng)造的形式出現(xiàn)。例如,計算機可以顯示出紅色按鈕還是綠色按鈕、12號字體還是14號字體可以為公司獲得更高的顧客轉換率。假如要運作一組潛在的廣告,它也能分辨哪些最為有效。如果提供正確的數(shù)據(jù),計算機甚至能針對特定的個人信息、文本或圖像廣告的某些元素進行優(yōu)化。例如,廣告優(yōu)化系統(tǒng)可以將一條旅游廣告?zhèn)€性化,將參觀者的城市名稱納入其中:“查找舊金山和紐約之間的最低票價”,而非僅僅“查找最低票價”。接著,它就可以確定包含此信息是否會增加轉換率。4.3.6大數(shù)據(jù)營銷從理論上來說,個人可以執(zhí)行這種操作,但對于數(shù)以十億計的人群來說,執(zhí)行這種自定義根本就不可行,而這正是網(wǎng)絡營銷的專長。例如,谷歌平均每天服務的廣告發(fā)布量將近300億。大數(shù)據(jù)系統(tǒng)擅長處理的情況是:大量數(shù)據(jù)必須迅速處理,迅速發(fā)揮作用。4.3.6大數(shù)據(jù)營銷一些解決方案應運而生,它們?yōu)榭蛻粜袨樽詣咏R蕴峁﹤€性化廣告。像TellApart公司(一項重新定位應用)這樣的解決方案正在將客戶數(shù)據(jù)的自動化分析與基于該數(shù)據(jù)展示相關廣告的功能結合起來。TellApart公司能識別離開零售商網(wǎng)站的購物者,當他們訪問其他網(wǎng)站時,就向他們投遞個性化的廣告。這種個性化的廣告將購物者帶回到零售商的網(wǎng)站,通常能促成一筆交易。通過分析購物者的行為,TellApart公司能夠鎖定高質(zhì)量顧客的預期目標,同時排除根本不會購買的人群。4.3.6大數(shù)據(jù)營銷就營銷而言,自動化系統(tǒng)主要涉及大規(guī)模廣告投放和銷售線索評分,即基于種種預定因素對潛在客戶線索進行評分。這些活動很適合數(shù)據(jù)挖掘和自動化,因為它們的過程都定義明確,而具體決策有待制訂(比如確定一條線索是否有價值)并且結果可以完全自動化(例如選擇投放哪種廣告)。大量數(shù)據(jù)可用于幫助營銷人員以及營銷系統(tǒng)優(yōu)化內(nèi)容創(chuàng)造和投遞方式。挑戰(zhàn)在于如何使之發(fā)揮作用。社會化媒體科學家丹?薩瑞拉已研究了數(shù)百萬條推文,點“贊”以及分享,并且他還對轉發(fā)量最多的推文關聯(lián)詞,發(fā)博客的最佳時間以及照片、文本、視頻和鏈接的相對重要性進行了定量分析。大數(shù)據(jù)迎合機器的下一步將是大數(shù)據(jù)應用程序,將薩瑞拉這樣的研究與自動化內(nèi)容營銷活動管理結合起來。4.3.6大數(shù)據(jù)營銷在今后的歲月里,我們將看到智能系統(tǒng)繼續(xù)發(fā)展,遍及營銷的方方面面:不僅是為線索評分,還將決定運作哪些營銷活動以及何時運作,并且向每位訪客呈現(xiàn)個性化的理想網(wǎng)站。營銷軟件不僅包括幫助人們更好地進行決策的儀表盤而已,借助大數(shù)據(jù),營銷軟件將可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論