商業(yè)智能(BI)功能模組特性分析參考分享_第1頁
商業(yè)智能(BI)功能模組特性分析參考分享_第2頁
商業(yè)智能(BI)功能模組特性分析參考分享_第3頁
商業(yè)智能(BI)功能模組特性分析參考分享_第4頁
商業(yè)智能(BI)功能模組特性分析參考分享_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

拆解BI套件—主要BI功能特性分析近幾年來的BI市場雖然已經(jīng)上演了很多的大魚吃小蝦事件,但仍然有不少的供應(yīng)商,產(chǎn)品套件也是琳瑯滿目,SASEnterpriseBIServer、CognosBISeries、BusinessObjectsEnterprise、Hyperion、MicroStrategy、MicrosoftReportingServices但是,嚴(yán)峻的現(xiàn)實(shí)是,在通往 BI產(chǎn)品選擇和標(biāo)準(zhǔn)化的路上依然布滿荊棘,很少有人能夠理解這些產(chǎn)品中有哪些差別, 這些差別又會怎樣影響到可用性、 可管理性、成本以及最終的成功。當(dāng)人們購買轎車的時(shí)候,他們知道污染、汽油價(jià)格等的影響,但是在 BI工具的選擇和標(biāo)準(zhǔn)化時(shí),諸如“帶狀報(bào)表( bandedreport)”或“multipassSQL”這樣的特性對不同的人就是不同的意思,取決于他是用戶、 BI專家還是 BI廠家。查詢首先來看查詢(Query)功能,也就是怎樣把數(shù)據(jù)從數(shù)據(jù)的大倉庫或運(yùn)作的系統(tǒng)中取出來。在決定哪一個(gè)標(biāo)準(zhǔn)重要之前,企業(yè)組織首先必須回答幾個(gè)策略性問題:誰來制作大多數(shù)的報(bào)表,是業(yè)務(wù)強(qiáng)大用戶還是IT開發(fā)者?答案也許是“兩者”,但是對每組用戶的重要功能是截然不同的,這就迫使你或者選擇多種工具(盡管可能是來自一家廠商),或者要求一部分使用者犧牲功能。Web是制作報(bào)表的環(huán)境還是僅僅為一個(gè)發(fā)布機(jī)制?很多最初為桌面構(gòu)建的 BI產(chǎn)品仍然與Web類產(chǎn)品有功能差異(雖然這個(gè)差距在縮小)。需要指出的是,由于很多現(xiàn)實(shí)原因,使用者需要同時(shí)查詢多種數(shù)據(jù)資源,有時(shí)可能需要把兩種數(shù)據(jù)顯示為兩種不同目標(biāo)形式,如,一個(gè)消費(fèi)者收入的表格和一個(gè)消費(fèi)者滿意度圖形同時(shí)顯示。另外的情形是,數(shù)據(jù)可能存儲在兩個(gè)不同地方,但使用者需要合并兩套數(shù)據(jù)并在一個(gè)表格中進(jìn)行分析。理論上說,所有的數(shù)據(jù)都已經(jīng)被清洗并存儲在數(shù)據(jù)倉庫之中,但實(shí)際上,在多數(shù)據(jù)庫的情況下可能存在不同的版本,包括個(gè)人電子數(shù)據(jù)表或部門的數(shù)據(jù)庫。所以收入可能出自數(shù)據(jù)倉庫,但消費(fèi)者分組及產(chǎn)業(yè)分割可能是在MicrosoftAccess數(shù)據(jù)庫中。實(shí)際產(chǎn)品的功能表現(xiàn)也不盡相同。雖然BusinessObjectsuniverse只允許訪問單一數(shù)據(jù)庫,但個(gè)別的文件允許使用者同時(shí)訪問多種數(shù)據(jù)庫、存儲的程序以及個(gè)人電子數(shù)據(jù)表,這給查詢者制作報(bào)表提供了相當(dāng)靈活性,也是WebIntelligence不具備的功能之一。CognosReportNet產(chǎn)品包通過ODBC為多數(shù)據(jù)資源服務(wù)。然而,一個(gè)報(bào)告只能查詢一個(gè)包,這給了管理者控制權(quán)但限制了使用者的靈活性。同樣,QueryStudio也只能顯示一個(gè)表格或圖表結(jié)果,但ReportStudio具有更大的靈活性。Informatica的PowerAnalyzer在管理者定義數(shù)據(jù)資源之后,允許一個(gè)報(bào)告訪問多種數(shù)據(jù)資源,結(jié)果只能顯示一個(gè)圖表。通過MicroStrategy7.5的新DocumentEditor(桌面),你可以在一個(gè)項(xiàng)目中包含多種查詢,但項(xiàng)目只能訪問一種關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù),因?yàn)檫@種訪問只是在格式化的文件中進(jìn)行,OLAP分析或鉆取(drill-down)對這種文件是不可用的。Microsoft的ReportingServices允許一個(gè)文件訪問多種數(shù)據(jù)資源,顯示結(jié)果可以是兩個(gè)或一個(gè)。報(bào)表坦白地講,報(bào)表的聲譽(yù)并不好。出自大型主機(jī)打印機(jī)的大量不鼓舞人的文件報(bào)表創(chuàng)造了那么多的原始數(shù)據(jù),但很少對決策有用。把注意力放在文件報(bào)表上幾乎很難付諸行動(dòng)。相反,分析卻很容易付諸行動(dòng),這也就是許多報(bào)告消費(fèi)者努力的方向。令人振奮的消息是報(bào)表正在改變,如同轎車從單純的使用機(jī)器走向奢華、炫耀的工程之作一樣,今天的報(bào)表已經(jīng)能夠服務(wù)于更敏捷的、更具有競爭性的行動(dòng)。首先,隨著用戶期待指數(shù)的提升,對報(bào)表工具支持復(fù)雜文件、原始數(shù)據(jù)查詢以及在一頁或一個(gè)報(bào)表中以多種方法展現(xiàn)等的需求也隨之而來。例如,你可能需要在看到延期交貨訂單的詳細(xì)表列數(shù)據(jù)的同時(shí),在其旁邊看到一個(gè)能顯示未決定、延期、準(zhǔn)時(shí)出貨百分比分布的餅狀圖。是否要使用帶狀報(bào)表(bandedreport)去控制報(bào)表設(shè)計(jì),也是廠商們最近爭論比較多的地方,他們的爭執(zhí)點(diǎn)是關(guān)于“怎樣”,而不是“什么”的問題。從一個(gè)用戶的立場,應(yīng)該關(guān)注的是你是否能夠擁有分組、小計(jì)以及詳情等。不過,不同產(chǎn)品實(shí)現(xiàn)這些目標(biāo)的方法也不同。像MicroStrategy的ReportServices使用了帶狀報(bào)表,需要你把小計(jì)放到報(bào)頭或尾部,在主體部分是詳情,圖表也必須出現(xiàn)在報(bào)頭或尾部。像BusinessObjectsEnterprise、CognosReportNet、MicrosoftReportingServices等其他BI產(chǎn)品,使用頁面設(shè)計(jì)概念,這樣你可以在任何你需要的地方放總計(jì)及詳情,它們只是獨(dú)立的對象,其位置你可以自由控制。概要圖表也可以出現(xiàn)在頁面上任何你需要的地方。兩種方法的結(jié)果很類似,但設(shè)計(jì)方法卻截然不同,帶狀報(bào)表結(jié)構(gòu)可能對傳統(tǒng)大型主機(jī)報(bào)表開發(fā)者更熟悉,頁面設(shè)計(jì)概念則對Excel、PowerPoint或HTML開發(fā)人員更熟悉。下面說說圖表。圖表的表現(xiàn)價(jià)值勝過千言萬語。但不幸的是,很多報(bào)表開發(fā)者仍然使用傳統(tǒng)表列數(shù)據(jù),其實(shí)圖表是最方便于分析的工具。所有廠商都提供同樣的基本圖表類型:柱狀、線形和餅狀圖,但只有少數(shù)提供map、bubble等獨(dú)特的圖表類型。在圖表類型中,使用者需要具備控制不同圖表屬性的能力,如min/max刻度、標(biāo)志布置、3D效果、個(gè)別線條或條棒的顏色等。雙Y軸的能力是繪制多度量器時(shí)的必備條件。例如,如果你分析隨著時(shí)間推移價(jià)格對銷售量的影響,你就必須要有兩個(gè)Y軸。BusinessObjects在其桌面工具中提供這個(gè)功能,但在其WebIntelligence中并沒有提供。CognosReportNet也有類似的局限性。再看報(bào)表協(xié)作性。報(bào)表消費(fèi)者(典型的商業(yè)業(yè)務(wù)使用者)能夠與報(bào)表相結(jié)合的程度也是一個(gè)重要的衡量標(biāo)準(zhǔn)。不能提供協(xié)作性的報(bào)表只不過是使分發(fā)“啞巴”紙質(zhì)報(bào)表的過程自動(dòng)化而已。發(fā)現(xiàn)一個(gè)趨勢圖中的異常只是商業(yè)洞察力的第一步;能夠研究這種異常才是關(guān)鍵性的第二步。即使BI工具提供了一定程度的協(xié)作性, 一些使用也會限制它。聰明的使用者會自動(dòng)輸出數(shù)據(jù)到 Excel,創(chuàng)造多種版本的真相,這是目前一種更加危險(xiǎn)的狀況。協(xié)作性有兩方面:單獨(dú)的報(bào)表協(xié)作性,跨越多種報(bào)表導(dǎo)航。在兩種情況下,報(bào)表和 OLAP鉆取之間的分界線正變得越來越模糊不清。BusinessObjectsWebIntelligence 提供了很好的單獨(dú)報(bào)表協(xié)作性; MicrosoftReportingServices 提供了模擬鉆取(出)的一個(gè)獨(dú)特大綱視圖,但它缺少過濾和分組。 CognosReportNet 在單獨(dú)報(bào)告協(xié)作性方面較弱,只提供了一個(gè)靜態(tài)頁面,但是 ReportNet 提供了很好的全面導(dǎo)航功能,允許在報(bào)告之間鉆取 (出)以及報(bào)告與其他應(yīng)用之間的鉆?。ǔ觯?,包括 CognosPowerPlay 和Visualizer 。InformaticaPowerAnalyzer 的導(dǎo)航功能非常獨(dú)特。勝過從一個(gè)報(bào)告到另一個(gè)報(bào)告的鉆取, PowerAnalyzer 使用了“工作流(workflow )”的概念,使用者看到一個(gè)可選擇報(bào)告的列表,而不是只能在一個(gè)靜態(tài)的子報(bào)告中挑選,一個(gè)主報(bào)告可以有多種工作流,靈活地提供了更多導(dǎo)航。需要指出的是,文件復(fù)雜性、圖表、協(xié)作性等只是各 BI廠家提供的一些主要差異性報(bào)表特性,諸如有條件格式化、相對定位以及格式紙等另外的一些特性也會影響報(bào)表設(shè)計(jì)。信息發(fā)布查詢和報(bào)表使你把原始數(shù)據(jù)轉(zhuǎn)變成能促進(jìn)決策行動(dòng)的強(qiáng)大的文件, 然而,除非你已經(jīng)把那些文件放到?jīng)Q策制定者手中,否則數(shù)據(jù)間的鏈條仍然是斷開的。接下來就要依賴于信息發(fā)布( informationdelivery )功能了。兩種技術(shù)對企業(yè)信息發(fā)布有重大影響: Web和email。過去,信息遞送過程包括走向打印機(jī)、 拿到打印輸出,或者傳達(dá)室把報(bào)告遞到你手上。 在20世紀(jì)90年代后期,很多公司有了企業(yè)內(nèi)部網(wǎng)絡(luò),開始把標(biāo)準(zhǔn)報(bào)表輸出到內(nèi)部網(wǎng)上,這些報(bào)表可能是電子數(shù)據(jù)表文件或以HTML保存的靜態(tài)BI報(bào)表。今天,BI報(bào)表按照BI工具賦予的文件格式存儲,擁有更多協(xié)作和更新數(shù)據(jù)的能力, Web和email也擴(kuò)展了報(bào)表傳遞的范圍,盡管當(dāng)初上百用戶執(zhí)行 BI就被認(rèn)為是很大規(guī)模,今天所謂大規(guī)模已經(jīng)是好幾萬的概念。這樣,可擴(kuò)展性就成為衡量信息發(fā)布功能的一個(gè)主要因素:一個(gè)報(bào)表必須到達(dá)多少使用者以及怎么樣到達(dá)。評估各廠家BI工具的可擴(kuò)展性并不容易,因?yàn)椴煌a(chǎn)品擴(kuò)展方式不同,仔細(xì)查看公開的基準(zhǔn)測試結(jié)果、查看消費(fèi)者指南手冊、理解其架構(gòu)是評估一個(gè)產(chǎn)品是否能按照你的期望擴(kuò)展的必要步驟。按照信息發(fā)布來評估可擴(kuò)展性要求, 你還必須考慮使用者怎樣與報(bào)表相互作用。 一種所謂的push(相對于pull)方法是,BI工具按照計(jì)劃產(chǎn)生報(bào)表,然后通過email或無線設(shè)備等門戶把這些結(jié)果推向最終使用者。乍看,push方法好像是管理可擴(kuò)展性的理想方法,因?yàn)镮T能夠預(yù)先決定什么時(shí)候處理大量BI作業(yè)。但是,就像一個(gè)執(zhí)行主管反映的,他經(jīng)常被報(bào)表email所淹沒,現(xiàn)在他通常是刪除,因?yàn)樗J(rèn)為如果真的有問題的話,肯定會有人打電話給他。很顯然,并不在于說你推出去多少個(gè)報(bào)告,而要看多少人在做決策的時(shí)候真正使用了這些報(bào)告。而且,還必須考慮你強(qiáng)行推給用戶的是一種靜態(tài) PDF附件還是一個(gè)到 BI報(bào)告的URL,如果是PDF,擴(kuò)展性需求并不是很嚴(yán)重, 因?yàn)镻DF是預(yù)先制作好的,使用者在瀏覽報(bào)表的時(shí)候不會對 BI應(yīng)用服務(wù)器造成壓力;但 URL情形則需要更多的擴(kuò)展性,因?yàn)槭褂谜咭L問 BI應(yīng)用服務(wù)器。push方法還包含“bursting問”題,也就是拿到一個(gè)大型報(bào)告,并分解,以便不同使用者只能得到允許的或需要看到的數(shù)據(jù),如,每一個(gè)人事主管只能看到其職工的薪酬。這種個(gè)性化無論從安全方面還是從管理信息超載方面都非常重要。在大多情況下,bursting能減輕RDBMS(關(guān)系型數(shù)據(jù)庫管理系統(tǒng))的一些負(fù)荷,因?yàn)樵S多的人事主管并不需要運(yùn)行許多的單獨(dú)查詢,而是,運(yùn)行一個(gè)大型查詢,其結(jié)果被分為多個(gè)部分。然而,bursting的實(shí)現(xiàn)方法也不同,也不總是能提供這種優(yōu)勢。比如,在BusinessObjects提供的兩種bursting方法中,一種就是通過BroadcastAgentScheduler為每一組接受者運(yùn)行查詢,這種技術(shù)允許公司使用獨(dú)立數(shù)據(jù)庫登錄,并具有安全性,但它會給RDBMS造成不必要的負(fù)荷。CognosImpromptu也使用這種方法。圖1BusinessObjects的InfoViewPortal允許使用者創(chuàng)建可作為dashboard使用的MyInfoView,內(nèi)容包括報(bào)、WebURL等.不過,大多數(shù)的產(chǎn)品,包括BusinessObjectsBroadcastAgentPublisher及CognosReportNet,都是使用運(yùn)行一個(gè)查詢、然后分裂為多個(gè)單獨(dú)報(bào)表的方法,這樣減少了查詢對RDBMS的訪問。久經(jīng)考驗(yàn)的pull方法是廣大最終使用者喜歡的方法,然而它對IT部門和廠商提出了更多挑戰(zhàn)。這種方法是使用者登錄到BI的工具,有選擇地尋找他們需要的報(bào)告。schedule-and-pull取代schedule-and-push方法的過程將是很緩慢的。有重現(xiàn)信息需求的使用者可能會把查詢更新的時(shí)間安排在非高峰時(shí)間,或者說,IT可能會將高使用率的報(bào)表安排為整晚更新,以便其結(jié)果能夠預(yù)先緩存給使用者。schedule-and-pull的方法減少了BI應(yīng)用服務(wù)器的負(fù)荷,從而讓它能支持并發(fā)的查詢更新以及復(fù)雜文件的產(chǎn)生等。專門的BI門戶能夠讓使用者訪問標(biāo)準(zhǔn)的報(bào)表或個(gè)人報(bào)表。對于一些已經(jīng)實(shí)現(xiàn)企業(yè)范圍門戶解決方案的公司來說,與Plumtree、IBMWebSphere或MicrosoftSharepoint等門戶產(chǎn)品集成是非常重要的。根據(jù)你不同的策略,你也許:把特定的BI功能嵌入企業(yè)門戶中;從企業(yè)門戶內(nèi)部訪問專門的BI門戶;通過WebURL訪問專門的門戶。好的BI門戶允許使用者將門戶定制到諸如MyYahoo這樣的儀表盤中,顯示多種報(bào)表、Web站點(diǎn)、提示以及報(bào)表列表等。標(biāo)準(zhǔn)的報(bào)表通常以各種主題分組。完美的BI門戶允許一個(gè)報(bào)表以多種方式分組,而不會造成同一報(bào)表的多復(fù)制本。而且越來越多的廠商允許電子數(shù)據(jù)表、PDF文件等非BI文件存儲在BI倉庫中,并在門戶中展現(xiàn)。隨著BI內(nèi)容的增加,使用者也需要簡單的方法來通過作者、關(guān)鍵字或其他方法來查詢報(bào)表。Excel集成在評估BI工具套件功能的時(shí)候,人們往往很容易沉浸在逐個(gè)功能的對比中,而忽略了執(zhí)行BI所要達(dá)到的商業(yè)目標(biāo)。前文曾經(jīng)把選擇BI工具與購買轎車相比擬,在購買轎車的時(shí)候,我們很少考慮將怎么使用它或有關(guān)正確的駕駛方法等,在為“它是如此酷、敞亮、時(shí)尚”激動(dòng)之中,一些最好的實(shí)踐和使用往往被丟到腦后。在選擇BI工具的時(shí)候,有一個(gè)特別的功能是用戶非常需要的,我們這里也將直接深入研究,那就是Excel集成。盡管Excel可能是無可爭辯的最主要的BI工具,但它也是導(dǎo)致多種版本真相的主要原因。兩個(gè)使用者同時(shí)查詢一個(gè)中央數(shù)據(jù)倉庫,并把數(shù)據(jù)導(dǎo)入Excel,一個(gè)使用者在Excel中使用一組特殊的標(biāo)準(zhǔn)過濾數(shù)據(jù),并用一些個(gè)人的公式來計(jì)算;另一個(gè)使用者過濾數(shù)據(jù)的方法稍有不同,或許在公式中犯一個(gè)小錯(cuò)誤。誰的電子數(shù)據(jù)表是正確的呢?結(jié)果大量的時(shí)間花費(fèi)在協(xié)調(diào)多種版本之上而不是考察業(yè)務(wù)發(fā)展。在每次查詢更新及產(chǎn)生結(jié)果報(bào)表以后都必須重復(fù)同樣的流程。盡管電子數(shù)據(jù)表存在正確性問題,但是還是有很多因素使得在 BI工具選擇中不能忽略 Excel集成:工具熟悉。使用者很少有時(shí)間獲得數(shù)據(jù)然后去分析, 通常最簡單的方法就是使用他們已經(jīng)熟悉的工具。“按摩(massage)”數(shù)據(jù)的能力?!鞍茨Α睌?shù)據(jù)包括重新分類、過濾、創(chuàng)建公式,以及在某些情況下修理壞數(shù)據(jù)等。理論上說,所有這些都應(yīng)該在 BI流程的早期完成。在報(bào)表部分我們提到,能夠讓使用者重新分類、過濾或在本地 BI工具中隱藏個(gè)人專欄的 BI工具協(xié)作能力,當(dāng)這種功能失效或不存在時(shí),使用者除了把數(shù)據(jù)導(dǎo)入 Excel外幾乎沒有多少選擇。在 Excel電子數(shù)據(jù)表中校正壞數(shù)據(jù)的巨大任務(wù)對于數(shù)據(jù)一致性來說顯然是一場噩夢。然而,如果流程不能適當(dāng)?shù)貜母瓷闲蘩韷臄?shù)據(jù)或修改ETL錯(cuò)誤,使用者無論如何也難以創(chuàng)建一個(gè)有用的報(bào)表。較好的圖表。Excel圖表以及所有對比例、坐標(biāo)軸、標(biāo)注的控制已經(jīng)成為一種事實(shí)上的基準(zhǔn)。如果BI工具不能提供強(qiáng)大的圖表功能,顯然使用者需要把數(shù)據(jù)輸出到 Excel來使用其圖表功能。摘要文件(Briefingbooks )。Excel可以將多個(gè)工作表存儲在一個(gè)工作手冊( workbook )文件中。使用者可以離線訪問所有數(shù)據(jù),這些數(shù)據(jù)可能是通過多種數(shù)據(jù)源或查詢組合成的一個(gè)文件。很少有BI廠家能夠很好地復(fù)制這個(gè)功能。盡管儀表盤功能提供了類似的替換選擇,但通常需要網(wǎng)絡(luò)連接。減少許可證成本。企業(yè)已經(jīng)花費(fèi)了Excel的許可證費(fèi)用,如果他們能夠通過更好地利用Excel減少BI使用者的數(shù)量,那他們就可以節(jié)省BI許可證成本。不過,BI廠家也在逐漸加寬“使用者”的定義,一個(gè)BI使用者已經(jīng)不再是某一個(gè)登錄BI工具的個(gè)人,而是所有能夠接到BI工具輸出(包括電子數(shù)據(jù)表)的人。既然限制Excel是不可能的,關(guān)鍵就是找到既提供Excel集成又能保證單一版本真相的方法。各個(gè)廠家實(shí)現(xiàn)這個(gè)目標(biāo)的方法也不同。最差的,所謂“零支持”就是一次性輸出到Excel,既沒有對該輸出的查賬索引,也沒有連接到中央的查詢。所謂“良好的支持”是指,BI工具跟蹤Excel電子數(shù)據(jù)表的所有權(quán)及所做變化,然后把數(shù)據(jù)表存儲在BI倉庫中。Excel電子數(shù)據(jù)表可以隨著新數(shù)據(jù)更新,特別是能保持與原始查詢文件的連接。需要指出的是,沒有任何單一特性能夠保證單一版本真相,它的實(shí)現(xiàn)部分依賴于廠商提供的功能特性,部分依賴于你必須執(zhí)行的流程。例如,MicroStrategy 的Office 產(chǎn)品就是一個(gè) Excel插件,可以使用戶查詢及更新一個(gè)存在于電子數(shù)據(jù)表環(huán)境或 PowerPoint 和Word 中的報(bào)表。當(dāng)原始報(bào)表的定義或基礎(chǔ)數(shù)據(jù)變化時(shí), 電子數(shù)據(jù)表也隨之變化。同樣的報(bào)表瀏覽可以通過 Web、桌面或電子數(shù)據(jù)表來完成,這樣使用者可以通過他們喜歡的界面來訪問,從而也保證了單一版本真相。把數(shù)據(jù)一次性輸出到 Excel是企業(yè)保持單一版本真相的最大挑戰(zhàn),但好像也是最普遍存在的一種現(xiàn)象。如果你瀏覽的報(bào)表并不是按照你的需求過濾或分類, 你只是簡單地存儲數(shù)據(jù)到 Excel并在那里做分析,BI團(tuán)隊(duì)必需事先有準(zhǔn)備:如果很多使用者都這樣工作, BI團(tuán)隊(duì)就必須在本地 BI工具中提供更好的協(xié)作性,或修改標(biāo)準(zhǔn)報(bào)表定義。不過,如果是個(gè)別需求,那另當(dāng)別論。最后還要指出一點(diǎn),在關(guān)注 Excel集成時(shí),應(yīng)該注意需要哪個(gè)版本的 Excel,以及跨越版本是否有功能上的差異。OLAP有些分析家認(rèn)為 OLAP(OnlineAnalyticalProcessing ,在線分析處理)只對小部分用戶適用。但現(xiàn)在大家普遍認(rèn)為,從斷斷續(xù)續(xù)的信息消費(fèi)者到強(qiáng)大用戶( poweruser )都能從OLAP功能的不同方面獲益。不幸的是, OLAP體系結(jié)構(gòu)和成本經(jīng)常會阻止其廣泛采用。OLAPvs.報(bào)表早在20世紀(jì)90年代,Essbase(當(dāng)時(shí)為Arbor 所擁有,現(xiàn)在是屬于 Hyperion )被看做是另類,所以Arbor 雇傭關(guān)系數(shù)據(jù)庫之父 ——E.F.Codd 來澄清這一稱為 OLAP的新東西。Codd定義了12條準(zhǔn)則,但以下 4條最能清楚地把報(bào)表和 OLAP區(qū)分開來:1. 多維的:用戶從多方位分析數(shù)值,如產(chǎn)品、時(shí)間、地理等。但一個(gè)報(bào)表一般都是基于單一尺度,如在某一個(gè)時(shí)間點(diǎn)上的產(chǎn)品價(jià)格列表。2.快速:當(dāng)使用者在一個(gè)維度中操縱不同的維度及等級時(shí), OLAP意味著快速——思考的速度。如果一個(gè)使用者雙擊以從年度到季度鉆取,為一個(gè)答案等待 24分鐘或24小時(shí)是不可接受的。當(dāng)然,報(bào)表使用者也并不想要慢的報(bào)表,但實(shí)際中確實(shí)很多報(bào)表必須運(yùn)行這么長時(shí)間。改變聚合的等級:為確??深A(yù)測的查詢時(shí)間,OLAP供貨商以不同方法重新聚合數(shù)據(jù)。相反,報(bào)表至少是需要細(xì)節(jié):除了按照產(chǎn)品的銷量外,對于特定順序的數(shù)據(jù),其中可能還有單獨(dú)的排列項(xiàng)??缇暥鹊挠?jì)算:多維帶來了復(fù)雜的計(jì)算。在OLAP中,你可能需要分析百分比貢獻(xiàn)或市場份額,這些分析需要先做某一特定狀態(tài)的銷售小計(jì),然后再計(jì)算對整個(gè)區(qū)域、國家或全球的百分比貢獻(xiàn)。使用者可能通過許多其他維度來分析這個(gè)百分比市場份額,如實(shí)際 vs.預(yù)算,今年 vs.去年,或?yàn)樘囟ǖ囊唤M產(chǎn)品等。這些計(jì)算經(jīng)常必須以特殊的順序執(zhí)行 ,并包含使用者從來沒有見過的一些輸入數(shù)字。但是,詳細(xì)的報(bào)表經(jīng)常依賴于簡單的小計(jì)或報(bào)表本身顯示的一些數(shù)值的計(jì)算。不過記住一點(diǎn),我們僅僅是對報(bào)表和 OLAP加以區(qū)分,并不意味著使用者需要他們的分析工具和報(bào)表工具截然不同。OLAP使用者應(yīng)該從多維數(shù)據(jù)中創(chuàng)建報(bào)表,相反,報(bào)表消費(fèi)者也需要從前僅供 OLAP專用的高度形象的分析 和紅綠燈顯示。怎么滿足這些不同的需求,廠商們也已經(jīng)奮斗了很多年。當(dāng)你選擇一種或多種 BI工具時(shí),你的工作是了解你最需要什么: OLAP,報(bào)表,還是兩者。如果答案是兩者都要,那么就需要仔細(xì)評估報(bào)表和 OLAP的集成。OLAP體系結(jié)構(gòu)在選擇OLAP工具時(shí),OLAP體系結(jié)構(gòu)是需要理解的一個(gè)最重要的標(biāo)準(zhǔn):它會影響很多其他單獨(dú)特征以及你部署系統(tǒng)的能力。最近人們認(rèn)為MOLAP-ROLAP-DOLAP(多維OLAP-關(guān)系型OLAP-桌面OLAP)爭辯已經(jīng)平息。我認(rèn)為,只要廠商還提供這些不同的方法,爭論就會存在。MOLAP使用一種持久穩(wěn)固的立方體結(jié)構(gòu),與關(guān)系型數(shù)據(jù)庫是分離的。HyperionEssbase、MicrosoftAnalysisServices、CognosPowerPlay都是使用了這種方法。因?yàn)橐粋€(gè)立方體包含一個(gè)預(yù)先計(jì)算好的數(shù)據(jù)子集,所以與DOLAP和ROLAP相比響應(yīng)時(shí)間更快速且可以預(yù)測。MOLAP數(shù)據(jù)庫傳統(tǒng)上還具有更大程度的多維計(jì)算,比ROLAP中也更容易實(shí)現(xiàn)。例如,HyperionEssbase使用一個(gè)@DESCENDANTS 功能,讓你將一個(gè)特定級別中的成員指向同一層次(如,一月、二月、三月并列是第一季度的下一級)。盡管一些關(guān)系數(shù)據(jù)庫具有CASE功能,也可以使你在一個(gè)計(jì)算中指向這些行,但并不是所有都能做到,而且計(jì)算并不一定都是直截了當(dāng)。MOLAP的大幅下降是因?yàn)樗切枰狪T支持、管理、維護(hù)的另外一種數(shù)據(jù)存儲。公司抱怨維護(hù)200個(gè)立方體需要很多努力,或公司擁有的是花費(fèi)一個(gè)星期重新計(jì)算的設(shè)計(jì)不良的立方體,這都是很平常的。當(dāng)一個(gè)維空間改變,如增加一個(gè)新的產(chǎn)品或改組業(yè)務(wù)單元,你可能就不得不重新計(jì)算整個(gè)MOLAP立方體。而關(guān)系型OLAP是使用關(guān)系型表格來提供多維分析,MicroStrategy和Informatica是主要的ROLAP廠商。MicroStrategy使用RDBMS中的分區(qū)和聚合表格來提供快速查詢;為實(shí)現(xiàn)復(fù)雜的OLAP計(jì)算,它使用了一個(gè)multipassSQL和臨時(shí)表格的結(jié)合體。ROLAP工具沒有單一立方體的限制,但卻因低的響應(yīng)時(shí)間而苦惱。如果你公司沒有技術(shù)型DBA來熟練調(diào)整數(shù)據(jù)庫,獲取一個(gè)用戶鉆取的結(jié)果可能需要25分鐘的查詢。歷史上,在MicroStrategy中的一個(gè)鉆取經(jīng)常會觸及最根本的關(guān)系表格。不過有了MicroStrategy的OLAPServices后,鉆取會訪問緩存,這也是對 “ROLAP先天就比MOLAP慢”的有力還擊。很多MOLAP廠商使用ROLAP和MOLAP相結(jié)合的方法,這種方法被稱為 hybridOLAP(HOLAP)。例如,MicrosoftAnalysisServices 就能夠使用ROLAP體系結(jié)構(gòu)來對付大數(shù)據(jù)量; HyperionEssbase 也能在關(guān)系型表格中存儲大量維空間。 像其他ROLAP工具一樣,其響應(yīng)時(shí)間還是要比嚴(yán)格使用MOLAP慢,所以很多執(zhí)行繼續(xù)使用MOLAP存儲來保證快速分析。DOLAP代表桌面OLAP,是因?yàn)楹芏嗵幚硇枰谑褂谜叩淖烂鎭硗瓿?。也有人把它叫做?dòng)態(tài)OLAP(dynamicOLAP),以突出微小的立方體是如何動(dòng)態(tài)創(chuàng)建的,也許在桌面上,但大多是在中間層的應(yīng)用服務(wù)器上。與MOLAP不同,這種情況IT部門不需要提前創(chuàng)建大型立方體,而是當(dāng)使用者運(yùn)行查詢時(shí)動(dòng)態(tài)創(chuàng)建立方體。相比MOLAP和ROLAP,其一個(gè)立方體中的數(shù)據(jù)量和維空間計(jì)算是有限的(盡管也可以達(dá)到GB級別)。這些立方體更適合看做是個(gè)人立方體。DOLAP的最大好處是靈活性和維護(hù):立方體不需要提前創(chuàng)建,當(dāng)你公司增加一個(gè)新產(chǎn)品或重組部門時(shí),這些變化也將在你更新查詢的時(shí)候自動(dòng)表現(xiàn)。不過,DOLAP工具同樣也遭受與ROLAP一樣的RDBMS性能的所有風(fēng)險(xiǎn)。由于具有從多種數(shù)據(jù)源中抽取數(shù)據(jù)的能力,MOLAP工具經(jīng)常被成功應(yīng)用于小數(shù)據(jù)倉庫的平臺。這對于企業(yè)信息架構(gòu)來說顯然是不理想的。因此,來自多種數(shù)據(jù)源的數(shù)據(jù)最好能裝入一個(gè)中央數(shù)據(jù)倉庫中,然后才能用于組裝MOLAP立方體。盡管,在實(shí)際中一些公司沒有構(gòu)建數(shù)據(jù)倉庫的能力和資金,但具有數(shù)據(jù)倉庫結(jié)構(gòu)的 MOLAP立方體確實(shí)能受益于快速的立方體創(chuàng)建。對 BusinessObjects 的microcube 來說,一個(gè)立方體可以基于多種查詢、存儲的流程、 XML文件及電子表格等來創(chuàng)建,CognosPowerCubes 和HyperionEssbasecubes 也能從多種數(shù)據(jù)源創(chuàng)建。另外,對一個(gè)管理者來說,能夠很輕松地設(shè)計(jì)、構(gòu)建并調(diào)整 OLAP平臺是非常關(guān)鍵的。對于最終使用者來說,諸如屬性分析、 假定性分析、紅綠燈顯示、時(shí)間周期分析等也是非常重要的。管理管理方面的特性可能并不會引起商業(yè)使用者的興趣, 但卻同樣重要。好的部署應(yīng)該既考慮到最終使用者的需求,也考慮到 BI工具的管理問題。如果沒有全面考慮二者,企業(yè)最終所有的無非兩種結(jié)果:看似很好但需要相當(dāng)?shù)?IT資源來維護(hù)的工具,或沒有人使用的系統(tǒng)。安全性我承認(rèn),我憎惡 BI安全。并不是說我沒有看到需求,而是厭惡跟蹤更多的用戶 ID和口令!沒有什么比當(dāng)一個(gè)BI使用者很高興地訪問儀表盤時(shí)卻總被 “不正確的口令”所折磨能更快地扼殺 BI執(zhí)行。一個(gè)教訓(xùn)是:你可能花費(fèi)了大量時(shí)間來選擇 BI工具,但如果你沒有花費(fèi)足夠時(shí)間計(jì)劃安全性,工具早晚會被破壞及登錄錯(cuò)誤擊垮。安全可以分為兩個(gè)階段,首先是鑒定(authentication) ——一用戶名和口令的有效性; 第二步是授權(quán)(authorization )——在鑒定以后允許其訪問什么。 LDAP(LightweightDirectoryAccessProtocol) 服務(wù)承諾將多用戶 ID和密碼問題減到最少。理論上,一個(gè)公司將擁有一臺目錄服務(wù)器來保存所有員工的用戶名和密碼。公司所有的系統(tǒng),無論是網(wǎng)絡(luò)、BI或ERP,都使用該目錄服務(wù)器來鑒定?,F(xiàn)在,還沒有目錄服務(wù)的清晰標(biāo)準(zhǔn)。Sun的iPlanet、MicrosoftActiveDirectory、Novell的eDirectory是業(yè)界比較領(lǐng)先的產(chǎn)品。BI廠商會支持其中一些或全部。由于歷史的及實(shí)際的原因,大多BI工具繼續(xù)使用它們自己的鑒定機(jī)制。如果你公司還沒有實(shí)現(xiàn)目錄服務(wù)器,你就需要這些機(jī)制;如果你已經(jīng)有了目錄服務(wù)器,你就需要BI工具來鑒別它。授權(quán)比鑒定更雜亂。在授權(quán)中,你可能需要限制一些用戶使用特定的業(yè)務(wù)瀏覽或元數(shù)據(jù)層、個(gè)別報(bào)表、軟件功能以及數(shù)據(jù)等。理想狀態(tài),你需要定義角色(role)或用戶組(groupsofusers),以便這些授權(quán)能夠在組級實(shí)現(xiàn),而不是直接針對上千的個(gè)人用戶。這里有一個(gè)很大的挑戰(zhàn):即使你有一個(gè)LDAP服務(wù)器來做授權(quán),你也不得不在BI工具中復(fù)制所有個(gè)人用戶的ID來為授權(quán)服務(wù)!這種復(fù)制會帶來風(fēng)險(xiǎn)——諸如用戶ID或密碼等一些東西有可能失去同步性。然而,如果你能夠在目錄服務(wù)器中定義組,并且BI工具能夠讀這些組,那還是有希望的。很明顯,很多BI廠商在向這個(gè)方向靠攏。元數(shù)據(jù)元數(shù)據(jù)集成(Metadataintegration)提供很多承諾。首先,它能減輕業(yè)務(wù)視圖的管理;其次,它能給需要對每個(gè)metric的來源、轉(zhuǎn)換以及計(jì)算有一致的、精確定義的業(yè)務(wù)使用者帶來更大的透明。不過,這些也僅僅是承諾。在實(shí)際中, BI基礎(chǔ)架構(gòu)中的每個(gè)組件都有自己的元數(shù)據(jù),并為不同的目標(biāo)而使用。一方面,這種情況存在是因?yàn)樵獢?shù)據(jù)已經(jīng)被當(dāng)做每個(gè)組件的 “私有品”來對待,另一方面,也是因?yàn)槊總€(gè)組件都有自己的要素。使用BI工具的業(yè)務(wù)使用者需要業(yè)務(wù)術(shù)語,使用ETL工具的IT部門則需要知道確切的來源系統(tǒng)、表格名稱以及數(shù)據(jù)元素的起源地。是否要賦予數(shù)據(jù)元素一個(gè)商業(yè)術(shù)語對IT用戶來說并不重要。從BI套件來看,你應(yīng)該考慮你需要共享什么元數(shù)據(jù)?在哪些組件之間共享?過去,BI廠商采取不同的方法來共享數(shù)據(jù),經(jīng)常是提供專有的API。隨著來自O(shè)bjectManagementGroup的CWM(CommonWarehouseMetamodel)被大家接受,廠商們很快就開始提供支持。后來,BusinessObjects和Cognos還使用了MITI(MetaIntegrationTechnologyInc.)提供的一種遵循CWM的元數(shù)據(jù)橋(metadatabridge)。SAS的EnterpriseBIServerversion9也在元數(shù)據(jù)交換方面做了創(chuàng)新。這些都是為元數(shù)據(jù)交換而走出的很好一步。影響分析影響分析(Impactanalysis ),是指當(dāng)你改變或刪除一個(gè)數(shù)據(jù)元素的時(shí)候,能夠知道哪些報(bào)表將受到影響的這樣一種能力。影響分析在 BI架構(gòu)的不同點(diǎn)都有關(guān)。如果是源系統(tǒng)中發(fā)生改變,你怎么能夠知道在業(yè)務(wù)視圖以及最終的報(bào)表中什么將改變?如果是在業(yè)務(wù)視圖中發(fā)生改變, 這種變化是否能夠自動(dòng)傳達(dá)到報(bào)表中?至少,管理員需要有能力識別 BI套件中相互依賴的 BI元素。BusinessObjects 的ETL工具DataIntegrator ,就同元數(shù)據(jù)層或 universes 有很好的影響分析。然而,其元數(shù)據(jù)設(shè)計(jì)工具 Designer 內(nèi)的影響分析卻很少。 MicroStrategy 的影響分析工具更進(jìn)一步:當(dāng)你試圖刪除一個(gè)對象時(shí),它立即會警告你哪些報(bào)表依賴于該對象。使用監(jiān)測不能監(jiān)測BI系統(tǒng)的使用,就如同在夜晚不開前燈和儀表盤駕駛汽車一樣。最糟糕的情況就是你(或你的服務(wù)器)被撞壞,最好也不過你把汽油耗盡(或查詢失?。kS著BI廠商越來越把目標(biāo)鎖定企業(yè)范圍的部署,它們也開始注重提供使用監(jiān)測功能。最初,廠商把BI行為記錄在log文件中,很少在分析應(yīng)用中使用。理想的情況應(yīng)該是當(dāng)數(shù)據(jù)在關(guān)系數(shù)據(jù)庫中被捕捉到時(shí),廠商提供預(yù)建報(bào)表;此外,管理員應(yīng)該能決定哪些行文是要監(jiān)測的,從大量的注冊直到誰訪問哪個(gè)目標(biāo)等。MicroStrategy通過其以服務(wù)器為中心的架構(gòu),在提供監(jiān)測BI使用的工具方面一直是領(lǐng)導(dǎo)者。BusinessObjects也從2001年就推出了其Auditor產(chǎn)品,隨后Cognos、Crystal、Informatica等都推出此功能。不過需要提醒的是,數(shù)據(jù)庫監(jiān)測和BI監(jiān)測并不相同。在數(shù)據(jù)庫層面,你可能會跟蹤數(shù)據(jù)庫領(lǐng)域ORDER.QTY被訪問的頻度;在BI應(yīng)用中,卻需要知道哪些計(jì)算出的metric用戶最常訪問,還包括哪些標(biāo)準(zhǔn)報(bào)表、哪些展示格式以及最大負(fù)荷時(shí)間等。BI工具架構(gòu)最后,我們來關(guān)注結(jié)構(gòu)方面的一些考慮因素,以便能夠結(jié)合上下文幫助你找到適合自己企業(yè)的最好BI工具。BI架構(gòu)的很多方面是從廠商的演示過程中得不到的, 如:是client/server 還是基于Web?使用了什么OLAP方法(MOLAP、ROLAP、DOLAP)?該BI工具是否能容易地定制或嵌入到其他應(yīng)用中?該套件在查詢、報(bào)表、 OLAP、儀表盤以及分析應(yīng)用等不同工具間使用的框架(元數(shù)據(jù)、安全以及基礎(chǔ)架構(gòu))是否是通用的?該服務(wù)是否能跨越多個(gè)服務(wù)器和平臺分布?很多 BI套件架構(gòu)方面的不同,也許只有當(dāng)你安裝、部署或定制產(chǎn)品的時(shí)候才能清晰體會到。SOA由于BI已經(jīng)走向Web以及企業(yè)范圍部署應(yīng)用,今天的 BI工具都具有服務(wù)導(dǎo)向的架構(gòu),即 SOA(ServiceOrientedArchitecture )。SOA允許不同的 BI服務(wù)去執(zhí)行特定的任務(wù),必要的時(shí)候還可以分布到多個(gè)服務(wù)器上。圖2BI工具的SOA7:BI 應(yīng)用服務(wù)器可以運(yùn)行在一個(gè) Web服務(wù)器上,也可以運(yùn)行在一個(gè)特定的應(yīng)用服務(wù)器上。我們以三個(gè)可能的 BI服務(wù)舉例來說:查詢、展現(xiàn)以及時(shí)序安排。如圖 2所示,查詢引擎負(fù)責(zé)查詢數(shù)據(jù)源,可能是一個(gè)數(shù)據(jù)倉庫或 MOLAP立方體。當(dāng)查詢完成后,展示部件必須將查詢結(jié)果轉(zhuǎn)換成有意義的報(bào)表,也可能是圖表和交叉表,而且還需要不同文件格式,如 HTML或PDF。如果一個(gè)用戶預(yù)定了某一個(gè)查詢的時(shí)間, 時(shí)序安排服務(wù)就會不斷地監(jiān)測是否到了已預(yù)定查詢的執(zhí)行時(shí)間, 并在準(zhǔn)確的時(shí)間把它傳遞給查詢服務(wù)。查詢、展示以及時(shí)序安排之間如何溝通,這就是諸如 COM、CORBA、Webservices 協(xié)議等標(biāo)準(zhǔn)起作用的時(shí)候了。當(dāng)然也有一些 BI廠商會使用自己專有的方法來處理這些部件之間的通信。COM和CORBA是支持SOA的比較老的方法,Webservices 標(biāo)準(zhǔn)正處在高速發(fā)展期,其接受度和功能都在不斷提升??蓴U(kuò)展性架構(gòu)有趣的是,好像所有的BI工具都具有向上和向外擴(kuò)展的能力:如果你添加更多強(qiáng)大的硬件(向上擴(kuò)展),它就可以支持更多的用戶;如果你添加更多服務(wù)器(向外擴(kuò)展)并分布服務(wù),它也能支持更多用戶。然而,很多企業(yè)的目標(biāo)是降低復(fù)雜性和成本。撇開對容錯(cuò)的考慮,如果所有的東西都高效地運(yùn)行在一臺服務(wù)器上,你就節(jié)省了硬件和管理的成本。很不幸,目前針對 BI工具還沒有供對比產(chǎn)品用的基準(zhǔn)測試。而且,使用和部署產(chǎn)品的方法也會影響其可擴(kuò)展性。如,更新BusinessObjects全部客戶機(jī)文件比更新其最新的瘦客戶機(jī)文件就要更耗費(fèi)資源。對MicroStrategy來說,數(shù)據(jù)倉庫中聚合的表格越少以及一個(gè)報(bào)表模板中使用的過濾器越少,系統(tǒng)就越慢。不管如何,你也可以根據(jù)一些特性來初步觀察某一產(chǎn)品套件對資源的占用:OLAP體系結(jié)構(gòu)、多線程的流程、查詢管理器、高速緩存等。查詢管理器可以使管理員防止飽和系統(tǒng)中的復(fù)雜及有害查詢。好的BI工具都提供查詢管理器,這樣可以方便控制并發(fā)查詢進(jìn)程的數(shù)量、每一次查詢返回的行的數(shù)量、以及一次查詢運(yùn)行的時(shí)間。理想狀態(tài),這些限制應(yīng)該在每個(gè)服務(wù)器、用戶組、不同任務(wù)或個(gè)別用戶等不同級別中被定制。另一種將這種服務(wù)器負(fù)荷風(fēng)險(xiǎn)減少到最小的方法是高速緩存。如果一個(gè)查詢更新的請求能夠通過高速緩存服務(wù),那么并發(fā)查詢進(jìn)程就會減少。高速緩存還可以幫助BI架構(gòu)中的其他服務(wù),如授權(quán)和展示服務(wù)。當(dāng)然緩存的重要性也是由特定工具的架構(gòu)決定的。如MicroStrategy提供廣泛的緩存,包括SQL、元數(shù)據(jù)甚至查詢結(jié)果。管理員對指定什么獲得緩存以及監(jiān)測緩存是否使用都可以有良好控制??偨Y(jié)本文的目的是幫助大家了解什么BI功能是重要的以及原因。逐個(gè)功能比較是選擇BI工具的一個(gè)方法,但并不是惟一方法。如同你購買轎車的時(shí)候,也許你購買福特的原因是你想購買美國品牌,而你選擇通用可能是因?yàn)槟愕泥従泳褪瞧浣?jīng)銷商,或許你購買Hummer是因?yàn)槟阆矚g其形象。同樣的無形的及策略性的考慮也會出現(xiàn)在選擇BI套件的情形。每一個(gè)BI廠商都有一套獨(dú)特的BI策略。像BusinessObjects、Cognos、Hyperion這些主要競爭者都追求BPM(businessperformancemanagement,業(yè)務(wù)性能管理),但方法卻有截然不同。每個(gè)廠商也都有各自獨(dú)特的“最佳聽音點(diǎn)(sweetspot)”、歷史起源

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論