企業(yè)研究論文-數(shù)據挖掘與展現(xiàn)在企業(yè)管理中的作用.doc_第1頁
企業(yè)研究論文-數(shù)據挖掘與展現(xiàn)在企業(yè)管理中的作用.doc_第2頁
企業(yè)研究論文-數(shù)據挖掘與展現(xiàn)在企業(yè)管理中的作用.doc_第3頁
企業(yè)研究論文-數(shù)據挖掘與展現(xiàn)在企業(yè)管理中的作用.doc_第4頁
企業(yè)研究論文-數(shù)據挖掘與展現(xiàn)在企業(yè)管理中的作用.doc_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

企業(yè)研究論文-數(shù)據挖掘與展現(xiàn)在企業(yè)管理中的作用作者:何光云馮慶明李曉飛摘要在市場經濟的激烈競爭中,企業(yè)必須把業(yè)務經營同市場需求聯(lián)系起來,在此基礎上做出科學、正確的決策,以求生存。為此,企業(yè)建立自己的數(shù)據庫系統(tǒng),由計算機管理代替手工操作,以此來收集、存貯、管理業(yè)務操作數(shù)據,改善辦公環(huán)境,提高操作人員的工作效率。企業(yè)需要把已經廣泛收集到的數(shù)據集成到數(shù)據倉庫中,以便從業(yè)務數(shù)據中提取有用的信息,幫助他們在業(yè)務管理和發(fā)展上作出即時、正確的判斷,數(shù)據倉庫應運而生。關鍵詞數(shù)據倉庫挖掘展現(xiàn)一、現(xiàn)狀目前商業(yè)決策面臨的最大挑戰(zhàn)不是缺少數(shù)據,而是數(shù)據太多。大部分企業(yè)無法發(fā)掘數(shù)據的價值給公司決策層提供支持。決策人員的困惑在于,一是海量數(shù)據無邊無際,企業(yè)現(xiàn)有的信息系統(tǒng)無法高效地處理;二是數(shù)據混亂,根本找不到解決的方法。如何解決這種普遍存在的問題呢?正確的解決方案,應該是能夠完全整合現(xiàn)有的業(yè)務系統(tǒng),保護已有投資,并能充分地分析數(shù)據,為決策提供支持。而數(shù)據倉庫的挖掘和展現(xiàn)就是這樣一種解決方案,將企業(yè)中現(xiàn)有的數(shù)據轉化為知識,是幫助企業(yè)做出明智的業(yè)務經營決策的工具。二、數(shù)據倉庫的形成上世紀80年代中期,“數(shù)據倉庫之父”WilliamH.Inmon先生在其建立數(shù)據倉庫一書中定義了數(shù)據倉庫的概念,隨后又給出了更為精確的定義:數(shù)據倉庫是在企業(yè)管理和決策中面向主題的、集成的、與時間相關的、不可修改的數(shù)據集合。與其他數(shù)據庫應用不同的是,數(shù)據倉庫更像一種過程,對分布在企業(yè)內部各處的業(yè)務數(shù)據的整合、加工和分析的過程。而不是一種可以購買的產品。數(shù)據倉庫的目的是要建立一種體系化的數(shù)據存貯環(huán)境,將分析決策所需的大量數(shù)據從傳統(tǒng)的操作環(huán)境中分離出來,使分散的、不一致的操作數(shù)據轉換成集成的、統(tǒng)一的信息,企業(yè)內不同單位的成員都可以在此單一的環(huán)境之下,通過運用其中的數(shù)據與信息,發(fā)現(xiàn)全新的視野和新的問題、新的分析與想法,進而發(fā)展出制度化的決策系統(tǒng),并獲取更多經營效益。數(shù)據庫已經成為收集和分布信息的系統(tǒng)的基礎。數(shù)據采集目的在于此后根據數(shù)據庫內容進行正確決策。這些海量數(shù)據的深層隱藏的是很多的商業(yè)模式(Pattern),規(guī)則(Rules),這些隱藏的“商業(yè)知識”對于當前的數(shù)據擁有者來說意義非凡,因此他們可能預測整個集團未來的商業(yè)策略,市場開發(fā)計劃,以及為公司帶來新的盈利點,而要把這些目前還隱藏在大量看似無關聯(lián)的數(shù)據背后的“知識”挖掘出來需要使用專門的統(tǒng)計學或測量方法。三、數(shù)據倉庫的挖掘隨著數(shù)據庫技術、網絡技術的不斷發(fā)展及數(shù)據庫管理系統(tǒng)的廣泛應用,數(shù)據庫中存儲的數(shù)據量急劇增大。大中型企業(yè)每天的數(shù)據增加量都以萬記,然而,如何有效地使用這些數(shù)據卻成為一個問題,因為往往是數(shù)據豐富而知識缺乏,人們目前所使用的數(shù)據庫技術無法將隱藏在數(shù)據背后的重要信息挖掘出來利用,所以如何迅速、準確、有效但適量地提供用戶所需的信息,發(fā)現(xiàn)信息之間潛在的聯(lián)系,支持管理決策就是數(shù)據挖掘和數(shù)據倉庫要解決的問題。數(shù)據挖掘(Datamining),DataMining是一種決策支持過程,它主要基于AI、機器學習、統(tǒng)計學等技術,高度自動化地分析企業(yè)原有的數(shù)據,作出歸納性的推理,從中挖掘出潛在的模式,預測客戶的行為,幫助企業(yè)的決策者調整市場策略,減少風險,作出正確的決策。比如,酒店對客人信息的管理,如果某個客人是某酒店的老主顧,那么該酒店很自然地會知道這位客人的某些習慣和喜好,如是否喜歡靠路邊,是否吸煙,是否喜歡大床,喜歡什么樣的早餐,等等。當客人再次光臨時,不用客人自己提出來,酒店就會提供客人所喜歡的房間和服務。隨著對數(shù)據挖掘需求的不斷增加,以數(shù)據倉庫為基礎的商業(yè)智能已經成為大型企業(yè)未來競爭的重要工具,目前包括IBM、Oracle、SAS、NCR、BO、Brio等眾多技術廠商都提供了各自的獨家方案和產品,但現(xiàn)實問題是如何利用這些工具進行管理信息平臺的架構設計,如何進行系統(tǒng)軟件的規(guī)劃。在商業(yè)智能的理想方案中,管理信息平臺可以全部由工具搭建生成而不用手工編程,技術人員所做的只是寫一個腳本建數(shù)據倉庫,寫幾個SQL語句用于數(shù)據處理,然后按圖索驥畫無數(shù)張展現(xiàn)圖表。但現(xiàn)實遠遠不會如此簡單,由于工具軟件的功能所限,很多地方如果采用工具只能是削足適履,最終無法滿足系統(tǒng)功能要求。在商業(yè)智能系統(tǒng)中最為吸引人的特點是它的多維展現(xiàn)特性,能對一個業(yè)務主題進行多視角(時間、機構、地域、項目)的分析,并能完成鉆取、切片、挖掘等功能。這一點對企業(yè)的管理顯得尤其重要,而想完成這些功能,必須對數(shù)據采用十分復雜的關鍵字存儲方式,要想對其分析就更是難上加難了,在目前如何對已有的數(shù)據進行前端的展現(xiàn)和挖掘是一個十分重要的問題。數(shù)據挖掘的過程我們可以總結為以下幾個方面:(一)數(shù)據清洗(去除噪音數(shù)據和不統(tǒng)一數(shù)據)(二)數(shù)據整合(多個數(shù)據源的數(shù)據匯總到一起)(三)數(shù)據篩選(根據當前要分析的主題從數(shù)據庫中選取出與主題相關的數(shù)據)(四)數(shù)據轉換(整理,轉換數(shù)據使他們便于使用諸如“匯總”,“聚合”等挖掘算法的形式)(五)數(shù)據挖掘(這可是核心的步驟,使用智能化方法來抽取出隱含的模式,規(guī)則)(六)模式評估(對剛才新發(fā)現(xiàn)的“知識”進行驗證評估來檢驗此模式是不是可行)(七)知識表示(將挖掘出來的模式使用可視化的形式顯現(xiàn)給用戶)通過對數(shù)據進行深層次的挖掘和鉆取,我們可以得到隱藏在龐大的雜亂無章的數(shù)據背后的商機,充分運用數(shù)據倉庫的強大功能,可以為企業(yè)管理層提供多視角、深層次的報表,為企業(yè)管理層制定遠大的戰(zhàn)略決策提供依據。四、結束語數(shù)據倉庫的挖掘和展現(xiàn),必將成為企業(yè)發(fā)展中不可缺少的重要組成部分,隨著企業(yè)數(shù)據量的積累,數(shù)據挖掘和展現(xiàn)的需求就會越來越強烈,因此,如何掌握數(shù)據倉庫的挖掘和展現(xiàn)將是企業(yè)需要面對的一個非常重要的問題,這將決定著企業(yè)未來的生存

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論