版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第頁(yè)共頁(yè)數(shù)據(jù)挖掘技術(shù)的研究論文數(shù)據(jù)挖掘技術(shù)的研究論文【摘要】:^p“:互聯(lián)網(wǎng)+”戰(zhàn)略的施行促進(jìn)了我國(guó)信息技術(shù)的快速開展,數(shù)據(jù)挖掘技術(shù)可以實(shí)現(xiàn)對(duì)海量信息的統(tǒng)計(jì)、分析^p以及利用等,因此數(shù)據(jù)挖掘技術(shù)在生活理論中得到了廣泛的應(yīng)用。因此本文希望通過對(duì)數(shù)據(jù)挖掘技術(shù)的分析^p,分析^p數(shù)據(jù)挖掘技術(shù)在理論中詳細(xì)應(yīng)用的策略,以此更好的促進(jìn)數(shù)據(jù)挖掘技術(shù)在理論中的應(yīng)用?!娟P(guān)鍵詞】:^p:數(shù)據(jù)挖掘;應(yīng)用;開展1數(shù)據(jù)挖掘技術(shù)的概述數(shù)據(jù)挖掘是通過對(duì)各種數(shù)據(jù)信息進(jìn)展有選擇的統(tǒng)計(jì)、歸類以及分析^p等挖掘隱含的有用的信息,從而為理論應(yīng)用提出有用的決策信息的過程。通俗的說數(shù)據(jù)挖掘就是一種借助于多種數(shù)據(jù)分析^p工具在海量的數(shù)據(jù)信息中挖掘模數(shù)據(jù)信息和模型之間關(guān)系的技術(shù)總裁,通過對(duì)這種模型進(jìn)展認(rèn)識(shí)和理解,分析^p它們的對(duì)應(yīng)關(guān)系,以此來(lái)指導(dǎo)各行各業(yè)的消費(fèi)和開展,提供重大決策上的支持。數(shù)據(jù)挖掘技術(shù)是對(duì)海量數(shù)據(jù)信息的統(tǒng)計(jì)、分析^p等因此數(shù)據(jù)挖掘技術(shù)呈現(xiàn)以下特點(diǎn):一是數(shù)據(jù)挖掘技術(shù)主要是借助各種其它專業(yè)學(xué)科的知識(shí),從而建立挖掘模型,設(shè)計(jì)相應(yīng)的模型算法,從而找出其中的潛在規(guī)律等,提醒其中的內(nèi)在聯(lián)絡(luò)性;二是數(shù)據(jù)挖掘主要是處理各行數(shù)據(jù)庫(kù)中的信息,因此這些信息是經(jīng)過預(yù)處理的;三是以構(gòu)建數(shù)據(jù)模型的方式效勞于理論應(yīng)用。當(dāng)然數(shù)據(jù)挖掘并不是以發(fā)現(xiàn)數(shù)據(jù)理論為目的,而是為了在各行各業(yè)的信息中找出有用的數(shù)據(jù)信息,滿足用戶的需求。2數(shù)據(jù)挖掘的功能結(jié)合數(shù)據(jù)挖掘技術(shù)的概述,數(shù)據(jù)挖掘主要詳細(xì)以下功能:一是自動(dòng)預(yù)測(cè)趨勢(shì)和行為。數(shù)據(jù)挖掘主要是在復(fù)雜的數(shù)據(jù)庫(kù)中尋找自己有用的信息,以往的信息搜索需要采取手工分析^p的方式,如今通過數(shù)據(jù)挖掘可以快速的將符合數(shù)據(jù)本身的數(shù)據(jù)找出來(lái);二是關(guān)聯(lián)分析^p。關(guān)聯(lián)性就是事物之間存在某種的聯(lián)絡(luò)性,這種事物必需要在兩種以上,數(shù)據(jù)關(guān)聯(lián)是在復(fù)雜的數(shù)據(jù)中存在一類重要的可被發(fā)現(xiàn)的`知識(shí);三是概念描繪。概念描繪分為特征性描繪和區(qū)別性描繪;四是偏向檢測(cè)。3數(shù)據(jù)挖掘技術(shù)的步驟分析^p3.1處理過程數(shù)據(jù)挖掘雖然可以實(shí)如今復(fù)雜的數(shù)據(jù)庫(kù)中尋求自己的數(shù)據(jù)資,但是其需要建立人工模型,根據(jù)人工模型實(shí)現(xiàn)對(duì)數(shù)據(jù)的統(tǒng)計(jì)、分析^p以及利用等。3.2關(guān)鍵技術(shù)由于數(shù)據(jù)挖掘涉及到很多專業(yè)學(xué)科,因此相對(duì)來(lái)說,數(shù)據(jù)挖掘技術(shù)交融多門專業(yè)技術(shù)學(xué)科的知識(shí),結(jié)合理論,數(shù)據(jù)挖掘技術(shù)主要應(yīng)用到以下算法和模型:一是傳統(tǒng)統(tǒng)計(jì)方法。采取傳統(tǒng)的統(tǒng)計(jì)方法主要有抽樣技術(shù),也就是采取相應(yīng)的策略對(duì)數(shù)據(jù)進(jìn)展合理的抽樣。多元化統(tǒng)計(jì)和統(tǒng)計(jì)預(yù)測(cè)方法;二是可視化技術(shù),可視化技術(shù)是數(shù)據(jù)挖掘技術(shù)的熱點(diǎn),它是采取可視化技術(shù)與數(shù)據(jù)挖掘過程的結(jié)合,以直觀的圖形等使人們更好地進(jìn)展數(shù)據(jù)挖掘技術(shù);三是決策樹。決策樹需要對(duì)數(shù)據(jù)庫(kù)進(jìn)展幾遍的掃描之后,才能完成,因此其在詳細(xì)的處理過程中可能會(huì)包括很多的預(yù)測(cè)變量情況;四是4)聚類分析^p方法。聚類分析^p方法是一種非參數(shù)分析^p方法,主要用于分析^p樣本分組中多維數(shù)據(jù)點(diǎn)間的差異和聯(lián)絡(luò)。判別分析^p法需要預(yù)先設(shè)定一個(gè)指針變量,假設(shè)總體為正太分布,必須嚴(yán)格遵守?cái)?shù)理根據(jù)。而聚類分析^p那么沒有這些假設(shè)和原那么,只需要通過搜集數(shù)據(jù)和轉(zhuǎn)換成相似矩陣兩個(gè)步驟,就能完成聚類分析^p的全過程。聚類分析^p主要用于獲取數(shù)據(jù)的分布情況,可以簡(jiǎn)單方便的發(fā)現(xiàn)全局的分布形式,識(shí)別出密集和系數(shù)區(qū)域;此外,對(duì)于單個(gè)類的分析^p也有很強(qiáng)的處理才能,能深化分析^p每個(gè)類的特征,并找出變量和類之間的內(nèi)在聯(lián)絡(luò)?;陂g隔、層次、密度和網(wǎng)絡(luò)的方法是最常用的聚類分析^p方法。4數(shù)據(jù)挖掘技術(shù)的理論應(yīng)用數(shù)據(jù)挖掘技術(shù)雖然在我國(guó)開展的時(shí)間還不長(zhǎng),但是其在理論中的應(yīng)用已經(jīng)非常的廣泛,因?yàn)閿?shù)據(jù)挖掘技術(shù)在理論中的應(yīng)用價(jià)值是非常大的,其可以提取隱藏在數(shù)據(jù)背后的有用信息,詳細(xì)來(lái)看,其主要應(yīng)用在:(1)在醫(yī)學(xué)上的應(yīng)用。人體的奧秘是無(wú)窮無(wú)盡的,人類遺傳密碼的信息、人類疾病史和治療方法等,都隱含了大量數(shù)據(jù)信息。采用數(shù)據(jù)挖掘來(lái)解決這些問題,將給相關(guān)工作者的工作帶來(lái)很大方便。此外,醫(yī)院內(nèi)部醫(yī)藥器具的管理、病人檔案資料的整理、醫(yī)院內(nèi)部構(gòu)造的管理等,也是龐大的數(shù)據(jù)庫(kù)。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于醫(yī)學(xué)領(lǐng)域,深化分析^p人類疾病間的內(nèi)在聯(lián)絡(luò)和規(guī)律,幫助醫(yī)生進(jìn)展診斷和治療,可以有效進(jìn)步醫(yī)生診斷的準(zhǔn)確率,對(duì)人類的安康和醫(yī)療事業(yè)的開展有非常重要的作用。(2)在電信業(yè)中的應(yīng)用。隨著三網(wǎng)交融技術(shù)的不斷開展,傳統(tǒng)的電信業(yè)務(wù)已經(jīng)不能滿足當(dāng)前社會(huì)開展的需求,而是側(cè)重通信、圖像以及網(wǎng)絡(luò)等業(yè)務(wù)的交融,而實(shí)現(xiàn)“三網(wǎng)交融”的關(guān)鍵技術(shù)是實(shí)現(xiàn)對(duì)數(shù)據(jù)的分析^p與統(tǒng)計(jì),因?yàn)槿W(wǎng)交融會(huì)帶來(lái)更多的數(shù)據(jù),這些數(shù)據(jù)都需要充分的挖掘,以此實(shí)現(xiàn)“三網(wǎng)交融”戰(zhàn)略的實(shí)現(xiàn)。將數(shù)據(jù)挖掘技術(shù)與電信業(yè)務(wù)有效的結(jié)合起來(lái),可以進(jìn)步資利用率,更深化的理解用戶的行為,促進(jìn)電信業(yè)務(wù)的推廣,幫助各行各業(yè)獲取更大的經(jīng)濟(jì)效益。(3)在高校貧困生管理的應(yīng)用。貧困生管理分析^p系統(tǒng)主要應(yīng)用了數(shù)據(jù)倉(cāng)庫(kù)技術(shù)以及數(shù)據(jù)挖掘技術(shù),其主要是將高校貧困生的各種信息統(tǒng)一納入到高校信息管理平臺(tái)中,然后根據(jù)詳細(xì)的貧困生劃分標(biāo)準(zhǔn),建立模型,進(jìn)而對(duì)學(xué)生的信息進(jìn)展統(tǒng)計(jì)與分析^p,實(shí)現(xiàn)對(duì)貧困生信息的科學(xué)管理,便于高校管理者及時(shí)理解學(xué)生的信息。5結(jié)語(yǔ)總之?dāng)?shù)據(jù)挖掘技術(shù)在理論中的廣泛應(yīng)用,為我國(guó)互聯(lián)網(wǎng)+戰(zhàn)略提供了關(guān)鍵技術(shù)支撐,但是由于數(shù)據(jù)挖掘技術(shù)在理論中還存在某些技術(shù)問題,比方各種模型和技術(shù)難于集成、缺少與數(shù)據(jù)庫(kù)系統(tǒng)耦合的通用API或挖掘系統(tǒng)僅提供孤立的知識(shí)發(fā)現(xiàn)功能,難于嵌入大型應(yīng)用等問題導(dǎo)致挖掘技術(shù)在理論中的應(yīng)用還存在缺陷,因此需要我們加大對(duì)數(shù)據(jù)挖掘技術(shù)的進(jìn)一步研究,以此更好地實(shí)現(xiàn)“
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 食品生產(chǎn)落料處理制度
- 商品生產(chǎn)臺(tái)賬制度
- 定期安全生產(chǎn)檢查制度
- 生產(chǎn)巡檢記錄管理制度
- 糕點(diǎn)生產(chǎn)質(zhì)量管理制度
- 機(jī)務(wù)安全生產(chǎn)基本制度
- 2026北京第二外國(guó)語(yǔ)學(xué)院第一批非事業(yè)編制人員招聘5人參考考試試題附答案解析
- 安全生產(chǎn)管理人制度
- 蔬菜平行生產(chǎn)管理制度
- 企業(yè)生產(chǎn)車間門管理制度
- GB/T 43934-2024煤礦土地復(fù)墾與生態(tài)修復(fù)技術(shù)規(guī)范
- GB/T 13077-2024鋁合金無(wú)縫氣瓶定期檢驗(yàn)與評(píng)定
- DB4403-T 427-2024 叉車運(yùn)行監(jiān)測(cè)系統(tǒng)技術(shù)規(guī)范
- 食品殺菌原理培訓(xùn)課件
- GB/T 10739-2023紙、紙板和紙漿試樣處理和試驗(yàn)的標(biāo)準(zhǔn)大氣條件
- 神經(jīng)內(nèi)科練習(xí)題庫(kù)及答案
- GB/T 42973-2023半導(dǎo)體集成電路數(shù)字模擬(DA)轉(zhuǎn)換器
- 肝性腦病教學(xué)查房課件
- 膜式壁制造及檢驗(yàn)工藝演示文稿
- 紅壤區(qū)貧瘠農(nóng)田土壤快速培肥技術(shù)規(guī)程
- 傳染病報(bào)告卡的填寫
評(píng)論
0/150
提交評(píng)論