下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、人工智能總結(jié)一、 概念Olap聯(lián)機分析處理(OLAP)是數(shù)據(jù)倉庫系統(tǒng)的主要應(yīng)用,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀 易憧的查詢結(jié)果。OLAP工具是針對特定問題的聯(lián)機數(shù)據(jù)訪問與分析。它通過多維的方式對數(shù)據(jù)進行分析、查詢和報表。維是 人們觀察數(shù)據(jù)的特定角度。例如,一個企業(yè)在考慮產(chǎn)品的銷傳情況時,通常從時間、地區(qū)和產(chǎn)品的不同角度來 深入觀察產(chǎn)品的銷傳情況。這里的時間、地區(qū)和產(chǎn)品就是維。數(shù)據(jù)倉庫數(shù)據(jù)倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrated)相對穩(wěn)定 的(Non-Volatile )反映歷史變化(Time Vari
2、ant)的數(shù)據(jù)集合,用于支持管理決策(Decision Making Suppora)。為何要建立數(shù)據(jù)倉庫一期,人們己經(jīng)提出了建立數(shù)據(jù)倉庫的構(gòu)想?!皵?shù)據(jù)倉庫一詞最早是在1900年,由Bill Inmon先生提出的,其描述如下:數(shù)據(jù)倉庫是為支持企業(yè)決策而特別設(shè)計和建立的數(shù)據(jù)集合。企業(yè)建立數(shù)據(jù)倉庫是為了填補現(xiàn)有數(shù)據(jù)存儲形式己經(jīng)不能滿足信息分析的需要。數(shù)據(jù)倉庫理論中的一個核心 理念就是:事務(wù)型數(shù)據(jù)和決策支持型數(shù)據(jù)的處理性能不同。企業(yè)在它們的事務(wù)操作收集數(shù)據(jù)。在企業(yè)運作過程中:隨著定貨、銷售記錄的進行,這些事務(wù)型數(shù)據(jù)也連續(xù) 的產(chǎn)生。為了引入數(shù)據(jù),我們必須優(yōu)化事務(wù)型數(shù)據(jù)庫。處理決策支持型數(shù)據(jù)時,一些問題
3、經(jīng)常會被提出:哪類客戶會購買哪類產(chǎn)品?促銷后銷傳額會變化多少?價 格變化后或者商店地址變化后銷傳額又會變化多少呢?在某一段時間內(nèi),相對其他產(chǎn)品來說哪類產(chǎn)品特別容易賣呢? 哪些客戶增加了他們的購買額?哪些客戶又削減了他們的購買額呢?事務(wù)型數(shù)據(jù)庫可以為這些問題作出解答,但是它所給出的答案往往并不能讓人十分滿意。在運用有限的計算 機資源時常常存在著競爭。在增加新信息的時候我們需要事務(wù)型數(shù)據(jù)庫是空閑的。而在解答一系列具體的有關(guān)信息分 析的問題的時候,系統(tǒng)處理新數(shù)據(jù)的有效性又會被大大降低。另一個問題就在于事務(wù)型數(shù)據(jù)總是在動態(tài)的變化之中的。 決策支持型處理需要相對穩(wěn)定的數(shù)據(jù),從而問題都能得到一致連續(xù)的解答
4、。數(shù)據(jù)倉庫的解決方法包括:將決策支持型數(shù)據(jù)處理從事務(wù)型數(shù)據(jù)處理中分離出來。數(shù)據(jù)按照一定的周期(通 常在每晚或者每周末),從事務(wù)型數(shù)據(jù)庫中導(dǎo)入決策支持型數(shù)據(jù)庫一一既“數(shù)據(jù)倉庫氣數(shù)據(jù)倉庫是按回答企業(yè)某方面 的問題來分“主題”組織數(shù)據(jù)的,這是最有效的數(shù)據(jù)組織方式。數(shù)據(jù)倉庫與數(shù)據(jù)庫的區(qū)別數(shù)據(jù)倉庫的出現(xiàn),并不是要取代數(shù)據(jù)庫。目前,大部分?jǐn)?shù)據(jù)倉庫還是用關(guān)系數(shù)據(jù)庫管理系統(tǒng)來管理的??梢?說,數(shù)據(jù)庫、數(shù)據(jù)倉庫相輔相成、各有千秋。數(shù)據(jù)庫是面向事務(wù)的設(shè)計,數(shù)據(jù)倉庫是面向主題設(shè)計的。數(shù)據(jù)庫一般存儲在線交易數(shù)據(jù),數(shù)據(jù)倉庫存儲的一般是歷史數(shù)據(jù)。數(shù)據(jù)庫設(shè)計是盡量避免冗余,一般采用符合范式的規(guī)則來設(shè)計,數(shù)據(jù)倉庫在設(shè)計是有意
5、引入冗余,采用反范 式的方式來設(shè)計。數(shù)據(jù)庫是為捕獲數(shù)據(jù)而設(shè)計,數(shù)據(jù)倉庫是為分析數(shù)據(jù)而設(shè)計,它的兩個基本的元素是維表和事實 表。支持度關(guān)聯(lián)規(guī)則是支持度和信任度分別滿足用戶給定閾值的規(guī)則。信任度是指蘊含的強度,即事務(wù)D中c%的包含X的交易同時包含XY。若X的支持度是support (x),規(guī)則的信任度 為即為:support (XY) /support (X),這是一個條件概率 P (Y|X),即 confidence (XY) = P (Y|X)。支持度閾值是指用戶指定的支持度的上下限。若兩個或多個變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。假設(shè)是項的集合。給定一個交易數(shù)據(jù)庫,其中每個事務(wù)(Tra
6、nsaction)!是I的非空子集,艮K每一個交易都與 一個唯一的標(biāo)識符TID(Transaction ID)對應(yīng)。關(guān)聯(lián)規(guī)則是形如的蘊涵式,其中旦,X和Y分別稱為關(guān)聯(lián)規(guī)則 的先導(dǎo)(antecedent 或 left - hand- si de, LHS)和后繼(consequent 或 right - hand - side, RHS)。關(guān)聯(lián)規(guī)則在 D 中的支持度(support)是D中事務(wù)包含的百分比,即概率;置信度(confidence)是包含X的事務(wù)中同時包含Y 的百分比,即條件概率。關(guān)聯(lián)規(guī)則是有趣的,如果滿足最小支持度閾值和最小置信度閾值。這些閾值由用戶或 者專家設(shè)定。關(guān)聯(lián)規(guī)則:局部/
7、整體 支持度二紅車/所有車 置信度二出禍紅車/所有紅車 例見附錄附錄:表1:關(guān)聯(lián)規(guī)則的簡單例子TlD網(wǎng)球拍網(wǎng)球運動鞋羽毛球111102110031000410105011161100用一個簡單的例子說明。表1是顧客購買記錄的數(shù)據(jù)庫D,包含6個事務(wù)。項集1=網(wǎng)球拍,網(wǎng)球,運動鞋,羽毛球??紤]關(guān)聯(lián)規(guī)則:網(wǎng)球拍網(wǎng)球。事務(wù)1,2,3,4,6包含網(wǎng)球拍,事務(wù)1,2,5,6同時包含網(wǎng)球拍和網(wǎng)球。支持度,置信度。若給定最小支持度a = 0.5,最小支持(置信)度0 = 0.8,關(guān)聯(lián)規(guī)則網(wǎng)球拍網(wǎng)球是有趣的, 認為購買網(wǎng)球拍和購買網(wǎng)球之間存在關(guān)聯(lián)。4.數(shù)據(jù)挖掘數(shù)據(jù)挖掘(Data Mining),就是從大量數(shù)據(jù)中
8、獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡 過程。數(shù)據(jù)挖掘的廣義觀點:數(shù)據(jù)挖掘就是從存放在數(shù)據(jù)庫,數(shù)據(jù)倉庫或其他信息庫中的大量的數(shù)據(jù)中“挖掘” 有趣知識的過程。大量數(shù)曰鈕珥預(yù)處理敬的狒決策規(guī)則。財盼析f規(guī)則評價提取:數(shù)據(jù)清理:把明顯的錯誤清理離散化:連續(xù)-離散,大-小離散不完備數(shù)據(jù):空數(shù)據(jù)(刪除)不一致數(shù)據(jù):輸入數(shù)據(jù)的條件一樣,但結(jié)果不一致(刪除)0數(shù)據(jù)挖掘:屬性約簡/特征選取去掉不必要的屬性規(guī)則分析:輔助決策5.知識(Rough集)知識是人們對自然現(xiàn)象的認識和從中總結(jié)的規(guī)律,經(jīng)驗。在粗糙集理論中,“知識”被認為是一種分類能力。人們的行為是基于分辨現(xiàn)實的或抽象的對象的能力,分類
9、過程中,相差不大的個體被歸于同一類,基本集(elementary set)定義為由論域中相互間不可分辨的對象組成的 集合。二、簡答1. P、 NP、 NPC、 NP-HardP問題:簡單的說,就是存在多項式時間的算法解決該問題NP問題:不一定存在多項式時間的算法解決該問題(也許有也許沒有),但是一定可以在多項式時間判斷該 解是否是源問題的最優(yōu)解NP完全(NPC)問題:首先,NP完全問題是NP問題,但是這類問題確根本找不到多項式時間的算法求解NP難(NPH)問題:NP難就是非多項式時間的算法所以 PNP, NPCNP NPCNPH2.啟發(fā)式算法和盲目搜索算法(書P60)啟發(fā)式策略就是利用與問題有
10、關(guān)的啟發(fā)信息進行搜索?!皢l(fā)”是對發(fā)現(xiàn)和發(fā)明操作算子及搜索方法的研究。在狀態(tài)空間的搜索中,啟發(fā)式被定義成一系列操作算子, 并能從狀態(tài)空間中選擇最優(yōu)希望到達問題解的路徑。啟發(fā)式搜索時考慮特定問題領(lǐng)域可運用的知識,動態(tài)地確定調(diào)用操作算子的步驟,優(yōu)先選擇較合適的操作算子, 盡量減少不必要的搜索,以求盡快地到達結(jié)束狀態(tài),提高搜索效率。盲目搜索是指在不具有對特定問題的任何有關(guān)信息的條件下,按固定的步驟(依次或隨即調(diào)用操作算子)進行 搜索,他能快速地運用一個操作算子。啟發(fā)式搜索一般優(yōu)于盲目搜索,但不可過于追求更多的甚至完整的啟發(fā)信息。同構(gòu)和同態(tài)(書P19、書P18)同構(gòu)在抽象代數(shù)(abstract alg
11、ebra)中,同構(gòu)(isomorphism)指的是一個保持結(jié)構(gòu)的雙射(bijection) 在更一般的范 疇論語言中,同構(gòu)指的是一個態(tài)射,且存在另一個態(tài)射,使得兩者的復(fù)合是一個恒等態(tài)射。同構(gòu)是在數(shù)學(xué)對象之間定義的一類映射,它能揭示出在這些對象的屬性或者操作之間存在的關(guān)系。若兩個數(shù)學(xué)結(jié)構(gòu) 之間存在同構(gòu)映射,那么這兩個結(jié)構(gòu)叫做是同構(gòu)的。假設(shè)M, 是兩個乘集,也就是說M和W是兩個各具有一個閉合的結(jié)合法(一般寫成乘法)的代數(shù)系,。 是M射到M的雙射,并且任意兩個元的乘積的像是這兩個元的像的乘積,即對于M中任意兩個元a, b,滿足。(ab) =o (a) o (b);也就是說,當(dāng)a-* o (a),。(
12、b)時,a。(a b),那么這映射。就叫做M到M上的同構(gòu)。又稱M與M同構(gòu),記作M。回溯法(P61) 回溯法(探索與回溯法)是一種選優(yōu)搜索法,按選優(yōu)條件向前搜索,以達到目標(biāo)。但當(dāng)探索到某一步時,發(fā)現(xiàn)原先選 擇并不優(yōu)或達不到目標(biāo),就退回一步重新選擇,這種走不通就退回再走的技術(shù)為回溯法,而滿足回溯條件的某個狀 態(tài)的點稱為“回溯點”。帶回溯策略的搜索時從初始狀態(tài)出發(fā),不停地、試探性的尋找路徑直到他到達目的狀態(tài)或不可解結(jié)點一“死胡同”, 如他遇到不可解結(jié)點就回溯到路徑中最近的父節(jié)點上,查看該結(jié)點是否還有其他的子結(jié)點未被擴展,如有,則沿這 些子節(jié)點繼續(xù)搜索;如找到目的狀態(tài),就成功退出搜索,返回解題路徑。三、 狀態(tài)空間(書P19)狀態(tài)空間是利用狀態(tài)變量和操作符號,表示系統(tǒng)或問題有關(guān)知識的符號體系,它是一個四元組:(S, 0, SO, G)其中:S是所有狀態(tài)的集合,。是所有操作算子的集合,SO是初始狀態(tài),G是結(jié)束狀態(tài)。狀態(tài)空間法是一種基于解答空間的問題表示和求解方法,它是以狀態(tài)和操作符為基礎(chǔ)的。在利用狀態(tài)空間圖表 示時,從某個初始狀態(tài)開始,每次加一個操作符,遞增地建立起操作符的試驗序列,直到達到目標(biāo)狀態(tài)為止。由于 狀態(tài)空間法需要擴展過多的節(jié)點,容易出現(xiàn)“組合爆炸”,因而只適用于表示比較簡單的問題。四、算法1.九宮圖
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- G1工業(yè)鍋爐司爐試題及答案(100題)
- rohs考試試題及答案
- 醫(yī)學(xué)課程藥學(xué)考試題庫及答案
- 2026字節(jié)跳動校招面筆試題及答案
- 初級考試題會計基礎(chǔ)題及答案
- 未來五年羊肉企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略分析研究報告
- 2026黑龍江農(nóng)業(yè)職業(yè)技術(shù)學(xué)院公開招聘博士3人備考題庫附答案
- 五險一金待遇優(yōu)厚!濱州經(jīng)開區(qū)渤海實驗學(xué)校擴班高薪急聘小學(xué)語數(shù)英初中英語游泳教師!備考題庫必考題
- 北辰集團2026屆校園招聘備考題庫附答案
- 吉安市2025年度市直事業(yè)單位公開選調(diào)工作人員【70人】考試備考題庫必考題
- 客房服務(wù)員:高級客房服務(wù)員考試資料
- 人教版三年級上冊豎式計算練習(xí)300題及答案
- GB/T 6974.5-2023起重機術(shù)語第5部分:橋式和門式起重機
- 心臟血管檢查課件
- 運用PDCA循環(huán)管理提高手衛(wèi)生依從性課件
- 二手房定金合同(2023版)正規(guī)范本(通用版)1
- 《高職應(yīng)用數(shù)學(xué)》(教案)
- 點因素法崗位評估體系詳解
- 漢堡規(guī)則中英文
- DB63T 1933-2021無人機航空磁測技術(shù)規(guī)范
- GB/T 5231-2022加工銅及銅合金牌號和化學(xué)成分
評論
0/150
提交評論