版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、整理課件多維數(shù)據(jù)索引方法綜述楊 風 召整理課件為什么要研究多維數(shù)據(jù)索引?n空間數(shù)據(jù)庫n多媒體對象圖象、文本、視頻等特征向量 相似性查詢n數(shù)據(jù)挖掘n聚類、異常檢測等n空間數(shù)據(jù)挖掘n多媒體數(shù)據(jù)挖掘nCAD、分子生物學等整理課件傳統(tǒng)的索引方法n哈希表 n數(shù)值的精確匹配 n不能進行范圍查詢 nB-Trees ISAM n鍵值的一維排序 n不能搜索多維空間整理課件處理多維(multi-dimension)點數(shù)據(jù)的索引結(jié)構(gòu)的比較 nCell 方法 nK-d Trees Quad TreesnK-D-B Trees(J T Robinson SIGMOD1981) nCorner Stitching nGr
2、id files 整理課件處理多維(multi-dimension)點數(shù)據(jù)的索引結(jié)構(gòu)方 法位 置維位 置Point quad-tree自適應k-d磚 墻k-d tree自適應1-d磚 墻Grid file固 定1-d網(wǎng) 格K-D-B-tree自適應1-d磚 墻整理課件處理矩形的方法 n將矩形轉(zhuǎn)變成更高維區(qū)間上的點(二維空間上的矩形可以看作四維空間上的點)。 n用空間充填曲線(space filling curve)將k-d空間映射為1-d空間。這種方法適用于分頁環(huán)境。它用z變換將k-d對象轉(zhuǎn)變?yōu)榫€段 n將原始空間劃分為合適的子空間(重疊或分離的) n劃分為分離子空間 用處理多維點的空間劃分方法
3、,只是若一個矩形被分到多個區(qū)域,可將該矩形分成幾個部分,每一部分都加上標簽,表示他們同屬于一個矩形。 n劃分為有重疊子空間 整理課件R-tree(A. Guttman SIGMOD1984) 整理課件R-tree的特點nR-tree是B-Tree對多維對象(點和區(qū)域)的擴展 nR-tree是一棵平衡樹 n一個多維對象只能被分到一個子空間中去 n若用動態(tài)插入算法構(gòu)建R-tree,在樹的結(jié)點中會引起過多的空間重疊和死區(qū)(dead-space),使算法性能降低 整理課件R-tree的典型算法n查找n插入n選擇葉子結(jié)點n分裂結(jié)點(有多種算法)n調(diào)整樹n必要時增加樹的高度n刪除n找到包含要刪除記錄的葉子
4、結(jié)點n刪除n壓縮樹n必要時減小樹的高度n更新n先刪除老的記錄索引,在插入新的記錄索引整理課件R+-tree (T. Sellis VLDB1987) 整理課件R+-tree 的特點nR+-tree是K-D-B-tree對非0面積對象(不僅可以處理點,也可以處理矩形)的擴展 n不需要覆蓋整個初始空間 nR+-tree比R-tree表現(xiàn)出更好的搜索性能(特別對點的查詢),但要占據(jù)較多的存儲空間 整理課件R*-Tree(N. Beckmann SIGMOD1990) nR*-Tree通過修改插入、分裂算法,并通過引入強制重插機制對R-Tree的性能進行改進。 nR*-Tree和R-Tree一樣允許矩
5、形的重疊,nR*-Tree在選擇插入路徑時同時考慮矩形的面積、空白區(qū)域和重疊的大小,而R-Tree只考慮面積的大小。整理課件SS-Tree (D. A. White ICDE1996 ) 整理課件SS-Tree的特點nSS-Tree對R*-Tree進行了改進,通過以下措施提高了最鄰近查詢的性能:n用最小邊界園代替最小邊界矩形表示區(qū)域的形狀;n增強了最鄰近查詢的性能;n減少將近一半的存儲空間。 nSS-Tree改進了R*-Tree的強制重插機制。 整理課件X-Tree (S. Berchtold VLDB1996) n當維數(shù)增加到5時,R-Tree及其變種中的邊界矩形的重疊將達到90%,因此在高
6、維(high-dimension)情況(=5)下,其性能將變得很差,甚至不如順序掃描。nX-Tree是線性數(shù)組和層狀的R-Tree的雜合體,通過引入超級結(jié)點(supernode),大大地減少了最小邊界矩形之間的重疊。提高了查詢的效率。 整理課件X-Tree的結(jié)構(gòu)整理課件邊界矩形和邊界圓的比較n邊界矩形的直徑(對角線)比邊界圓大, SS-Tree將點分到小直徑區(qū)域。由于區(qū)域的直徑對最鄰近查詢性能的影響較大,因此SS-Tree的最鄰近查詢性能優(yōu)于R*-Tree;n邊界矩形的平均容積比邊界圓小, R*-Tree將點分到小容積區(qū)域;由于大的容積會產(chǎn)生較多的覆蓋,因此邊界矩形在容積方面要優(yōu)于邊界圓。整理
7、課件SR-Tree (N. Katayama SIGMOD1997)整理課件SR-Tree的索引結(jié)構(gòu)整理課件SR-Tree的特點n既采用了最小邊界圓(MBS),也采用了最小邊界矩形(MBR)。n相對于SS-Tree,減小了區(qū)域的面積,提高了區(qū)域之間的分離性。n相對于R*-Tree,提高了最鄰近查詢的性能。整理課件VA-File (R. Weber VLDB1998) nVA-File(Vector Approximation File)是一種簡單但非常有效的方式,它將數(shù)據(jù)空間劃分成2b單元(cell),b表示用戶指定的二進制位數(shù),每個單元分配一個位串。位于某個單元內(nèi)的向量用這個單元近似代替。V
8、A-File本身只是這些近似體的數(shù)組。查詢時,先掃描VA-File,選擇侯選向量,再訪問向量文件進行驗證。 整理課件VA-File的建立整理課件A-Tree (Y. Sakurai VLDB2000) n吸取SR-Tree和VA-File 的長處n引入虛擬邊界矩形VBR(Virtual Bounding Rectangles)整理課件A-Tree的結(jié)構(gòu)整理課件多維索引方法的演變邊界形狀 MBRs(R-tree及其變種)MBSs(SS-Tree)MBRs and MBSs(SR-Tree)整理課件多維索引方法的演變樹結(jié)構(gòu)(R-Tree SS-Tree SR-Tree等)中低維順序結(jié)構(gòu)(線性掃描、
9、VA-File等) 高 維樹結(jié)構(gòu)和順序結(jié)構(gòu)的混合體(X-Tree)索引結(jié)構(gòu) 整理課件多維索引方法的演變空間分割(K-D-B Tree grid file等)數(shù)據(jù)均勻分布數(shù)據(jù)分割(R-Tree SR-Tree X-Tree A-Tree等分割方法 整理課件多維索引方法的演變精確表示(R-Tree X-Tree 順序掃描等)近似表示(VA-File A-Tree)對象的表示方法 整理課件多維索引方法列表nK-D-B Trees(J T Robinson SIGMOD1981)nR-tree(A. Guttman SIGMOD1984)nR+-tree (T. Sellis VLDB1987)nLSD-Tree (A. Henrich VLDB1989)nR*-Tree(N. Beckmann SIGMOD1990)nTV-Tree (K. I. Lin VLDB1994) nSS-Tree (D. A. White ICDE1996 ) nVAMSplit R-Tree (D. A. White SPIE1996)nSR-Tree (N. Katayama SIGMOD1997) 整理課件多維索引方法列表nM-Tree (P.Ciaccia VLDB1997) nVA-File
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年中國歷史文化知識競賽考試題庫及完整答案【全優(yōu)】
- 2026云南師范大學實驗中學盤龍校區(qū)面向教育部直屬師范大學開展公費師范畢業(yè)生招聘備考題庫及答案詳解參考
- 2026北京市水利規(guī)劃設計研究院校園招聘3人備考題庫有完整答案詳解
- 2025至2030中國靈活用工服務平臺商業(yè)模式與合規(guī)風險分析研究報告
- 2025-2030武漢食品加工機械行業(yè)屏幕現(xiàn)狀供需技術評估標準規(guī)劃研究文件
- 2025-2030歐洲食品加工機械行業(yè)市場競爭格局與投資潛力分析報告
- 2025-2030歐洲鋁業(yè)行業(yè)市場供需分析及投資評估規(guī)劃分析研究報告
- 2025-2030歐洲納米技術應用市場前景動態(tài)分析及產(chǎn)業(yè)化評估研究指導
- 2025-2030歐洲消費電子產(chǎn)業(yè)鏈供需分析市場競爭態(tài)勢投資評估策略發(fā)展規(guī)劃
- 2025-2030歐洲汽車電子行業(yè)發(fā)展趨勢供需現(xiàn)狀分析商業(yè)價值評估規(guī)劃
- 中深度鎮(zhèn)靜紅外線全身熱療方法課件
- 第四單元地理信息技術的應用課件 【高效課堂+精研精講】高中地理魯教版(2019)必修第一冊
- 魯科版高中化學必修一教案全冊
- 管理養(yǎng)老機構(gòu) 養(yǎng)老機構(gòu)的服務提供與管理
- 提高隧道初支平整度合格率
- 2022年環(huán)保標記試題庫(含答案)
- 2023年版測量結(jié)果的計量溯源性要求
- 建筑能耗與碳排放研究報告
- GB 29415-2013耐火電纜槽盒
- 中國古代經(jīng)濟試題
- 真空采血管的分類及應用及采血順序課件
評論
0/150
提交評論