下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、如何使用FM連接數(shù)據(jù)原文發(fā)布時間:2018-05-1709:59:03什么是F?FeaturesJoiner是將數(shù)據(jù)連接在一起的轉(zhuǎn)換器,它最接近FeatureMerger(并且可能最終取代它)。它在工作空間中是這樣的:FaalitjlMamaAddressIDAddiSSIDlAddresa審StreetFeatureJoberWLefl:liiflhl11lJoinedUnjoinedLcft1lUnjoiretfl.iijht1PANoMotchQtyPravi仃ceCauniryPo&tcade該工作區(qū)將Facility要素與PostalAddress要素相結(jié)合。你可以看到,代替Requ
2、estor/Supplier這個轉(zhuǎn)換器有Left/Right端口,少一個輸出端口;但除此之外它確實看起來像FeatureMerger。但是,查看參數(shù)對話框會發(fā)現(xiàn)更多差異:JdwiModeLeftAddressIDRight申AddrlDComparisonModeAutomatic.HMX4*1*JoinOn,ConflictResolution和GeometryHandling參數(shù)非常明顯,與FeatureMerger中已有的類似。但是關(guān)鍵參數(shù)是JoinMode。M要了解JoinMode就有必要了解左連接和內(nèi)連接。JoinMode選擇的三種模式是左連接,內(nèi)連接和全連接。模式描述圖片描述Joi
3、nedUnjoinedLeftUnjoinedRightLeftLeft端口要素尋找匹配的要素并且無論是否找到匹配要素都輸出InIjk所有的匹配要素加上沒有匹配的要素?zé)o沒有用上的Right端口要素InnerLeft端口要素尋找匹配的要素并且只輸出匹配了的要素ki世只輸出匹配了的要素沒有找到匹配的Left要素沒有用上的Right端口要素Full無無無論是否找到連接,Left和Right要素都會所有匹配上的要素加上沒有找到匹成Joinedoutput端口輸出配的Left和Right要素理解操作的最簡單方法是:每個圖中的重疊部分總是輸出。這是一個連接,所以這些功能通過連接端口輸出。Left/Inne
4、r/Full參數(shù)不控制連接了的的要素,而是未連接的要素。l在Inner模式下,沒有連接的要素通過UnjoinedLeft或UnjoinedRight端口輸出。l在Left模式下,沒有匹配的Left要素仍然通過Joined端口輸出,沒有匹配的Right要素通過UnjoinedRight端口輸出。l在Full模式下,沒有匹配的Left和Right要素仍然通過Joined端口輸出。Facility列子接下來以Facility/Address為例,如何實現(xiàn)將Facility要素和Address記錄相匹配。iTFacHtyCourtry.oddrss-IDNof*tatdAddressKJStreett
5、yPrinceFeiitureJoiier-RightJ-!?UhjjainBcLefl卜一卜T在Inner模式下,只有匹配了Address的Facility才會通過Joined端口輸出,如果你想得到?jīng)]有匹配的要素,那么通過UnjoinedLeft端口輸出的就是。但是在Left模式下,不管Facility要素是否有匹配的,都會通過Joined端口輸出。輸出的數(shù)據(jù)質(zhì)量并不是很好,但是如果我們知道并不是所有的Facility都有匹配的Address,那這個模式也很好。在Full模式下,Joined端口輸出的要素包括了所有的Address,在這個例子的情況下可能不需要,但是在其他時候可能會用上。到這
6、里,你會注意到FeaturesJoiner沒有與FeaturesMerger“handleduplicatesuppliers參數(shù)等效的功能。要理解這點你需要知道我們的主旨是MatchMultipleJoinMatches為了理解這一點我們來看看包含了要素計數(shù)的數(shù)字:多少要素將從Joined端口輸出呢?這得看情況。如果我們假設(shè)每個Facility和一個Address之間嚴(yán)格1:1匹配,則8個要素將以連接的方式輸出。為什么?因為我們有8對匹配。計數(shù)將如此:ModeoindUnjoinedLeftUnjoinedRightLeft801,463,431Inner801/63,434廠.nlll1J
7、ljTTfeJInnFull模式下的Joined端口輸出的1463442個要素包括了連接上了的8個要素,以及沒有連接上的1463434個要素。這很好。但是,我們可能在Facility和Address表之間沒有這樣一個純粹的1:1匹配。我們可能會遇到1:M,M:1,甚至M:M的情況。假設(shè)每個Facility在Address中有兩個匹配項,我們會得到這個:ModeJoinedUnjoinedLeftUnjoinedRightLeft1601463,42&Inner160lh463d426為什么我們會得到比Left端口輸入的更多的要素呢?因為每一次匹配我們都會得到一條要素,這里出現(xiàn)了16次匹配。這是
8、FeaturesMerger做不到的,它會忽略掉第二個匹配或者創(chuàng)建一個列表,但是FeaturesJoiner是按照SQl等價的方式設(shè)計的,所以它工作的方式不同。事實上在極端的情況下,我們假設(shè)每個Facility都有AddresslD=1,并且每個Address都有AddresslD=1,那么每個Facility都會匹配到每個Address!那么我們會得到8x1463442個匹配。換句話說,在Left或Inner模式下我們可以輸入8個“requestor”要素并且得到11707536個要素,這沒有錯只是可能和你的習(xí)慣不同。輸出順序作為高級主題的一部分,匹配要素從轉(zhuǎn)換器輸出的順序和從Left端口輸
9、入的順序相同。因此如果Left要素在進(jìn)入轉(zhuǎn)換器時安裝特定序,那么對于Left模式或者Inner模式,該順序在輸出中將保持不變。如果在Full模式下要保持完整的順序不變,那么Left和Right要素必須按照順序排序。使用哪個轉(zhuǎn)換器?那么你應(yīng)該使用哪種轉(zhuǎn)換器?那么需要考慮兩個方面:功能和性能。對于使用數(shù)據(jù)庫術(shù)語和功能的用戶來說,F(xiàn)eatureJoiner在功能上來說肯定更好。它旨在模仿SQL,因此結(jié)果應(yīng)該與輸入相同的SQL連接命令相同。關(guān)鍵的輸出差異是FeatureJoine啲每個要素匹配概念。FeatureMerger會讓你創(chuàng)建一個列表。但是我想說,很多時候你立即使用ListExploder將列表分解為要素,所以我不確定在FeatureJoiner中沒有List參數(shù)會帶來多大的不便。另外,如果你確實需要列表,使用ListBuilder對Joined端口輸出的要素進(jìn)行創(chuàng)建列表,并且按照連接關(guān)鍵屬性進(jìn)行分組。這是輸出順序很重要的地方,因為如果FeatureJoiner輸入適當(dāng)排序,你可能可以在ListBuilder中設(shè)置按組排序的輸入。至于性能,F(xiàn)eatureJoiner擁有改進(jìn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 12347-2025鋼絲繩疲勞試驗方法
- 2025年關(guān)于為淄博市檢察機關(guān)公開招聘聘用制書記員的備考題庫帶答案詳解
- 2026年醫(yī)療信息安全管理合同
- 2025年興業(yè)銀行濟(jì)南分行社會招聘備考題庫帶答案詳解
- 惠州市惠城區(qū)衛(wèi)生健康局2025年公開選聘醫(yī)療衛(wèi)生事業(yè)單位領(lǐng)導(dǎo)備考題庫及完整答案詳解一套
- 2025年永康市科學(xué)技術(shù)局工作人員招聘備考題庫及完整答案詳解一套
- 2025年首都醫(yī)科大學(xué)附屬北京朝陽醫(yī)院石景山醫(yī)院派遣合同制職工招聘備考題庫及1套參考答案詳解
- 2025年招商銀行佛山分行社會招聘備考題庫及參考答案詳解一套
- 2025年醫(yī)保系統(tǒng)年終工作總結(jié)
- 2026年高郵市衛(wèi)健系統(tǒng)事業(yè)單位公開招聘高層次人才備考題庫及一套答案詳解
- 2025年下半年度浙江省新華書店集團(tuán)招聘92人易考易錯模擬試題(共500題)試卷后附參考答案
- JJG 539-2016 數(shù)字指示秤宣貫材料
- 兒童寓言故事-烏鴉喝水
- 2023年四川省普通高中學(xué)業(yè)水平合格性考試物理試題(含答案)
- 弱電系統(tǒng)維護(hù)中的安全和文明措施
- 23G409先張法預(yù)應(yīng)力混凝土管樁
- 中國高血壓防治指南修訂版解讀培訓(xùn)課件
- 2024-2025學(xué)年青海省西寧市七年級(上)期末英語試卷(含答案)
- 人教川教版三年級上冊生命生態(tài)安全全冊課件
- 后勤服務(wù)方案(技術(shù)方案)
- 醫(yī)院藥學(xué)信息服務(wù)
評論
0/150
提交評論