下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
.."數(shù)據(jù)挖掘與商務(wù)智能實(shí)驗(yàn)"實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)題目:關(guān)聯(lián)分析:關(guān)聯(lián)規(guī)那么:王俊學(xué)號(hào):4指導(dǎo)教師:大斌實(shí)驗(yàn)時(shí)間:2016.11.092016年11月12日實(shí)驗(yàn)8關(guān)聯(lián)分析:關(guān)聯(lián)規(guī)那么實(shí)驗(yàn)?zāi)康牧私夂褪煜PSSModeler及其相關(guān)知識(shí);掌握SPSSModeler工具建立Apriori關(guān)聯(lián)規(guī)那么的方法;學(xué)會(huì)運(yùn)用SPSSModeler關(guān)聯(lián)規(guī)那么進(jìn)展相關(guān)的容分析。實(shí)驗(yàn)容本實(shí)驗(yàn)分析的是超市顧客個(gè)人信息和他們的一次購置商品數(shù)據(jù),采用的是關(guān)聯(lián)分析中的Apriori算法。本實(shí)驗(yàn)的數(shù)據(jù)來自文件名為BASKETS.txt的文件。數(shù)據(jù)的主要容包括兩個(gè)局部,第一局部是顧客的個(gè)人信息,主要變量有會(huì)員卡號(hào)〔cardid〕、消費(fèi)金額〔value〕、支付方式〔pmethod〕、性別〔sex〕、是否業(yè)主〔homeown〕、年齡〔age〕、收入〔ine〕;第二局部是顧客的一次購置商品的信息,主要變量有果蔬〔fruitveg〕、鮮肉〔freshmeat〕、奶制品〔dairy〕、罐頭蔬菜〔cannedveg〕、罐頭肉〔cannedmeat〕、冷凍食品〔frozenmeal〕、啤酒〔beer〕、葡萄酒〔wine〕、軟飲料〔softdrink〕、魚〔fish〕、糖果〔confectionery〕,均為二分類型變量,取值T表示購置,F表示未購置,是一種事實(shí)表的數(shù)據(jù)組織格式。本次試驗(yàn)分析的是的哪些商品最有可能購置。具體實(shí)驗(yàn)步驟如下:實(shí)驗(yàn)步驟與結(jié)果步驟1創(chuàng)立Apriori算法數(shù)據(jù)流〔1〕通過"可變文件〞節(jié)點(diǎn)讀入數(shù)據(jù)BASKETS.txt?!?〕選擇建模卡片中的"Apriori〞節(jié)點(diǎn)并將其簡(jiǎn)潔到數(shù)據(jù)中的恰當(dāng)位置,點(diǎn)擊鼠標(biāo),選擇菜單中的編輯選項(xiàng)進(jìn)展參數(shù)設(shè)置。步驟2設(shè)置具體參數(shù)〔1〕在"字段〞下,選擇"使用定制設(shè)置〞選項(xiàng)。在"后項(xiàng)〞和"前項(xiàng)〞框中選擇關(guān)聯(lián)規(guī)那么的后項(xiàng)和前項(xiàng)的變量,本例中分析連帶銷售商品,因此所有商品均被選入后項(xiàng)和前項(xiàng)。如圖8-1〔a〕所示。圖8-1〔a〕〔2〕在"類型〞下,制定當(dāng)前前項(xiàng)最低條件支持度,默認(rèn)值10%;最小規(guī)那么置信度,默認(rèn)值為80%;最大前項(xiàng)數(shù),默認(rèn)為5;勾選"僅包含標(biāo)志變量的真值〞,表示只顯示工程出現(xiàn)的規(guī)那么,而不顯示工程不出現(xiàn)時(shí)的規(guī)那么,這里關(guān)心的是商品的連帶購置。如圖8-1〔b〕所示。圖8-1〔b〕〔3〕在"專家〞的選項(xiàng)下,選擇模式"專家〞選項(xiàng),并選擇評(píng)價(jià)關(guān)聯(lián)規(guī)那么的度量指標(biāo),這里選擇默認(rèn)選項(xiàng)"規(guī)那么置信度〞。如圖8-2所示。圖8-2步驟3結(jié)果運(yùn)行實(shí)驗(yàn)結(jié)果如圖8-3所示。結(jié)果說明,如按第2條關(guān)聯(lián)規(guī)那么,購置啤酒和冷凍食品那么會(huì)同時(shí)購置罐頭蔬菜,樣本中購置啤酒喝冷凍食品的樣本為170;同樣也說明購置啤和冷凍食品的顧客有85.882%的可能購置罐頭蔬菜,該規(guī)那么的支持度為14.6%。本例中產(chǎn)生了三條關(guān)聯(lián)規(guī)那么:啤酒和罐頭蔬菜→冷凍食品〔S=14.6%,C=87.452%〕;啤酒和冷凍食品→罐頭蔬菜〔S=14.6%,C=85.882%〕;冷凍食品和罐頭蔬菜→啤酒〔S=14.6%,C=84.393%〕。同時(shí)三條關(guān)聯(lián)規(guī)那么的提升度〔2.895,2.834,2.88〕都可以承受。因此,啤酒、罐頭蔬菜、冷凍食品是最可能連帶銷售的商品。可以利用關(guān)聯(lián)規(guī)那么考察哪類和顧客符合哪條關(guān)聯(lián)規(guī)律。如果顧客滿足某條關(guān)聯(lián)規(guī)那么,那么可以推斷其有一定可能性同時(shí)購置某種商品,反之,那么無法預(yù)測(cè)。步驟4考察關(guān)聯(lián)規(guī)律〔1〕將Apriori節(jié)點(diǎn)中的模型計(jì)算的結(jié)果添加到數(shù)據(jù)流編輯區(qū)域的恰當(dāng)位置?!?〕點(diǎn)擊鼠標(biāo)右鍵選擇"編輯〞選項(xiàng),進(jìn)展"選項(xiàng)〞的設(shè)置。〔3〕"最大預(yù)測(cè)數(shù)〞中輸入數(shù)值,默認(rèn)為3.〔4〕勾選"忽略不匹配籃工程〞,表示樣本應(yīng)用規(guī)那么時(shí)不能按照順序完全匹配前項(xiàng)的所有工程時(shí),允許采用非精度匹配。勾選"檢查預(yù)測(cè)不在籃中〞,表示樣本應(yīng)用關(guān)聯(lián)規(guī)那么時(shí),給出的后項(xiàng)結(jié)果不應(yīng)出現(xiàn)在前項(xiàng)。如圖8-4所示。圖8-4通過"表〞節(jié)點(diǎn)課觀察具體的結(jié)果。$A、$AC、$A-Rule表示每個(gè)樣本應(yīng)用關(guān)聯(lián)規(guī)那么的推測(cè)結(jié)果、置信度和規(guī)那么編號(hào)。例如在表中向編號(hào)16的顧客運(yùn)用關(guān)聯(lián)規(guī)那么1,可以推測(cè)其有85.9%的可能性同時(shí)購置罐頭蔬菜。當(dāng)然,如果樣本不符合任何關(guān)聯(lián)規(guī)那么,也就是沒有一條關(guān)聯(lián)規(guī)那么中出現(xiàn)的商品出現(xiàn)在顧客的購物清單中,那么推斷結(jié)果為系統(tǒng)缺失值$null$。實(shí)驗(yàn)結(jié)果如圖8-5所示。圖8-5實(shí)驗(yàn)最終圖示如下:實(shí)驗(yàn)分析與擴(kuò)展練習(xí)實(shí)驗(yàn)分析:請(qǐng)總結(jié)分析下面的問題:如果需要關(guān)注的關(guān)聯(lián)規(guī)那么比擬多,或者讀者只是想關(guān)注特定情況下的規(guī)那么,如何使用該軟件工具進(jìn)展相關(guān)的過濾。答:先在導(dǎo)入文件時(shí)候選擇篩選過濾選項(xiàng),根據(jù)自己的需要選取需要的字段;然后在字段中進(jìn)展相關(guān)的篩選和過濾也可以到達(dá)要求,如下圖:在相關(guān)的分析中,如何合理的使用GRI算法得到相應(yīng)的結(jié)果。五、結(jié)論與討論(重點(diǎn))Apriori算法的根本思想是:首先找出所有的頻集,這些項(xiàng)集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持度一樣。然后由頻集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)那么,這些規(guī)那么必須滿足最小支持度和最小可信度。然后使用第1步找到的頻集產(chǎn)生期望的規(guī)那么,產(chǎn)生只包含集合的項(xiàng)的所有規(guī)那么,其中每一條規(guī)那么的右部只有一項(xiàng),這里采用的是中規(guī)那么的定義。一旦這些規(guī)那么被生成,那么只有那些大于用戶給定的最小可信度的規(guī)那么才被留下來。為了生成所有頻集,使用了遞推的方法。關(guān)聯(lián)規(guī)那么的優(yōu)缺點(diǎn):〔1〕優(yōu)點(diǎn):它可以產(chǎn)生清晰有用的結(jié)果;它支持間接數(shù)據(jù)挖掘;可以處理變長(zhǎng)的數(shù)據(jù);它的計(jì)算的消耗量是可以預(yù)見的?!?〕缺點(diǎn):當(dāng)問題變大時(shí),計(jì)算量增長(zhǎng)得厲害;難以決定正確的數(shù)據(jù);容易忽略稀有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025西藏林芝市生態(tài)環(huán)境局工布江達(dá)縣分局招聘1人備考核心試題附答案解析
- 《鄉(xiāng)村振興與文化創(chuàng)意產(chǎn)業(yè)融合發(fā)展中的產(chǎn)業(yè)鏈優(yōu)化研究》教學(xué)研究課題報(bào)告
- 2025年浙江清華長(zhǎng)三角研究院招聘?jìng)淇碱}庫及一套參考答案詳解
- 《CB 3660-2012船廠起重作業(yè)安全要求》專題研究報(bào)告
- 2025國(guó)家電投集團(tuán)數(shù)字科技有限公司招聘10人(第三批)考試重點(diǎn)試題及答案解析
- 2025云南昆明市尋甸縣衛(wèi)生健康系統(tǒng)第二批招聘編外人員40人備考核心題庫及答案解析
- 2025年研學(xué)基地五年規(guī)劃與教育創(chuàng)新報(bào)告
- 雨課堂學(xué)堂在線學(xué)堂云《心手相連:盲文與手語的別樣魅力》單元測(cè)試考核答案
- 2025年農(nóng)產(chǎn)品品牌直播營(yíng)銷報(bào)告
- 贛州市中心城區(qū)城市建設(shè)指揮部招聘勞務(wù)派遣制工作人員筆試重點(diǎn)試題及答案解析
- 欠薪承諾協(xié)議書范本
- 2025年戰(zhàn)備形勢(shì)教育
- 2024版體育賽事贊助對(duì)賭協(xié)議合同范本3篇
- 《現(xiàn)代秘書思維》課件-現(xiàn)代秘書思維的應(yīng)用與提升
- 安全生產(chǎn)責(zé)任保險(xiǎn)事故預(yù)防技術(shù)服務(wù)評(píng)估考評(píng)評(píng)分細(xì)則
- 小學(xué)一年級(jí)下冊(cè)數(shù)學(xué)-期末樂考
- 2024版商品混凝土委托加工合同書范本
- DL5190.4-2019電力建設(shè)施工技術(shù)規(guī)范第4部分:熱工儀表及控制裝置
- 2024年江蘇省海洋知識(shí)競(jìng)賽備考試題庫(含答案)
- 晉中學(xué)院機(jī)械設(shè)計(jì)制造及其自動(dòng)化專業(yè)大一2018-2019學(xué)年機(jī)械制圖與計(jì)算機(jī)繪圖模擬題
- 萬科集團(tuán)財(cái)務(wù)管理制度手冊(cè)
評(píng)論
0/150
提交評(píng)論