版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、在網(wǎng)上(檢查數(shù)據(jù)的維度>dim(iris)11505顯示數(shù)據(jù)集中的列名>names(iris)1"Sepal.Length""Sepal.Width""Petal.Length""Petal.Width""Species"顯示數(shù)據(jù)集的內部結構>str(iris)'data.frame':150obs.of5variables:$Sepal.Length:num4.655.44.654.44.9.$Sepal.Width:
2、num3.52.93.1.$Petal.Length:num1.5.$Petal.Width:num0.1.$Species:Factorw/3levels"setosa","versicolor",.:1111111111.顯示數(shù)據(jù)集的屬性>attributes(iris)$names-就是數(shù)據(jù)集的列名1"Sepal.Length""Sepal.Width"
3、;"Petal.Length""Petal.Width""Species"$s-個人理解就是每行數(shù)據(jù)的標號11234567891011121314151617181920212122232425262728293031323334353637383940414142434445464748495051525354555657585960616162636465666768697071727374757677787980818182838485868788899091929394959697989910010110110
4、2103104105106107108109110111112113114115116117118119120121121122123124125126127128129130131132133134135136137138139140141141142143144145146147148149150$class-表示類別1"data.frame"查看數(shù)據(jù)集的前五項數(shù)據(jù)情況>iris1:5,Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies0.2setosa24.93.01.40.2s
5、etosa0.2setosa0.2setosa55.0setosa查看數(shù)據(jù)集中屬性Sepal.Length前10行數(shù)據(jù)>iris1:10,"Sepal.Length"4.65.04.44.9同上>iris$Sepal.Length1:104.65.04.44.9顯示數(shù)據(jù)集中每個變量的分布情況>summary(iris)Sepal.LengthSepal.WidthPetal.LengthPetal.W
6、idthSpeciesMin.:4.300Min.:2.000Min.:1.000Min.:0.100setosa:501stQu.:5.1001stQu.:2.8001stQu.:1.6001stQu.:0.300versicolor:50Median:5.800Median:3.000Median:4.350Median:1.300virginica:50Mean:5.843Mean:3.057Mean:3.758Mean:1.1993rdQu.:6.4003rdQu.:3.3003rdQu.:5.1003rdQu.:1.800Max.:7.900Max.:4.400Max.:6.900M
7、ax.:2.500中各個值出現(xiàn)頻次顯示iris數(shù)據(jù)集列Species>table(iris$Species)setosaversicolorvirginica505050根據(jù)列Species畫出餅圖>pie(table(iris$Species)算出列SepaLLength的所有值的方差>var(iris$Sepal.Length)10.6856935算出列iris$Sepal.Length和iris$Petal.Length的協(xié)方差>cov(iris$Sepal.Length,iris$Petal.Length)11.274315算出列
8、iris$Sepal.Length和iris$Petal.Length的相關系數(shù),從結果看這兩個值是強相關。>cor(iris$Sepal.Length,iris$Petal.Length)10.8717538畫出列iris$Sepal.Length分布柱狀圖>hist(iris$SepaLLength)畫出列iris$SepaLLength的密度函數(shù)圖>plot(density(iris$Sepal.Length)畫出歹列iris$Sepal.Length和iris$Sepal.Width的散點圖>plot(iris$Sepal.Len
9、gth,iris$Sepal.Width)繪出矩陣各列的散布圖>plot(iris)or>pairs(iris)第二步:使用knn包進行Kmean聚類分析將數(shù)據(jù)集進行備份,將列newiris$Species置為空,將此數(shù)據(jù)集作為測試數(shù)據(jù)集>newiris<-iris>newiris$Species<-NULL在數(shù)據(jù)集newiris上運行Kmean聚類分析,將聚類結果保存在kc中。在kmean函數(shù)中,將需要生成聚類數(shù)設置為3>(kc<-kmeans(newiris,3)K-meansc
10、lusteringwith3clustersofsizes38,50,62:K-means算法產生了3個聚類,大小分別為38,50,62.Clustermeans:每個聚類中各個列值生成的最終平均值Sepal.LengthSepal.WidthPetal.LengthPetal.Width15.0060003.4280001.4620000.2460005.9016132.7483874.3935481.43387136.8500003.0736845.7421052.071053Clusteringvector:每行記錄所屬的聚類(2代表屬于第二個聚類,1代表屬于第一個聚類,3代表屬于第三個
11、聚類)1111111111111111111111111111111111111371111111111111122322222222222222222227322222322222222222222222222223233109333332233332323233223333323333233323145332332Withinclustersumofsquaresbycluster:每個聚類內部的距離平方和115.1510039.8209723.87947(between_SS/total_SS=88.4%)組間的距離平方和占了整體距離平方和的的88.4%,也就是說各個聚類間的距離做到了最
12、大Availablecomponents:運行kmeans函數(shù)返回的對象所包含的各個組成部分1"cluster""centers""totss""withinss"5"tot.withinss""betweenss""size"("cluster"是一個整數(shù)向量,用于表示記錄所屬的聚類"centers"是一個矩陣,表示每聚類中各個變量的中心點"totss"表示所生成聚類的總體距離平方和"
13、withinss"表示各個聚類組內的距離平方和"tot.withinss"表示聚類組內的距離平方和總量"betweenss"表示聚類組間的聚類平方和總量"size"表示每個聚類組中成員的數(shù)量)創(chuàng)建一個連續(xù)表,在三個聚類中分別統(tǒng)計各種花出現(xiàn)的次數(shù)>table(iris$Species,kc$cluster)123setosa0500versicolor2048virginica36014根據(jù)最后的聚類結果畫出散點圖,數(shù)據(jù)為結果集中的列"Sepal.Length"和"Sepal.Width",顏
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026陜西中醫(yī)藥大學附屬醫(yī)院博士研究生招聘18人備考題庫及答案詳解1套
- 2026首都師范大學金澤小學招聘教師備考題庫有答案詳解
- 海信集團華東大區(qū)2026屆校園招聘備考題庫及1套參考答案詳解
- 計算機行業(yè)點評:空天一體臨點已至
- 職業(yè)健康監(jiān)護中的應急預案制定與演練
- 職業(yè)健康檔案在員工職業(yè)發(fā)展決策中的數(shù)據(jù)支撐
- 職業(yè)健康促進的投資回報分析
- 職業(yè)健康促進與職業(yè)健康科技賦能
- 金華浙江金華永康市林場招聘編外人員筆試歷年參考題庫附帶答案詳解
- 遂寧2025年四川遂寧射洪市城區(qū)學??颊{在編在職教師15人筆試歷年參考題庫附帶答案詳解
- 云南省2026年普通高中學業(yè)水平選擇性考試調研測試歷史試題(含答案詳解)
- 廣東省花都亞熱帶型巖溶地區(qū)地基處理與樁基礎施工技術:難題破解與方案優(yōu)化
- 家里辦公制度規(guī)范
- 基于知識圖譜的高校學生崗位智能匹配平臺設計研究
- GB 4053.3-2025固定式金屬梯及平臺安全要求第3部分:工業(yè)防護欄桿及平臺
- 環(huán)氧拋砂防滑坡道施工組織設計
- 2025年下屬輔導技巧課件2025年
- 企業(yè)法治建設培訓課件
- 2026中央廣播電視總臺招聘124人參考筆試題庫及答案解析
- 眼科護理與疼痛管理
- 2026年中國聚苯乙烯行業(yè)市場深度分析及發(fā)展前景預測報告
評論
0/150
提交評論