版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
問(wèn)題:采用一些什么形式將其轉(zhuǎn)換成方便程
序?qū)崿F(xiàn)方式?
如何對(duì)數(shù)據(jù)文件進(jìn)行調(diào)用?食品衣著設(shè)備醫(yī)療交通教育居住雜項(xiàng)北京4934.051512.88981.131294.072328.512383.961246.19649.66天津4249.311024.15760.561163.981309.941639.831417.45463.64河北2789.85975.94546.75833.511010.51895.06917.19266.16山西2600.371064.61477.74640.221027.991054.05991.77245.07內(nèi)蒙古2824.891396.86561.71719.131123.821245.09941.79468.17遼寧3560.211017.65439.28879.081033.361052.941047.04400.16吉林2842.681127.09407.35854.8873.88997.751062.46394.29黑龍江2633.181021.45355.67729.55746.03938.21784.51310.67第2章多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用2.1如何收集和整理多元統(tǒng)計(jì)分析資料2.2
數(shù)據(jù)的數(shù)學(xué)表達(dá)2.3
數(shù)據(jù)矩陣及R語(yǔ)言表示2.4數(shù)據(jù)的R語(yǔ)言表示-數(shù)據(jù)框2.5多元數(shù)據(jù)的R語(yǔ)言調(diào)用2.6多元數(shù)據(jù)的簡(jiǎn)單R語(yǔ)言分析2.1如何收集和整理多元統(tǒng)計(jì)分析資料變量1(X1)變量2(X2)…變量n(Xn)樣本15749159.53976828.891.51樣本26080146.6122177507100…4528443.537353668.587.9樣本n1328442.219615068.572.34(1)多元統(tǒng)計(jì)分析變量表示方法整理資料形式矩陣表示形式當(dāng)這些變量處于同等地位時(shí),可以進(jìn)行相關(guān)分析、聚類(lèi)分析、主成分分析、因子分析、對(duì)應(yīng)分析、多維標(biāo)度等分析;當(dāng)有因變量和自變量之分時(shí),可以進(jìn)行線性回歸分析、廣義線性模型和非線性模型等的數(shù)據(jù)格式;
因變量是分類(lèi)變量時(shí),可以進(jìn)行方差分析模型和判別分析。變量1(X1)變量2(X2)…變量n(Xn)樣本157491176828.891.51樣本2608012177507100…45284153668.587.9樣本572.34(2)數(shù)據(jù)要求每個(gè)變量都須有數(shù)據(jù),不能空缺,否則在計(jì)算中被忽略(3)變量類(lèi)型定量變量:計(jì)量觀測(cè)數(shù)據(jù)。對(duì)每個(gè)觀察單位的某些標(biāo)志所測(cè)到的數(shù)值(有單位)。例如,身高(cm),體重(kg),收入(元)、支出(元)等。定性變量:計(jì)數(shù)觀測(cè)數(shù)據(jù)。將觀察單位按屬性或類(lèi)別分組,清點(diǎn)各組的觀察單位數(shù)。例如,性別數(shù),職業(yè)數(shù)等。定性變量通常需數(shù)量化后才能進(jìn)行多元統(tǒng)計(jì)運(yùn)算。分析時(shí)定性變量常常是按1,2,…識(shí)別的?!纠印?.2數(shù)據(jù)的數(shù)學(xué)表達(dá)數(shù)學(xué)表達(dá)隨機(jī)變量一個(gè)統(tǒng)計(jì)指標(biāo)對(duì)應(yīng)一個(gè)隨機(jī)變量隨機(jī)向量一個(gè)分量對(duì)應(yīng)一個(gè)一維隨機(jī)變量1、隨機(jī)變量總體期望與方差:樣本期望與方差:2、隨機(jī)向量總體期望與方差:樣本期望與方差:2.3數(shù)據(jù)矩陣及R語(yǔ)言表示函數(shù)名用途所在包c(diǎn)向量生成函數(shù)baselength向量長(zhǎng)度函數(shù)basemode對(duì)象類(lèi)型函數(shù)baserbind行合并函數(shù)basecbind列合并函數(shù)basematrix矩陣生成函數(shù)baset矩陣轉(zhuǎn)置函數(shù)basediag對(duì)角陣生成函數(shù)basesolve逆矩陣計(jì)算函數(shù)baseeigen矩陣的特征值與特征向量函數(shù)basechol進(jìn)行Choleskey分解basesvd進(jìn)行奇異值分解baseqr進(jìn)行QR分解basekroneckerkronecker積計(jì)算函數(shù)basedim矩陣維數(shù)base2.4數(shù)據(jù)的R語(yǔ)言表示-數(shù)據(jù)框數(shù)據(jù)框:是一種矩陣形式的數(shù)據(jù),但數(shù)據(jù)框中各列可以是不同類(lèi)型的數(shù)據(jù)。地區(qū)性別(X1)教育程度(X2)觀點(diǎn)(X3)年齡(X4)月收入(X5)A女中不支持552299A女低不支持393378A女中支持333460B男高支持414564B女高不支持553206A女中不支持484043D女高支持363395R語(yǔ)言表示:data.frame(X1,X2,…)限制條件:1.分量必須是向量(數(shù)值,字符,邏輯)、因子、數(shù)值矩陣、列表或者其他數(shù)據(jù)框。2.矩陣、列表和數(shù)據(jù)框?yàn)樾碌臄?shù)據(jù)框提供了盡可能多的變量,因?yàn)樗鼈兏髯該碛辛?、元素或者變量?.?dāng)?shù)值向量、邏輯值、因子保持原有格式,而字符向量會(huì)被強(qiáng)制轉(zhuǎn)換成因子并且它的水平就是向量中出現(xiàn)的獨(dú)立值。4.在數(shù)據(jù)框中以變量形式出現(xiàn)的向量長(zhǎng)度必須一致,矩陣結(jié)構(gòu)必須有一樣的行數(shù)。2.5多元數(shù)據(jù)的R語(yǔ)言調(diào)用從剪切板讀取從文本文件讀取從Excel文件讀取多元數(shù)據(jù)調(diào)用數(shù)學(xué)表達(dá)隨機(jī)變量一個(gè)統(tǒng)計(jì)指標(biāo)對(duì)應(yīng)一個(gè)隨機(jī)變量隨機(jī)向量一個(gè)分量對(duì)應(yīng)一個(gè)一維隨機(jī)變量數(shù)據(jù)程序表達(dá)矩陣存儲(chǔ)數(shù)據(jù)數(shù)據(jù)類(lèi)型一致數(shù)據(jù)框存儲(chǔ)數(shù)據(jù)類(lèi)型可以不一致向量存儲(chǔ)數(shù)據(jù)數(shù)據(jù)類(lèi)型一致創(chuàng)建文本文件,第一行為數(shù)據(jù)框的各變量名,隨后的行為各個(gè)變量的值。X=read.table("textdata.txt")#讀取名為textdata的txt格式文檔(2)從文本文件讀取(1)從剪切板讀取方法:(1)選擇需要進(jìn)行計(jì)算的數(shù)據(jù)塊拷貝之。(2)dat=read.table("clipboard",header=T)clipboard為剪切板,header=T讀入變量名讀表格:R語(yǔ)言可以直接讀取Excel數(shù)據(jù),但一次只能讀Excel工作薄的一個(gè)表格(將Excel數(shù)據(jù)另存為data.csv格式),X=read.table("data.csv")(3)從Excel文件讀取library(RODBC)#加載RODBC軟件包Rcode=odbcConnectExcel("Rcode.xls")#讀取名為Rcode的Excel工作薄codedata=sqlFetch(Rcode,"codedata"))#顯示Rcode中名為codata表單的數(shù)據(jù)close(Rcode)
#關(guān)閉Rcode數(shù)據(jù)文件讀工作簿:2.6多元數(shù)據(jù)的簡(jiǎn)單R語(yǔ)言分析定量變量分析定性變量分析三因素分析多元數(shù)據(jù)分析1、定量變量分析(1)變量基本特征直方圖:分析數(shù)據(jù)分布特征
hist(x,freq=NULL,...)x數(shù)值向量;freq頻數(shù)還是頻率(2)變量間關(guān)系分析散點(diǎn)圖:分析兩個(gè)變量間關(guān)系
plot(x,y,...)x為橫坐標(biāo),y為縱坐標(biāo)的二元繪圖;當(dāng)只有x時(shí),表示以序號(hào)為橫坐標(biāo),x值為縱坐標(biāo)繪圖;…為其他的繪圖參數(shù)。餅圖:分析單變量分布特征
pie(table(結(jié)果))條形圖:分析單變量分布特征
data=read.table("clipboard",header=T)table(年齡,性別)#二維列聯(lián)表
barplot(table(年齡,性別),beside=T,
col=1:7)(2)兩因素分析以性別分組的年齡條圖以年齡分組的性別條圖三維列鏈表:分析單變量分布特征
ftable(年齡,性別,結(jié)果)
#以年齡、性別排列的結(jié)果頻數(shù)三維列聯(lián)表(2)三因素分析第2
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 國(guó)企臨聘合同范本
- 報(bào)建代理合同范本
- 基本供貨合同范本
- 墓碑清理合同范本
- 就業(yè)畢業(yè)協(xié)議書(shū)
- 2025年AI客服系統(tǒng)應(yīng)用項(xiàng)目可行性研究報(bào)告
- 攪拌拖運(yùn)合同范本
- 敬業(yè)模特合同范本
- 日語(yǔ)購(gòu)買(mǎi)合同范本
- 景觀配套合同范本
- 2025冷凍食品運(yùn)輸合同(肉類(lèi))
- TLR2對(duì)角膜移植術(shù)后MDSC分化及DC成熟的調(diào)控機(jī)制研究
- 建筑設(shè)計(jì)防火規(guī)范-實(shí)施指南
- CJ/T 511-2017鑄鐵檢查井蓋
- 智能采血管理系統(tǒng)功能需求
- 【基于PLC的自動(dòng)卷纜機(jī)結(jié)構(gòu)控制的系統(tǒng)設(shè)計(jì)10000字(論文)】
- 資產(chǎn)移交使用協(xié)議書(shū)
- GB/T 45481-2025硅橡膠混煉膠醫(yī)療導(dǎo)管用
- GB/T 32468-2025銅鋁復(fù)合板帶箔
- 山西交控集團(tuán)招聘筆試內(nèi)容
- 大窯校本教材合唱的魅力
評(píng)論
0/150
提交評(píng)論