下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第R語言讀取xls與xlsx格式文件過程在數(shù)據(jù)分析的過程中,第一步就是讀取數(shù)據(jù)。
通常我們遇到的數(shù)據(jù)是csv格式或者txt格式的數(shù)據(jù),這時我們使用系統(tǒng)自帶的read.csv()與read.table()就可對這些格式的數(shù)據(jù)進行讀取,只是讀取時需注意編碼格式。對于大型csv格式的數(shù)據(jù)(當然小數(shù)據(jù)也可以),可以使用data.table包中的fread()進行讀取可以極大地提升讀取速度。
但當遇到了Excel表生成的文件,讀取起來相對就沒有那么友好。之前的做法是簡單粗暴地直接將我們的xls或xlsx文件利用Excel轉化為csv文件后再進行讀取,亦或者直接就用Python使用pandas庫進行處理,然后就在Python中進行分析。
就是由于之前幾次碰壁,使用網(wǎng)上推薦的一些包來進行讀取,但都以失敗告終。不過這次還是決定解決這個頑疾,對xls與xlsx這兩種文件用R進行讀取。
這幾種方法主要參考:ReadExcelfilesfromR
1.ROOBC
這個包中有函數(shù)可以讀取xlsx格式的文件,但對于現(xiàn)在的我們而言,絕大多數(shù)人的電腦都不能使用這個包,因為其只能用于32位系統(tǒng)的Windows,所以這里不對這個包進行贅述。
2.xlsReadWrite
只能從GitHub中獲得,CRAN上還沒有,也不進行過多的贅述。
3.XLConnect
要依賴java,并且對于大數(shù)據(jù)情況讀取非常慢。但實際上自己使用的時候,安裝了java后,還是沒法使用這個包??赡苁悄承┎襟E設置出現(xiàn)了問題。
若有童鞋對前面的三個包非常感興趣,其詳細的用法可以參考前面的參考網(wǎng)址。
4.xlsx
這個包是目前用的最多,也是R中可以說最好用的讀取Excel文件的利器。
下面專門對其進行介紹。首先我們先說明這個包的依賴文件,不僅僅只是依賴R中的一些包,而是需要單獨安裝java。
1)裝Java
安裝鏈接:/zh_CN/download/
我們按照指引選擇默認路徑安裝,安裝完成后,在C:\ProgramFiles下出現(xiàn)了Java文件,說明安裝成功。(注:有些地方說需要將Java文件添加到全局變量中,后面的xlsx包才能調(diào)取成功,但其實在這兩天的實際安裝中發(fā)現(xiàn),自己的電腦并不需要,可能得看臉。)
2)裝xlsx
安裝xlsx其實沒什么好說的,就正常安裝,然后它會自動將所需要的rjava等依賴庫,最后成功安裝xlsx庫。
3)實際使用
最后我們就能直接使用啦,下面來講一下其代碼格式:
library(xlsx)
dat-read.xlsx(data.xlsx,sheetName=Sheet1,encoding=UTF-8)
一個標準的數(shù)據(jù)讀取如上所示,下面將幾個常用的參數(shù):
data.xlsx:表示讀取數(shù)據(jù)的名稱。
sheetName:表示讀取表中表的名稱,通常第一個就是Sheet1。
encoding:這個在讀取中文數(shù)據(jù)的時候是一定要加上的,不然讀取數(shù)據(jù)會出現(xiàn)亂碼。
sheetIndex:表示讀取文件中第幾個表,sheetIndex=1表示讀取文件中第一個表。
需要特別注意:當文件中我們的表明為中文字時,不能使用類似sheetName=表1進行讀取,即使加上encoding=UTF-8也會出現(xiàn)讀取錯誤,這
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 司法鑒定所財務制度
- 科創(chuàng)板對財務制度
- 食品會計財務制度
- 小微廠財務制度
- 農(nóng)家書屋三個制度
- 公路工程施工監(jiān)理招標投標制度
- 企業(yè)設備質量管理制度(3篇)
- 國貿(mào)理發(fā)活動策劃方案(3篇)
- 2026江西九江市田家炳實驗中學臨聘教師招聘2人備考題庫有完整答案詳解
- 2026山東泰安市屬事業(yè)單位初級綜合類崗位招聘備考題庫及答案詳解(奪冠系列)
- 車輛工程系畢業(yè)論文
- 500萬的咨詢合同范本
- 七年級語文文言文閱讀理解專項訓練
- 中藥熱熨敷技術及操作流程圖
- 臨床提高吸入劑使用正確率品管圈成果匯報
- 娛樂場所安全管理規(guī)定與措施
- 電影項目可行性分析報告(模板參考范文)
- 老年協(xié)會會員管理制度
- LLJ-4A車輪第四種檢查器
- 大索道竣工結算決算復審報告審核報告模板
- 2025年南充市中考理科綜合試卷真題(含標準答案)
評論
0/150
提交評論