Python數(shù)據(jù)預(yù)處理教學(xué)設(shè)計(jì)-Python數(shù)據(jù)獲取教學(xué)設(shè)計(jì)_第1頁(yè)
Python數(shù)據(jù)預(yù)處理教學(xué)設(shè)計(jì)-Python數(shù)據(jù)獲取教學(xué)設(shè)計(jì)_第2頁(yè)
Python數(shù)據(jù)預(yù)處理教學(xué)設(shè)計(jì)-Python數(shù)據(jù)獲取教學(xué)設(shè)計(jì)_第3頁(yè)
Python數(shù)據(jù)預(yù)處理教學(xué)設(shè)計(jì)-Python數(shù)據(jù)獲取教學(xué)設(shè)計(jì)_第4頁(yè)
Python數(shù)據(jù)預(yù)處理教學(xué)設(shè)計(jì)-Python數(shù)據(jù)獲取教學(xué)設(shè)計(jì)_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

博學(xué)谷——讓IT教學(xué)更簡(jiǎn)單,讓IT學(xué)更有效PAGE一二PAGEPAGE二《Python數(shù)據(jù)預(yù)處理》初九年級(jí)數(shù)學(xué)教案教學(xué)設(shè)計(jì)課程名稱:Python數(shù)據(jù)預(yù)處理授課年級(jí):二零二X年級(jí)授課學(xué)期:第二學(xué)期教師姓名:某某老師二零二X年一一月課題名稱第四章數(shù)據(jù)獲取計(jì)劃學(xué)時(shí)四課時(shí)教學(xué)引入數(shù)據(jù)經(jīng)過(guò)采集后通常會(huì)被存儲(chǔ)到Word,Excel,JSON等文件或數(shù)據(jù)庫(kù),從而為后期地預(yù)處理工作做好數(shù)據(jù)儲(chǔ)備。數(shù)據(jù)獲取是數(shù)據(jù)預(yù)處理地第一步操作,主要是從不同地渠道讀取數(shù)據(jù)。Pandas支持CSV,TXT,Excel,JSON這幾種格式文件,HTML表格地讀取操作,另外Python可借助第三方庫(kù)實(shí)現(xiàn)Word與PDF文件地讀取操作。本章主要為大家介紹如何從多個(gè)渠道獲取數(shù)據(jù),為預(yù)處理做好數(shù)據(jù)準(zhǔn)備。教學(xué)目地使學(xué)生掌握如何獲取CSV與TXT文件地?cái)?shù)據(jù)使學(xué)生掌握如何獲取Excel文件地?cái)?shù)據(jù)使學(xué)生掌握如何獲取JSON文件地?cái)?shù)據(jù)使學(xué)生掌握如何獲取HTML表格地?cái)?shù)據(jù)使學(xué)生掌握如何獲取數(shù)據(jù)庫(kù)地?cái)?shù)據(jù)使學(xué)生熟悉如何獲取Word與PDF文件地?cái)?shù)據(jù)教學(xué)重點(diǎn)從CSV與TXT文件地?cái)?shù)據(jù)從Excel文件地?cái)?shù)據(jù)從獲取JSON文件地?cái)?shù)據(jù)從HTML表格地?cái)?shù)據(jù)從數(shù)據(jù)庫(kù)地?cái)?shù)據(jù)教學(xué)難點(diǎn)從數(shù)據(jù)庫(kù)獲取數(shù)據(jù)python-docx地基本使用pdfplumber地基本使用教學(xué)方式課堂教學(xué)以PPT講授為主,并結(jié)合多媒體行教學(xué)教學(xué)過(guò)程第一課時(shí)(從CSV與TXT文件獲取數(shù)據(jù),從Excel文件獲取數(shù)據(jù))一,創(chuàng)設(shè)情景,導(dǎo)入新課(一)教師通過(guò)提問(wèn)學(xué)生問(wèn)題,引出數(shù)據(jù)存儲(chǔ)類型。教師提問(wèn)學(xué)生問(wèn)題,例如問(wèn)題是:大家知道哪些文件格式?教師行總結(jié):數(shù)據(jù)可以使用文件,數(shù)據(jù)庫(kù)等多種形式存儲(chǔ)。根據(jù)數(shù)據(jù)格式地不同,文件又可以分為多種,例如文件格式有csv,txt,xlsx。(二)數(shù)據(jù)預(yù)處理過(guò)程,如何讀取不同格式文件地?cái)?shù)據(jù)?pandas提供了從各種文件或數(shù)據(jù)庫(kù)讀取數(shù)據(jù)地多個(gè)函數(shù)或方法,通過(guò)這些函數(shù)可以便捷地獲取文件地?cái)?shù)據(jù)。二,新課講解知識(shí)點(diǎn)一-從CSV與TXT文件獲取數(shù)據(jù)教師通過(guò)PPT講解從CSV與TXT文件獲取數(shù)據(jù)。(一)CSV文件通常是以逗號(hào)或制表符為分隔符來(lái)分隔值地文本文檔,擴(kuò)展名為".csv",可通過(guò)Excel等文本編輯器查看與編輯;TXT是微軟公司在操作系統(tǒng)上附帶地一種文本格式,其文件擴(kuò)展名為".txt",可通過(guò)記事本等軟件查看。(二)Pandas使用read_csv()函數(shù)讀取CSV或TXT文件地?cái)?shù)據(jù),并將讀取地?cái)?shù)據(jù)轉(zhuǎn)換成一個(gè)DataFrame類對(duì)象。知識(shí)二-從Excel文件獲取數(shù)據(jù)教師通過(guò)PPT講解從Excel文件獲取數(shù)據(jù)。(一)Excel文件(Excel二零零七及以上版本地?cái)U(kuò)展名為.xlsx)文件主要以工作表存儲(chǔ)數(shù)據(jù)。Excel文件默認(rèn)有三個(gè)工作表,用戶可根據(jù)需要添加一定個(gè)數(shù)(因可用內(nèi)存地限制)地工作表。(二)Pandas使用read_excel()函數(shù)讀取Excel文件指定工作表地?cái)?shù)據(jù),并將數(shù)據(jù)轉(zhuǎn)換成一個(gè)結(jié)構(gòu)與工作表相似地DataFrame類對(duì)象。(三)通過(guò)參數(shù)sheet_name地設(shè)置,可以讀取Excel文件不同地sheet工作表。三,歸納總結(jié)教師回顧本節(jié)課所講地內(nèi)容,并通過(guò)測(cè)試題地方式引導(dǎo)學(xué)生解答問(wèn)題并給予指導(dǎo)。四,課后作業(yè)布置本節(jié)課作業(yè)以及下節(jié)課地預(yù)作業(yè)。第二課時(shí)(從JSON文件獲取數(shù)據(jù),從HTML表格獲取數(shù)據(jù),從數(shù)據(jù)庫(kù)獲取數(shù)據(jù))一,復(fù)鞏固教師通過(guò)上節(jié)課作業(yè)地完成情況,對(duì)學(xué)生吸收不好地知識(shí)點(diǎn)行再次鞏固講解。二,通過(guò)需求引入地方式導(dǎo)入新課上節(jié)課主要為大家介紹了從CSV與TXT文件獲取數(shù)據(jù)與從Excel文件獲取數(shù)據(jù),接下來(lái),本節(jié)課將為大家介紹從JSON文件獲取數(shù)據(jù),從HTML表格獲取數(shù)據(jù),從數(shù)據(jù)庫(kù)獲取數(shù)據(jù)。三,新課講解知識(shí)點(diǎn)一-從JSON文件獲取數(shù)據(jù)教師根據(jù)PPT講解從JSON文件獲取數(shù)據(jù)。(一)JSON是一種輕量級(jí)地?cái)?shù)據(jù)換格式,它以簡(jiǎn)潔與清晰地層次結(jié)構(gòu)來(lái)組織數(shù)據(jù)。JSON采用獨(dú)立于編程語(yǔ)言地文本格式來(lái)存儲(chǔ)數(shù)據(jù),其文件地后綴名為.json,可通過(guò)文本編輯工具查看。(二)Pandas使用read_json()函數(shù)讀取JSON文件地?cái)?shù)據(jù),并將數(shù)據(jù)轉(zhuǎn)換成一個(gè)DataFrame類對(duì)象。知識(shí)點(diǎn)二-從HTML表格獲取數(shù)據(jù)教師根據(jù)PPT講解從HTML表格獲取數(shù)據(jù)。Pandas提供了用于讀取網(wǎng)頁(yè)HTML表格數(shù)據(jù)地read_html()函數(shù),read_html()函數(shù)只能用于讀取網(wǎng)頁(yè)地表格數(shù)據(jù),該函數(shù)會(huì)返回一個(gè)包含網(wǎng)頁(yè)所有表格數(shù)據(jù)地列表。知識(shí)點(diǎn)三-從數(shù)據(jù)庫(kù)獲取數(shù)據(jù)教師根據(jù)PPT講解從數(shù)據(jù)庫(kù)獲取數(shù)據(jù)。(一)數(shù)據(jù)除了被保存在CSV,TXT,Excel等文件,還可以被保存在數(shù)據(jù)庫(kù)。常見(jiàn)地?cái)?shù)據(jù)庫(kù)有MySQL,Oracle,SQLite,PostgreSQL等。(二)Pandas讀取數(shù)據(jù)庫(kù)數(shù)據(jù)地函數(shù)有read_sql_table(),read_sql_query()與read_sql(),其read_sql_table()表示通過(guò)數(shù)據(jù)表名讀取數(shù)據(jù)庫(kù)地?cái)?shù)據(jù);read_sql_query()表示通過(guò)SQL語(yǔ)句讀取數(shù)據(jù)庫(kù)地?cái)?shù)據(jù);read_sql()表示既可以通過(guò)數(shù)據(jù)表名讀取數(shù)據(jù)庫(kù)地?cái)?shù)據(jù)。四,歸納總結(jié)教師帶領(lǐng)學(xué)生回顧本節(jié)課所講地內(nèi)容,并通過(guò)測(cè)試題地方式引導(dǎo)學(xué)生解答問(wèn)題并給予指導(dǎo)。五,課后作業(yè)布置本節(jié)課作業(yè)以及下節(jié)課地預(yù)作業(yè)。第三課時(shí)(python-docx概述,python-docx地基本使用pdfplumber概述,pdfplumber地基本使用)一,復(fù)鞏固教師通過(guò)上節(jié)課作業(yè)地完成情況,對(duì)學(xué)生吸收不好地知識(shí)點(diǎn)行再次鞏固講解。二,通過(guò)需求引入地方式導(dǎo)入新課上節(jié)課主要為大家介紹了從JSON文件獲取數(shù)據(jù),從HTML表格獲取數(shù)據(jù),從數(shù)據(jù)庫(kù)獲取數(shù)據(jù),接下來(lái),本節(jié)課將為大家介紹python-docx概述,python-docx地基本使用pdfplumber概述,pdfplumber地基本使用。三,新課講解知識(shí)點(diǎn)一-python-docx概述教師根據(jù)PPT講解python-docx概述。(一)python-docx是Python專門(mén)用于創(chuàng)建與修改Word(以.docx為后綴名)文件地庫(kù),該庫(kù)提供了Word文件地全套操作,可以輕松地對(duì)Word文件行讀寫(xiě)操作。(二)python-docx庫(kù)主要有一個(gè)Document類,Document類地對(duì)象表示一個(gè)從Word文件加載,類似文件地對(duì)象,相當(dāng)于一個(gè)Word文件。(三)Document對(duì)象常用類有Paragraph與Table,其Paragraph類對(duì)象表示對(duì)應(yīng)Word文件地段落結(jié)構(gòu);Table類對(duì)象表示對(duì)應(yīng)Word文件地表格結(jié)構(gòu)。知識(shí)點(diǎn)二-python-docx地基本使用教師根據(jù)PPT講解python-docx地基本使用步驟。(一)創(chuàng)建一個(gè)Document類對(duì)象。(二)通過(guò)Document類對(duì)象地paragraphs屬或tables屬獲取文件對(duì)象地段落對(duì)象或表格對(duì)象。(三)通過(guò)段落對(duì)象或表格對(duì)象地屬或方法獲取文件內(nèi)容。知識(shí)點(diǎn)三-pdfplumber概述教師根據(jù)PPT講解pdfplumber概述。(一)pdfplumber是一個(gè)完全由Python開(kāi)發(fā)地PDF解析庫(kù),它不僅可以讀取PDF文件地文本數(shù)據(jù),還可以讀取PDF文件地表格數(shù)據(jù)。(二)pdfplumber庫(kù)主要提供了兩個(gè)類PDF與Page,分別代表PDF文件與PDF文件每一頁(yè)實(shí)例。知識(shí)點(diǎn)四-pdfplumber地基本使用教師根據(jù)PPT講解pdfplumber庫(kù)地基本使用步驟。(一)加載PDF文件,生成PDF對(duì)象。(二)遍歷獲取Page對(duì)象。(三)提取Page對(duì)象地文本或表格數(shù)據(jù)。四,歸納總結(jié)教師帶領(lǐng)學(xué)生回顧本節(jié)課所講地內(nèi)容,并通過(guò)測(cè)試題地方式引導(dǎo)學(xué)生解答問(wèn)題并給予指導(dǎo)。五,課后作業(yè)布置本節(jié)課作業(yè)以及下節(jié)課地預(yù)作業(yè)。第四課時(shí)(上機(jī)練)上機(jī)練主要針對(duì)本章需要重點(diǎn)掌握地知識(shí)點(diǎn),以及在程序容易出錯(cuò)地內(nèi)容行練,通過(guò)上機(jī)練可以考察同學(xué)對(duì)知識(shí)點(diǎn)地掌握情況,對(duì)代碼地熟練程度。上機(jī)一:(考察知識(shí)點(diǎn):從不同格式文件獲取數(shù)據(jù))形式:單獨(dú)完成題目:練四.一~四.七節(jié)地示例,從各種文件或數(shù)據(jù)庫(kù)讀取數(shù)據(jù),要求如下:(一)使用pandas地read_csv()函數(shù),read_excel()函數(shù)與read_json()函數(shù)分別讀取phones.csv,itheima_books.txt,Athletes_info.xlsx與Animal_species.json文件數(shù)據(jù);(二)使用pandas地r

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論