版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
項目四數(shù)據(jù)采集任務(wù)一Python讀取數(shù)據(jù)文件例4-1代碼錄入行號代碼行1#打開文件進行寫入2withopen('example1.txt','w',encoding='utf-8')asf:3#encoding='utf-8'指定編碼方式,防止編碼錯誤4f.write('我的名字是張三\n')#寫入“我的名字是張三”,\n表示換行5f.write('我今年20歲\n')#寫入“我今年20歲”6f.write('我喜歡編程')#寫入“我喜歡編程”運行結(jié)果我的名字是張三我今年20歲我喜歡編程例4-2代碼錄入行號代碼行1withopen('example2.txt','w',encoding='utf-8')asf:2lines=['我的名字是張三\n','我今年20歲\n','我喜歡編程\n']3#將一個字符串列表寫入文件4f.writelines(lines)運行結(jié)果我的名字是張三我今年20歲我喜歡編程例4-3代碼錄入行號代碼行1#打開文件2withopen('example1.txt','r',encoding='utf-8')asf:3data=f.read()#讀取文本4print(data)#輸出所有文本內(nèi)容運行結(jié)果我的名字是張三我今年20歲我喜歡編程例4-4代碼錄入行號代碼行1#打開文件2withopen('example1.txt','r',encoding='utf-8')asf:3print(f.readline())#讀取第一行的內(nèi)容4print(f.readline())#接著讀取第二行的內(nèi)容運行結(jié)果我的名字是張三我今年20歲例4-5代碼錄入行號代碼行1#打開文件2withopen('example1.txt','r',encoding='utf-8')asf:3data=f.readlines()#讀取全部內(nèi)容,以數(shù)列的格式返回結(jié)果4print(data)#輸出所有文本內(nèi)容運行結(jié)果['我的名字是張三\n','我今年20歲\n','我喜歡編程\n']班級學(xué)生信息.xlsx例4-6代碼錄入行號代碼行1importpandasaspd2#讀取文件班級學(xué)生信息.xlsx的第一個工作表3df=pd.read_excel('班級學(xué)生信息.xlsx',sheet_name=0)4#輸出內(nèi)容5print(df)運行結(jié)果學(xué)號姓名性別年齡02022001黃智慧女1912022002饒鑫貝女1922022003黃偉男2032022004李琴女2142022005萬雨軒男20例4-7代碼錄入行號代碼行1#導(dǎo)入Pandas庫2importpandasaspd3#創(chuàng)建一個簡單的DataFrame4data={'姓名':['吳海','劉麗琴','林宇'],'年齡':[25,32,40]}5#使用pd.DataFrame(data)將這個字典轉(zhuǎn)換為一個PandasDataFrame對象,并將其賦值給變量df6df=pd.DataFrame(data)7#將DataFrame寫入名為員工年齡統(tǒng)計.xlsx的Excel文件8df.to_excel('員工年齡統(tǒng)計.xlsx',sheet_name='人員信息',index=False)9#index=False參數(shù)表示在寫入Excel文件時不包含行索引運行結(jié)果姓名 年齡0 吳海 251 劉麗琴322 林宇 40例4-8代碼錄入行號代碼行1importpandasaspd2#讀取名為員工年齡統(tǒng)計.xlsx的Excel文件3df=pd.read_excel('員工年齡統(tǒng)計.xlsx')4#顯示DataFrame的內(nèi)容5print(df)運行結(jié)果姓名 年齡0 吳海 251 劉麗琴322 林宇 40例4-9代碼錄入行號代碼行1#導(dǎo)入json模塊2importjson3#將數(shù)據(jù)存儲在一個字典中4financial_data={5"庫存現(xiàn)金":1000000,6"銀行存款":700000,7"其他貨幣資金":300000}8#打開一個文件用于寫入,并使用json.dump()將字典寫入文件9withopen('financial_data.json','w')asf:10json.dump(financial_data,f)11#將financial_data編碼成JSON格式并寫入到f中,生成financial_data.json文件運行結(jié)果庫存現(xiàn)金:1000000銀行存款:700000其他貨幣資金:300000例4-10代碼錄入行號代碼行1importjson2#打開之前寫入的financial_data.json文件,'r'表示只讀模式3withopen('financial_data.json','r')asf:4#調(diào)用json.load()方法從文件中讀取JSON數(shù)據(jù),并將其存儲在data變量中5data=json.load(f)6#輸出數(shù)據(jù)以驗證其正確性7print(data)8#data現(xiàn)在是一個Python字典運行結(jié)果{'庫存現(xiàn)金':1000000,'銀行存款':700000,'其他貨幣資金':300000}【學(xué)中做】行號代碼行1importpandasaspd2#創(chuàng)建員工信息數(shù)據(jù)3data={4'員工工號':['xh173','xh174','xh175'],5'姓名':['鄭淑華','李天昊','饒慶鋒'],6'性別':['女','男','男'],7'部門':['行政部','財務(wù)部','銷售部'],8'基本工資':[4000,5000,4500]9}10#創(chuàng)建DataFrame11df=pd.DataFrame(data)12#寫入Excel文件13df.to_excel('新入職員工信息表.xlsx',index=False)14print("數(shù)據(jù)已成功寫入Excel文件!")任務(wù)二Python讀寫SQLite數(shù)據(jù)庫例4-11代碼錄入行號代碼行1#導(dǎo)入sqlite3模塊2importsqlite33#連接到數(shù)據(jù)庫,數(shù)據(jù)庫文件是test.db4#如果數(shù)據(jù)庫不存在,將會創(chuàng)建一個新的數(shù)據(jù)庫對象5conn=sqlite3.connect('test.db')6#創(chuàng)建一個游標(biāo)對象,使用它來執(zhí)行SQL命令7c=conn.cursor()8print('連接數(shù)據(jù)庫')運行結(jié)果連接數(shù)據(jù)庫例4-12代碼錄入行號代碼行1importsqlite32conn=sqlite3.connect('test.db')3print("數(shù)據(jù)庫打開成功")4#創(chuàng)建光標(biāo)對象5c=conn.cursor()6#創(chuàng)建一個表:COMPANY,c.execute是PYthon中用于執(zhí)行SQL語句的方法,'''用來定義多行字符串7c.execute('''CREATETABLECOMPANY8(IDINTPRIMARYKEYNOTNULL,9NAMETEXTNOTNULL,10AGEINTNOTNULL,11ADDRESSCHAR(50),12SALARYREAL);''')13print("數(shù)據(jù)表創(chuàng)建成功")14#提交事務(wù):15mit()16#關(guān)閉連接:17conn.close()運行結(jié)果數(shù)據(jù)庫打開成功數(shù)據(jù)表創(chuàng)建成功例4-13代碼錄入行號代碼行1importsqlite32conn=sqlite3.connect('test.db')3c=conn.cursor()4print("數(shù)據(jù)庫打開成功")5c.execute("INSERTINTOCOMPANY(ID,NAME,AGE,ADDRESS,SALARY)\6VALUES(1,'Paul',32,'California',20000.00)")7c.execute("INSERTINTOCOMPANY(ID,NAME,AGE,ADDRESS,SALARY)\8VALUES(2,'Allen',25,'Texas',15000.00)")9c.execute("INSERTINTOCOMPANY(ID,NAME,AGE,ADDRESS,SALARY)\10VALUES(3,'Teddy',23,'Norway',20000.00)")11c.execute("INSERTINTOCOMPANY(ID,NAME,AGE,ADDRESS,SALARY)\12VALUES(4,'Mark',25,'Rich-Mond',65000.00)")13#提交事務(wù)到數(shù)據(jù)庫14mit()15print("數(shù)據(jù)插入成功")16#最后關(guān)閉數(shù)據(jù)庫連接17conn.close()運行結(jié)果數(shù)據(jù)庫打開成功數(shù)據(jù)插入成功例4-14代碼錄入行號代碼行1importsqlite32importpandasaspd3#Createyourconnection.4cnx=sqlite3.connect('test.db')5df=pd.read_sql_query("SELECT*FROMCOMPANY",cnx)6df運行結(jié)果ID NAMEAGE ADDRESS SALARY0 1 Paul 32 California 20000.01 2 Allen25 Texas 15000.02 3 Teddy 23 Norway 20000.03 4 Mark 25 Rich-Mond 65000.0例4-15代碼錄入行號代碼行1importsqlite32conn=sqlite3.connect('test.db')3c=conn.cursor()4print("數(shù)據(jù)庫打開成功")5cursor=c.execute("SELECTid,name,address,salaryfromCOMPANY")6forrowincursor:7print("ID=",row[0])8print("NAME=",row[1])9print("ADDRESS=",row[2])10print("SALARY=",row[3])11print("\n")12print("數(shù)據(jù)操作成功")13conn.close()運行結(jié)果數(shù)據(jù)庫打開成功ID=1NAME=PaulADDRESS=CaliforniaSALARY=20000.0ID=2NAME=AllenADDRESS=TexasSALARY=15000.0ID=3NAME=TeddyADDRESS=NorwaySALARY=20000.0ID=4NAME=MarkADDRESS=Rich-MondSALARY=65000.0數(shù)據(jù)操作成功例4-16代碼錄入行號代碼行1importsqlite32conn=sqlite3.connect('test.db')3c=conn.cursor()4print("數(shù)據(jù)庫打開成功")5#將員工Paul的工資修改為250006c.execute("UPDATECOMPANYsetSALARY=25000.00whereNAME='Paul';")7mit()8print("數(shù)據(jù)操作成功")9conn.close()運行結(jié)果1數(shù)據(jù)庫打開成功2數(shù)據(jù)操作成功例4-17代碼錄入行號代碼行1importsqlite32importpandasaspd3#Createyourconnection.4cnx=sqlite3.connect('test.db')5df=pd.read_sql_query("SELECT*FROMCOMPANY",cnx)6df運行結(jié)果ID NAMEAGE ADDRESS SALARY0 1 Paul 32 California 25000.01 2 Allen25 Texas 15000.02 3 Teddy 23 Norway 20000.03 4 Mark 25 Rich-Mond 65000.0例4-18代碼錄入行號代碼行1importsqlite32conn=sqlite3.connect('test.db')3c=conn.cursor()4print("數(shù)據(jù)庫打開成功")5#刪除名字為Paul這條記錄6c.execute("DELETEfromCOMPANYwhereNAME='Paul';")7mit()8#查詢刪除信息后表中的數(shù)據(jù)9cursor=conn.execute("SELECTid,name,address,salaryfromCOMPANY")10forrowincursor:11print("ID=",row[0])12print("NAME=",row[1])13print("ADDRESS=",row[2])14print("SALARY=",row[3])15print("\n")16print("數(shù)據(jù)操作成功")17conn.close()運行結(jié)果數(shù)據(jù)庫打開成功ID=2NAME=AllenADDRESS=TexasSALARY=15000.0ID=3NAME=TeddyADDRESS=NorwaySALARY=20000.0ID=4NAME=MarkADDRESS=Rich-MondSALARY=65000.0數(shù)據(jù)操作成功例4-19代碼錄入行號代碼行1importsqlite32importpandasaspd3#Createyourconnection.4cnx=sqlite3.connect('test.db')5df=pd.read_sql_query("SELECT*FROMCOMPANY",cnx)6df運行結(jié)果ID NAMEAGE ADDRESS SALARY0 2 Allen25 Texas 15000.01 3 Teddy 23 Norway 20000.02 4 Mark 25 Rich-Mond 65000.0【學(xué)中做】行號代碼行1#導(dǎo)入sqlite3模塊2importsqlite33#連接數(shù)據(jù)庫4conn=sqlite3.connect('新人基本工資數(shù)據(jù)表.db')5#創(chuàng)建表6#創(chuàng)建光標(biāo)對象7c=conn.cursor()8#執(zhí)行sql語句9c.execute('''CREATETABLEstocks(姓名,王子恒,劉華然,李小璐)''')10c.execute("INSERTINTOstocksVALUES('基本工資','20000','18000','19500')")11#提交事務(wù)12mit()13#關(guān)閉數(shù)據(jù)庫連接14conn.close()15#使用pandas讀取sqlite數(shù)據(jù)庫文件16importpandasaspd#導(dǎo)入pandas庫17#連接數(shù)據(jù)庫18cnx=sqlite3.connect('新人基本工資數(shù)據(jù)表.db')19#讀取數(shù)據(jù)庫文件20df=pd.read_sql_query("SELECT*FROMstocks",cnx)21df【學(xué)中做】【任務(wù)拓展】行號代碼行1#導(dǎo)入sqlite3模塊2importsqlite33#連接到SQLite數(shù)據(jù)庫(如果不存在則會創(chuàng)建)4conn=sqlite3.connect('student_grades.db')5cursor=conn.cursor()6#創(chuàng)建學(xué)生表7cursor.execute('''8CREATETABLEIFNOTEXISTSstudents(9student_idTEXTPRIMARYKEY,10nameTEXT,11birth_dateTEXT,12genderTEXT13)14''')15#創(chuàng)建課程表16cursor.execute('''17CREATETABLEIFNOTEXISTScourses(18course_idTEXTPRIMARYKEY,19course_nameTEXT,20teacherTEXT21)22''')23#創(chuàng)建成績表24cursor.execute('''25CREATETABLEIFNOTEXISTSgrades(26student_idTEXT,27course_idTEXT,28gradeREAL,29PRIMARYKEY(student_id,course_id),30FOREIGNKEY(student_id)REFERENCESstudents(student_id),31FOREIGNKEY(course_id)REFERENCEScourses(course_id)32)33''')34#插入學(xué)生數(shù)據(jù)35students_data=[36('202101','趙雷','1998-01-01','男'),37('202102','錢電','1998-12-21','男'),38('202103','孫風(fēng)','1999-05-20','男'),39('202104','李云','1999-08-06','女')40]41cursor.executemany('INSERTINTOstudentsVALUES(?,?,?,?)',students_data)42#插入課程數(shù)據(jù)43courses_data=[44('202001','會計基礎(chǔ)','高林'),45('202002','管理會計','齊飛'),46('202003','財務(wù)管理','趙東')47]48cursor.executemany('INSERTINTOcoursesVALUES(?,?,?)',courses_data)49#插入成績數(shù)據(jù)50grades_data=[51('202101','202002',80),52('202101','202001',90),53('202101','202003',95),54('202102','202002',85),55('202102','202003',90),56('202103','202002',90),57('202104','202002',79)58]59cursor.executemany('INSERTINTOgradesVALUES(?,?,?)',grades_data)60#提交更改61mit()62#查詢并打印結(jié)果63defq(sql):[print(*r)forrinc.execute(sql)]64print("\n(2)課程202001成績高于202002的學(xué)生:")65q('''SELECT,g1.gradeAS'202001',g2.gradeAS'202002'66FROMstudentss,gradesg1,gradesg267WHEREs.id=g1.student_idANDs.id=g2.student_id68ANDg1.course_id='202001'ANDg2.course_id='202002'ANDg1.grade>g2.grade''')69print("\n(3)平均成績>=60的學(xué)生:")70q('''SELECT,AVG(g.grade)ASavg_grade71FROMstudentssJOINgradesgONs.id=g.student_id72GROUPBYs.idHAVINGavg_grade>=60ORDERBYavg_gradeDESC''')任務(wù)三網(wǎng)頁數(shù)據(jù)采集例4-20代碼錄入行號代碼行1<!DOCTYPEhtml>2<html>3<head>4<title>我的簡單網(wǎng)頁</title>5</head>6<body>7<h1>歡迎來到我的網(wǎng)頁</h1>8<p>這是一個HTML示例。</p>9<ahref="">點擊這里訪問</a>10<br>11<h2>我的興趣愛好</h2>12<ul>13<li>閱讀</li>14<li>編程</li>15<li>旅行</li>16</ul>17</body>18</html>運行結(jié)果(瀏覽器頁面顯示)例4-21代碼錄入行號代碼行1<!DOCTYPEhtml>2<html>3<head>4<title>我的簡單網(wǎng)頁</title>5<style>6/*設(shè)置h1標(biāo)簽的樣式*/7h1{8background-color:#6495ed;/*天藍色背景*/9color:white;/*白色字體*/10text-align:center;/*文字居中*/11padding:10px;/*內(nèi)邊距*/12}13/*設(shè)置p標(biāo)簽的樣式*/14p{15background-color:#e0ffff;/*淺天藍色背景*/16color:#333;/*深灰色字體*/17padding:10px;/*內(nèi)邊距*/18text-indent:2em;/*段落首行縮進2字符寬度*/19}20/*設(shè)置鏈接(a標(biāo)簽)的樣式*/21a{22color:red;/*紅色字體*/23text-decoration:none;/*去除下劃線*/24}25a:hover{26color:blue;/*鼠標(biāo)懸停時變?yōu)樗{色*/27text-decoration:underline;/*鼠標(biāo)懸停時顯示下劃線*/28}29/*設(shè)置h2標(biāo)簽的樣式*/30h2{31color:#6495ed;/*天藍色字體*/32padding-bottom:5px;/*下內(nèi)邊距*/33border-bottom:2pxsolid#6495ed;/*天藍色底部邊框*/34}35/*設(shè)置列表項(li標(biāo)簽)的樣式*/36li{37color:#333;/*深灰色字體*/38list-style-type:square;/*使用方塊作為項目標(biāo)記*/39margin-bottom:5px;/*設(shè)置列表項之間的間距*/40}41</style>42</head>43<body>44<h1>歡迎來到我的網(wǎng)頁</h1>45<p>這是一個HTML示例。</p>46<ahref="">點擊這里訪問</a>47<br>48<h2>我的興趣愛好</h2>49<ul>50<li>閱讀</li>51<li>編程</li>52<li>旅行</li>53</ul>54</body>55</html>運行結(jié)果(瀏覽器頁面顯示)例4-22代碼錄入行號代碼行1<?xmlversion="1.0"encoding="ISO-8859-1"?>2<CATALOG>3<PLANT>4<COMMON>Bloodroot</COMMON>5<BOTANICALlang="en">Sanguinariacanadensis</BOTANICAL>6<ZONE>4</ZONE>7<LIGHT>MostlyShady</LIGHT>8<PRICE>$2.44</PRICE>9<AVAILABILITY>031599</AVAILABILITY>10</PLANT>11</CATALOG>例4-23代碼錄入行號代碼行1<?xmlversion="1.0"encoding="ISO-8859-1"?>2<CATALOG>3<PLANT>4<COMMON>Bloodroot</COMMON>5<BOTANICALlang="en">Sanguinariacanadensis</BOTANICAL>6<ZONE>4</ZONE>7<LIGHT>MostlyShady</LIGHT>8<PRICE>2.44</PRICE>9<AVAILABILITY>031599</AVAILABILITY>10</PLANT>11<PLANT>12<COMMON>Columbine</COMMON>13<BOTANICALlang="en">Aquilegiacanadensis</BOTANICAL>14<ZONE>3</ZONE>15<LIGHT>MostlyShady</LIGHT>16<PRICE>9.37</PRICE>17<AVAILABILITY>030699</AVAILABILITY>18</PLANT>19</CATALOG>例4-24代碼錄入行號代碼行1importrequests2#百度首頁的URL3url=''4#發(fā)送GET請求5response=requests.get(url)6#檢查請求是否成功7ifresponse.status_code==200:8#打印網(wǎng)頁的HTML內(nèi)容,以字符串形式輸出,以前500個字符作為示例9print(response.text[:500])10else:11print(f"Error:Unabletofetchwebpage,statuscode{response.status_code}")運行結(jié)果<!DOCTYPEhtml><!--STATUSOK--><html><head><metahttp-equiv=content-typecontent=text/html;charset=utf-8><metahttp-equiv=X-UA-Compatiblecontent=IE=Edge><metacontent=alwaysname=referrer><linkrel=stylesheettype=text/csshref=/5eN1bjq8AAUYm2zgoY3K/r/www/cache/bdorz/baidu.min.css><title>????o|????????????°±??¥é??</title></head><bodylink=#0000cc><divid=wrapper><divid=head><divclass=head_wrapper><divclass=s_form><divclass=s_form_wrapper><divid=lg><imgh例4-25代碼錄入行號代碼行1importrequests2url=''3response=requests.get(url)4ifresponse.status_code==200:5#打印響應(yīng)的狀態(tài)碼6print(response.status_code)7#打印響應(yīng)的HTTP表頭8print(response.headers)9#獲取并打印cookies10print(response.cookies)11#打印二進制形式的響應(yīng)內(nèi)容,前500個字符作為示例12print(response.content[:500])13#打印響應(yīng)內(nèi)容的前500個字符作為示例14print(response.text[:500])15else:16print("Failedtoretrievethewebpage")運行結(jié)果200{'Cache-Control':'private,no-cache,no-store,proxy-revalidate,no-transform','Connection':'keep-alive','Content-Encoding':'gzip','Content-Type':'text/html','Date':'Sat,30Mar202413:19:41GMT','Last-Modified':'Mon,23Jan201713:23:46GMT','Pragma':'no-cache','Server':'bfe/8','Set-Cookie':'BDORZ=27315;max-age=86400;domain=.;path=/','Transfer-Encoding':'chunked'}<RequestsCookieJar[<CookieBDORZ=27315for./>]>b'<!DOCTYPEhtml>\r\n<!--STATUSOK--><html><head><metahttp-equiv=content-typecontent=text/html;charset=utf-8><metahttp-equiv=X-UA-Compatiblecontent=IE=Edge><metacontent=alwaysname=referrer><linkrel=stylesheettype=text/csshref=/5eN1bjq8AAUYm2zgoY3K/r/www/cache/bdorz/baidu.min.css><title>\xe7\x99\xbe\xe5\xba\xa6\xe4\xb8\x80\xe4\xb8\x8b\xef\xbc\x8c\xe4\xbd\xa0\xe5\xb0\xb1\xe7\x9f\xa5\xe9\x81\x93</title></head><bodylink=#0000cc><divid=wrapper><divid=head><divclass=head_wrapper><divclass=s_form><divclass=s_form_wrapper><divid=lg><imgh'<!DOCTYPEhtml><!--STATUSOK--><html><head><metahttp-equiv=content-typecontent=text/html;charset=utf-8><metahttp-equiv=X-UA-Compatiblecontent=IE=Edge><metacontent=alwaysname=referrer><linkrel=stylesheettype=text/csshref=/5eN1bjq8AAUYm2zgoY3K/r/www/cache/bdorz/baidu.min.css><title>????o|????????????°±??¥é??</title></head><bodylink=#0000cc><divid=wrapper><divid=head><divclass=head_wrapper><divclass=s_form><divclass=s_form_wrapper><divid=lg><imgh例4-26代碼錄入行號代碼行1#在Python代碼中導(dǎo)入BeautifulSoup2frombs4importBeautifulSoup3#百度網(wǎng)頁HTML源代碼示例,真實的百度首頁代碼更復(fù)雜4html_doc="""5<!DOCTYPEhtml>6<html>7<head>8<metacharset="UTF-8">9<title>百度一下,你就知道</title>10</head>11<body>12<divid="navigation">13<ahref="">百度新聞</a>14<ahref="">百度地圖</a>15</div>16<divid="main">17<p>歡迎來到百度,世界上最大的中文搜索引擎。</p>18</div>19</body>20</html>21"""22#創(chuàng)建BeautifulSoup對象23soup=BeautifulSoup(html_doc,'lxml')24#使用lxml進行解析操作25#打印標(biāo)題26print(soup.title.string)運行結(jié)果1百度一下,你就知道例4-27代碼錄入行號代碼行1frombs4importBeautifulSoup2html_doc="""3<!DOCTYPEhtml>4<html>5<head>6<metacharset="UTF-8">7<title>百度一下,你就知道</title>8</head>9<body>10<divid="navigation">11<ahref="">百度新聞</a>12<ahref="">百度地圖</a>13</div>14<divid="main">15<p>歡迎來到百度,世界上最大的中文搜索引擎。</p>16</div>17</body>18</html>19"""20soup=BeautifulSoup(html_doc,'lxml')21print(soup.a)#獲取頁面中第一個為<a>的標(biāo)簽22print(soup.a.get("class"))#獲取頁面中第一個<a>標(biāo)簽的class屬性值23print(soup.a.get("href"))#獲取頁面中第一個<a>標(biāo)簽的href屬性值24print(soup.title)#抽取<title>標(biāo)簽25print(soup.a.attrs)#.attrs用于獲取所有屬性26print(soup.a.string)#打印標(biāo)簽內(nèi)的文本運行結(jié)果<ahref="">百度新聞</a>None<title>百度一下,你就知道</title>{'href':''}百度新聞例4-28代碼錄入行號代碼行1frombs4importBeautifulSoup2html_doc="""3<!DOCTYPEhtml>4<html>5<head>6<metacharset="UTF-8">7<title>百度一下,你就知道</title>8</head>9<body>10<divid="navigation">11<ahref="">百度新聞</a>12<ahref="">百度地圖</a>13</div>14<divid="main">15<p>歡迎來到百度,世界上最大的中文搜索引擎。</p>16</div>17</body>18</html>19"""20soup=BeautifulSoup(html_doc,'lxml')21#使用find_all()查找所有的<a>標(biāo)簽22links=soup.find_all('a')23forlinkinlinks:24print(link['href'])#輸出所有<a>標(biāo)簽的href屬性值25#查找所有<input>標(biāo)簽26inputs=soup.find_all('input')27foriininputs:28print(i)#輸出所有<input>標(biāo)簽的HTML代碼運行結(jié)果例4-29代碼錄入行號代碼行1frombs4importBeautifulSoup2html_doc="""3<!DOCTYPEhtml>4<html>5<head>6<metacharset="UTF-8">7<title>百度一下,你就知道</title>8</head>9<body>10<divid="navigation">11<ahref="">百度新聞</a>12<ahref="">百度地圖</a>13</div>14<divid="main">15<p>歡迎來到百度,世界上最大的中文搜索引擎。</p>16</div>17</body>18</html>19"""20soup=BeautifulSoup(html_doc,'lxml')21#查找具有特定id的<div>標(biāo)簽22main_div=soup.find('div',id='main')23print(main_div)運行結(jié)果<divid="main"><p>歡迎來到百度,世界上最大的中文搜索引擎。</p></div>例4-30代碼錄入行號代碼行1frombs4importBeautifulSoup2html_doc="""3<!DOCTYPEhtml>4<html>5<head>6<metacharset="UTF-8">7<title>百度一下,你就知道</title>8</head>9<body>10<divid="navigation">11<ahref="">百度新聞</a>12<ahref="">百度地圖</a>13</div>14<divid="main">15<p>歡迎來到百度,世界上
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中醫(yī)類人文考試及答案
- 游戲策劃師招聘考試與面試要點分析
- 智能硬件研發(fā)與應(yīng)用專家面試題集
- 2025年文創(chuàng)產(chǎn)品研發(fā)與市場推廣項目可行性研究報告
- 2025年信息技術(shù)在教育中的應(yīng)用可行性研究報告
- 2025年水陸聯(lián)運交通樞紐建設(shè)可行性研究報告
- 2025年新型互聯(lián)網(wǎng)媒體平臺建設(shè)項目可行性研究報告
- 2026年山西省晉中市單招職業(yè)傾向性測試題庫帶答案詳解
- 2026年內(nèi)蒙古機電職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫帶答案詳解
- 2026年平頂山文化藝術(shù)職業(yè)學(xué)院單招職業(yè)技能測試題庫參考答案詳解
- 2025年1月黑龍江省普通高中學(xué)業(yè)水平合格性考試物理試卷(含答案)
- 江西省三新協(xié)同體2025-2026年高一上12月思想政治試卷(含解析)
- 知識點及2025秋期末測試卷(附答案)-蘇教版(新教材)小學(xué)科學(xué)小學(xué)科學(xué)二年級上冊
- 2025安徽蕪湖市鳩江區(qū)人民醫(yī)院招聘工作人員21人筆試考試參考試題及答案解析
- 企業(yè)財務(wù)盡調(diào)咨詢服務(wù)合同
- 專題03 細胞呼吸和光合作用-2025年高考《生物》真題分類匯編
- 識記并正確書寫現(xiàn)代規(guī)范漢字教案
- 施工現(xiàn)場安全生產(chǎn)檢查制度
- 中央空調(diào)報價模板
- 某工業(yè)廠房BIM實施方案
- 卒中中心區(qū)域協(xié)同救治網(wǎng)絡(luò)建設(shè)合作協(xié)議
評論
0/150
提交評論