版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
一、實(shí)踐目的通過學(xué)習(xí)及課后練習(xí),熟練地運(yùn)用python以及網(wǎng)絡(luò)爬蟲,并且能夠獨(dú)立地從網(wǎng)絡(luò)上獲取想要的資源,從獲取到的想要的資源中分析并提取有用的數(shù)據(jù)。二、實(shí)踐內(nèi)容1.項(xiàng)目的分析爬蟲是什么定義:向網(wǎng)站發(fā)起請(qǐng)求,獲取資源后分析并提取有用數(shù)據(jù)的程序第一步:導(dǎo)入網(wǎng)絡(luò)進(jìn)行下載第二步:導(dǎo)入網(wǎng)絡(luò)進(jìn)行下載過程有報(bào)錯(cuò)異常,然后倒入一個(gè)報(bào)錯(cuò)庫(kù)。第三步:導(dǎo)入RE第四步:爬出來(lái)的所有圖片,文字存在這里(如下)。python進(jìn)程池2.項(xiàng)目的設(shè)計(jì)在記事本中利用代碼可以設(shè)計(jì)制作一個(gè)網(wǎng)頁(yè),如下圖所示:3.項(xiàng)目的實(shí)現(xiàn)(代碼)利用代碼可以完成許多操作,包括但不限于以下幾種操作:#4.li=[1,2,3,"你的學(xué)號(hào)",”你的名字”],按索引刪除,刪除索引位置是1的元素,打印輸出。然后判斷你的名字和學(xué)號(hào)在不在元素里面.打印輸出在不在(true/flase)。li=[1,2,3,"你的學(xué)號(hào)","文靜"]delli[1]print(li)s="文靜"inliprint(s)按照以上代碼輸入可得到結(jié)果。#5.將字符串s="woaixiancaijingdaxue"轉(zhuǎn)化為列表,打印輸出,然后再將轉(zhuǎn)化完成的列表轉(zhuǎn)化為字符串,打印輸出。s="woaixiancaijingdaxue"li=[]li.extend(s)print(li)new_list=''.join(li)print(new_list)如此可得到想要的打印輸出的結(jié)果。#6.輸入3個(gè)數(shù),并且使這3個(gè)數(shù)按照從小到大輸出,a=input("請(qǐng)輸入第一個(gè)數(shù)字:")b=input("請(qǐng)輸入第二個(gè)數(shù)字:")c=input("請(qǐng)輸入第三個(gè)數(shù)字:")將三個(gè)數(shù)輸入后,對(duì)三個(gè)數(shù)的輸出順序進(jìn)行排列,輸入想要這三個(gè)數(shù)輸出時(shí)遵循的輸出排列規(guī)則。輸入三個(gè)數(shù)以及三個(gè)數(shù)的排列規(guī)則后,設(shè)置輸出內(nèi)容:print(a,b,c)這樣就可以使輸出的三個(gè)數(shù)按照從大到小輸出,如以下圖片所示:4.項(xiàng)目使用說明使用爬蟲將想要獲取的網(wǎng)頁(yè)的值爬取下來(lái)。第一步://獲取網(wǎng)址
第二步://把網(wǎng)址變成網(wǎng)頁(yè)
第三步://提取網(wǎng)頁(yè)的值(爬取網(wǎng)頁(yè)的值/爬蟲)
第四步://把你的爬取下來(lái)的值放到桌面按照以上步驟,可以爬取想要獲取的值。三、實(shí)踐總結(jié)經(jīng)過了這兩周的夏季短學(xué)期實(shí)踐,我從這兩周的夏季短學(xué)期實(shí)踐中明白了Python是一種較為高級(jí)的動(dòng)態(tài),而且它是一種完全的面向?qū)ο蟮恼Z(yǔ)言,所有的函數(shù)、模塊、數(shù)字、字符串都是他面向的對(duì)象,對(duì)于增強(qiáng)源代碼的復(fù)用性python有著一定的作用,而且python是一種計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言,python具有代碼較為少、操作比較簡(jiǎn)單、運(yùn)行的速度比較慢的特點(diǎn)。它的語(yǔ)法特點(diǎn)十分鮮明而且容易辨認(rèn),在很多操作系統(tǒng)上都能使用,目前在國(guó)際上非常流行,目前正在得到越來(lái)越多的應(yīng)用。通過python,我們可以隨著自己的意愿發(fā)布這個(gè)軟件的復(fù)制品,以及觀看這個(gè)軟件的源代碼,又或者說對(duì)它做出你希望的修改,在另一個(gè)類似的軟件上應(yīng)用它或者它的其中一部分。在設(shè)計(jì)的方面看,Python屬于一種容易使用的語(yǔ)言。也就是說,它旨在允許程序員在任何領(lǐng)域編寫幾乎所有類型的應(yīng)用,而不是專注于一類特定的問題。同時(shí)Python非常容易上手,有非常簡(jiǎn)單的語(yǔ)法。Python通常被親切地成為“所有事物的第二個(gè)最好的語(yǔ)言”,它很好地捕捉到了這樣的情緒,盡管在很多情況下Python并不是用于特定問題的最佳語(yǔ)言,但它通常具有足夠的靈活性和良好的支持性,使得人們?nèi)匀豢梢韵鄬?duì)有效地解決問題。其實(shí),事實(shí)是,Python可以十分有作用地使用在很多的不同領(lǐng)域中,學(xué)習(xí)Python這件事因?yàn)檫@個(gè)原因就可以變成一件十分有價(jià)值的事。畢竟若是作為一位編程師亦或者是作為一名程序員,如果可以使用一種方式實(shí)現(xiàn)想要完成的所有事情,而不用被動(dòng)的選擇多種方式復(fù)雜地不斷變更,這顯然是一件非常令人振奮的事。Python經(jīng)常被應(yīng)用于以下幾個(gè)領(lǐng)域,第一個(gè)領(lǐng)域是Web應(yīng)用開發(fā),例如,全球最大的搜索引擎Google,在其網(wǎng)絡(luò)搜索系統(tǒng)中就廣泛使用Python語(yǔ)言。另外,我們經(jīng)常訪問的集電影、讀書、音樂于一體的豆瓣網(wǎng),也是使用Python實(shí)現(xiàn)的。第二個(gè)領(lǐng)域是操作系統(tǒng)管理著的十分自動(dòng)化的運(yùn)作開發(fā),畢竟如果在平常的情況下,使用Python所編寫的系統(tǒng)管理腳本,不管是在可以非常容易地理解這一方面,或者是在性能及代碼的可用性的方面都比其他的shell腳本要優(yōu)秀。第三個(gè)領(lǐng)域是使用python進(jìn)行游戲的開發(fā),很多的游戲在進(jìn)行開發(fā)時(shí)都使用過它。不過,以上所說的幾個(gè)方面都只不過是Python應(yīng)用領(lǐng)域其中的一小部分,總的來(lái)說,Python語(yǔ)言不僅可以應(yīng)用到網(wǎng)絡(luò)編程、游戲開發(fā)等領(lǐng)域,還可以在圖形圖像處理、只能機(jī)器人、爬取數(shù)據(jù)、自動(dòng)化運(yùn)維等多方面展露頭角,為開發(fā)者提供簡(jiǎn)約、優(yōu)雅的編程體驗(yàn)。網(wǎng)絡(luò)爬蟲,它是一種按照一定的規(guī)則自動(dòng)地抓取萬(wàn)維網(wǎng)信息的程序或者腳本。網(wǎng)絡(luò)爬蟲主要應(yīng)對(duì)的問題有這樣三個(gè)點(diǎn):第一點(diǎn)是http請(qǐng)求,第二點(diǎn)是解析html源碼,而第三點(diǎn)則是應(yīng)對(duì)反爬機(jī)制。使用網(wǎng)絡(luò)爬蟲時(shí)要注意的問題有一點(diǎn)是,python的縮進(jìn)是很重要的,縮進(jìn)決定語(yǔ)句分組和層次,特別是在循環(huán)的時(shí)候一定要好好地看清楚。爬蟲所抓取的所有的網(wǎng)頁(yè)都會(huì)被保存在系統(tǒng)中,通過一定程度的分析以及挑選進(jìn)行建立索引,以此方便于在這以后的搜尋或者檢查,除此之外,你也可以使用爬蟲作為工具爬取圖片或者爬取視頻以及很多你想要爬取的信息或者數(shù)據(jù),只要你能通過瀏覽器訪問的數(shù)據(jù)都可以通過爬蟲獲取,通過這個(gè)過程所得到的分析結(jié)果,我們還可以對(duì)以后的抓取過程發(fā)出指令,甚至還能得到相應(yīng)的反饋。一直以來(lái),網(wǎng)絡(luò)爬蟲都被大量使用作為網(wǎng)絡(luò)的搜索引擎或者說作為其他的相似類別的作用,使用網(wǎng)絡(luò)爬蟲,我們可以收集所有通過網(wǎng)絡(luò)爬蟲可以訪問到的頁(yè)面內(nèi)容,而且這一過程是不需要我們自己手動(dòng)操作的,這一功能可以幫助我們獲取并且更新這些網(wǎng)站的內(nèi)容。通過網(wǎng)絡(luò)爬蟲我們可以抓取網(wǎng)絡(luò)上的數(shù)據(jù),而如果要實(shí)現(xiàn)網(wǎng)絡(luò)爬蟲,我們可以使用很多種的編程語(yǔ)言,在這些編程語(yǔ)言之中,python只不過是其中的一種。在進(jìn)行編寫代碼的時(shí)候,Python并不會(huì)檢測(cè)正在進(jìn)行編寫的代碼是不是可以正常的被使用或者正常的輸出你想要得到的結(jié)果,直到你點(diǎn)擊開始運(yùn)行的時(shí)候,python才會(huì)以你編寫的方式進(jìn)行運(yùn)行或者輸出結(jié)果,與此同時(shí)做出檢查,所以你可能會(huì)得到一些不正常的或者你并不想要得到的反饋。需要注意的是,在Python禁止進(jìn)行沒有明確定義的操作,比如數(shù)字加字符串。Python內(nèi)置豐富的數(shù)據(jù)類型,與Java、C++相比,這些數(shù)據(jù)類型有效地減少代碼的長(zhǎng)度。通過這兩周的夏季短學(xué)期實(shí)踐學(xué)習(xí),我初步了解到了一些基礎(chǔ)的編程知識(shí),體會(huì)到了互聯(lián)網(wǎng)帶給人們的便利生活,從這次夏季短學(xué)期實(shí)踐學(xué)習(xí)中感受到了互聯(lián)網(wǎng)和編程的魅力,使用python爬蟲的知識(shí),我們可以獨(dú)立地從網(wǎng)絡(luò)上獲取一些想要的資源,并且從獲取到的想要的資源中分析并提取有用的數(shù)據(jù)。這給我們的生活帶來(lái)了很多的便利以及增添了很多的樂趣,從網(wǎng)上我們可以了解到,Python是被稱為最好的人工智能語(yǔ)言的一種編程語(yǔ)言,靠Python的程序編寫我們可以實(shí)現(xiàn)開發(fā)人工智能各種各樣功能的想法,Python各種第三方機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)模塊的誕生大大降低了對(duì)機(jī)器學(xué)習(xí)算法、模型的建構(gòu)、訓(xùn)練和測(cè)試的難度。使得普通人通過簡(jiǎn)單地調(diào)用模塊的API就能夠?qū)崿F(xiàn)可進(jìn)行預(yù)測(cè)的某某神經(jīng)網(wǎng)絡(luò)。但是Python的功能不僅僅體現(xiàn)在成就人工智能的發(fā)展上,人工智能的發(fā)展也不僅僅依賴于python,Python自從在二十世紀(jì)九十年代誕生之后,一直到現(xiàn)今,它從不過是一種簡(jiǎn)單語(yǔ)言一直到被稱為通用語(yǔ)言,所能帶給我們的,不僅僅是現(xiàn)今因?yàn)槿斯ぶ悄苤耸挚蔁崴詡涫荜P(guān)注的功能,作為一門計(jì)算機(jī)語(yǔ)言,python在其他領(lǐng)域的發(fā)展以及應(yīng)用也是非常令人期待而且前景可觀的,而且在這一方面我們也值得去了解并且應(yīng)用。隨著學(xué)習(xí)計(jì)算機(jī)的熱潮被高高涌起,Python一步一步地成為了當(dāng)今最是受到使用者們喜歡的一門語(yǔ)言。它操作簡(jiǎn)單,容易使用,邏輯十分嚴(yán)謹(jǐn)而且資源豐富好獲取,因此它現(xiàn)在不僅僅成為了計(jì)算機(jī)學(xué)習(xí)與數(shù)據(jù)科學(xué)的語(yǔ)言的第一選擇,而且與此同時(shí),在數(shù)據(jù)爬取等方面成為了首當(dāng)其沖的選擇。而且,我們可以知道Python已經(jīng)被納入信息技術(shù)的高考,(即python已將被加進(jìn)了全國(guó)計(jì)算機(jī)等級(jí)考試的內(nèi)容),由此可見python已經(jīng)受到了戰(zhàn)略性的重視。我們都知道,很多編程語(yǔ)言的入門非常的困難,這直接導(dǎo)致大家剛剛學(xué)習(xí)語(yǔ)法的時(shí)候,很快就會(huì)喪失了一大半的興趣,然而,擁有足夠的興趣是讓我們繼續(xù)學(xué)習(xí)一門新技術(shù)的重要條件,俗話說的好,興趣就是最好的老師。編程很難,因此從絕對(duì)意義上來(lái)說,除非你曾經(jīng)擁有過編程經(jīng)驗(yàn),否則編程語(yǔ)言很難學(xué)習(xí)。但是,相對(duì)而言,Python的高級(jí)屬性、語(yǔ)法可讀性和語(yǔ)義直白性使得它比其他編程語(yǔ)言更容易學(xué)習(xí)。在進(jìn)行編程設(shè)計(jì)的時(shí)候,使用python就好像在做英語(yǔ)的語(yǔ)法設(shè)計(jì)一樣,Python在設(shè)計(jì)上堅(jiān)持了清晰劃一的風(fēng)格,這使得Python成為一門易讀、易維護(hù),并且被大量用戶所歡迎的、用途廣泛的語(yǔ)言。而且與其他許多編程語(yǔ)言相比,Python是一種相對(duì)而言比較”高級(jí)“的編程語(yǔ)言:它不需要(并且在許多的情況下,并不允許)用戶擔(dān)心太多底層細(xì)節(jié),而這是其他許多編程語(yǔ)言需要去處理的。這一點(diǎn)就使得Python極其容易上手。而且Python是一套比較平衡的編程語(yǔ)言,各方面都可以,無(wú)論是對(duì)其他編程語(yǔ)言的調(diào)用,和數(shù)據(jù)源的連接、讀取,對(duì)系統(tǒng)的操作,還是正則表達(dá)和文字處理,Python都有著明顯優(yōu)勢(shì)。而統(tǒng)計(jì)學(xué)作為一門專門與數(shù)據(jù)打交道的學(xué)科,與計(jì)算機(jī)的關(guān)系密不可分,所以python爬蟲技術(shù)在對(duì)統(tǒng)計(jì)學(xué)的實(shí)踐方面也非常有幫助。通過這個(gè)夏季短學(xué)期實(shí)踐學(xué)習(xí),我們可以發(fā)現(xiàn),編程語(yǔ)言對(duì)我們的專業(yè)——統(tǒng)計(jì)學(xué)有著極大的幫助,大量的統(tǒng)計(jì)數(shù)據(jù)可以用表格處理(即使用office中的excel表格進(jìn)行處理),數(shù)據(jù)收集可以用網(wǎng)路文件傳遞,抽查用隨機(jī)選取。必要時(shí)還可以安裝數(shù)據(jù)采集器,自動(dòng)完成數(shù)據(jù)采集和收集整理。通過編程語(yǔ)言的幫助,我們可以更加迅速,更加精確的分析統(tǒng)計(jì)數(shù)據(jù),這使我們的效率大大地提升了。所以,在統(tǒng)計(jì)學(xué)的專業(yè)里,掌握一門編程語(yǔ)言是非常有必要的,而在這個(gè)基礎(chǔ)上,我們可以發(fā)現(xiàn),python以他簡(jiǎn)單易學(xué),容易上手,能力均衡等的特點(diǎn),成為了我們一個(gè)很好的的選擇。通過在本專業(yè)——統(tǒng)計(jì)學(xué)幾個(gè)學(xué)期的學(xué)習(xí),我們學(xué)習(xí)了包括數(shù)學(xué)分析,高等代數(shù),概率論與數(shù)理統(tǒng)計(jì)以及空間解析幾何這些課程在內(nèi)的許多課程,與此同時(shí)我們也接觸了一些計(jì)算機(jī)基礎(chǔ)知識(shí),例如我們學(xué)習(xí)了word文檔,excel表格,PPT等基礎(chǔ)的辦公軟件的使用方法,眾所周知,統(tǒng)計(jì)學(xué)屬于應(yīng)用數(shù)學(xué),主要職能就是通過利用概率論的知識(shí)建立起相應(yīng)的數(shù)學(xué)模型,收集希望得到的數(shù)據(jù),然后進(jìn)一步進(jìn)行量化分析以及總結(jié),就此做出結(jié)果推斷,此后情況的預(yù)測(cè),為與所收集數(shù)據(jù)的相關(guān)決策提供有效直觀的依據(jù)以及參考,統(tǒng)計(jì)學(xué)不僅僅是表現(xiàn)在表面的單純的數(shù)字,而是在這之中包含了大量的復(fù)雜步驟,應(yīng)用十分廣泛。我們可以知道,統(tǒng)計(jì)學(xué)是以數(shù)學(xué)作為基礎(chǔ)知識(shí)支撐,以計(jì)算機(jī)編程知識(shí)作為輔助技能的一個(gè)學(xué)科。在計(jì)算機(jī)使用普及之前,統(tǒng)計(jì)學(xué)在處理一些數(shù)據(jù)時(shí)使用的方法非常的復(fù)雜繁瑣,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 職業(yè)噪聲對(duì)自主神經(jīng)功能的影響及機(jī)制
- 客服主管年終總結(jié)公式(3篇)
- 職業(yè)健康管理倫理問題探討
- 職業(yè)健康檔案電子化數(shù)據(jù)挖掘與早期干預(yù)策略
- 職業(yè)健康促進(jìn)工作規(guī)范化與可持續(xù)發(fā)展
- 齊齊哈爾2025年黑龍江齊齊哈爾市委網(wǎng)絡(luò)安全和信息化委員會(huì)辦公室直屬事業(yè)單位招聘筆試歷年參考題庫(kù)附帶答案詳解
- 韶關(guān)2025年廣東韶關(guān)市教育局直屬學(xué)校招聘臨聘教師23人筆試歷年參考題庫(kù)附帶答案詳解
- 西雙版納云南西雙版納州人力資源和社會(huì)保障局公益性崗位招聘筆試歷年參考題庫(kù)附帶答案詳解
- 舟山2025年下半年浙江舟山市屬事業(yè)單位招聘28人筆試歷年參考題庫(kù)附帶答案詳解
- 玉林2025年廣西玉林市第二幼兒園招聘安保人員筆試歷年參考題庫(kù)附帶答案詳解
- 心臟血管檢查課件
- 運(yùn)用PDCA循環(huán)管理提高手衛(wèi)生依從性課件
- 二手房定金合同(2023版)正規(guī)范本(通用版)1
- 《高職應(yīng)用數(shù)學(xué)》(教案)
- 點(diǎn)因素法崗位評(píng)估體系詳解
- 漢堡規(guī)則中英文
- DB63T 1933-2021無(wú)人機(jī)航空磁測(cè)技術(shù)規(guī)范
- YY/T 1843-2022醫(yī)用電氣設(shè)備網(wǎng)絡(luò)安全基本要求
- GB/T 5231-2022加工銅及銅合金牌號(hào)和化學(xué)成分
- GB/T 26480-2011閥門的檢驗(yàn)和試驗(yàn)
- GA/T 1356-2018國(guó)家標(biāo)準(zhǔn)GB/T 25724-2017符合性測(cè)試規(guī)范
評(píng)論
0/150
提交評(píng)論