下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第Java獲取網(wǎng)站圖片的示例代碼目錄前提一、新建Maven項目,導(dǎo)入Jsoup環(huán)境依賴二、代碼編寫心得:
前提
最近我的的朋友瀏覽一些網(wǎng)站,看到好看的圖片,問我有沒有辦法不用手動一張一張保存圖片!
我說用Jsoup丫!
測試網(wǎng)站
打開開發(fā)者模式(F12),找到對應(yīng)圖片的鏈接,在互聯(lián)網(wǎng)中,每一張圖片就是一個鏈接!
一、新建Maven項目,導(dǎo)入Jsoup環(huán)境依賴
groupIdorg.jsoup/groupId
artifactIdjsoup/artifactId
version1.11.2/version
/dependency
二、代碼編寫
publicclassJsoupTest{
publicstaticvoidmain(String[]args)throwsIOException{
//爬蟲的網(wǎng)站
Stringurl="/s/caU6d6ebpsLVJaf-7gMjtg";
//獲得網(wǎng)頁的document對象
Documentdocument=Jsoup.parse(newURL(url),10000);
//爬取含圖片的代碼部分
Elementcontent=document.getElementById("js_content");
//獲取img標簽代碼這是個集合
Elementsimgs=content.getElementsByTag("img");
//命名圖片的id
intid=0;
for(Elementimg:imgs){
//獲取具體的圖片
Stringpic=img.attr("data-src");
URLtarget=newURL(pic);
//獲取連接對象
URLConnectionurlConnection=target.openConnection();
//獲取輸入流,用來讀取圖片信息
InputStreaminputStream=urlConnection.getInputStream();
//獲取輸出流輸出地址+文件名
id++;
FileOutputStreamfileOutputStream=newFileOutputStream("E:\\JsoupPic\\"+id+".png");
intlen=0;
//設(shè)置一個緩存區(qū)
byte[]buffer=newbyte[1024*1024];
//寫出圖片到E:\JsoupPic中,輸入流讀數(shù)據(jù)到緩沖區(qū)中,并賦給len
while((len=inputStream.read(buffer))0){
//參數(shù)一:圖片數(shù)據(jù)參數(shù)二:起始長度參數(shù)三:終止長度
fileOutputStream.write(buffer,0,len);
System.out.println(id+".png下載完畢");
//關(guān)閉輸入輸出流最后創(chuàng)建先關(guān)閉
fileOutputStream.close();
inputStream.close();
}
成果:
心得:
1、網(wǎng)絡(luò)上的每一張圖片都是一個鏈接
2、我們知道整個網(wǎng)頁就是一個文檔數(shù),先找到包含圖片的父id,再通過getElementsByTag()獲取到圖片的標簽,通過F12,我們知道圖片的鏈接
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年天津地鐵9號線綜合站務(wù)員招聘備考題庫及完整答案詳解一套
- 2026年中國瑞達投資發(fā)展集團有限公司招聘備考題庫及完整答案詳解一套
- 2026年南京中遠海運船舶設(shè)備配件有限公司招聘備考題庫及1套完整答案詳解
- 2025年衢州市屬國有企業(yè)冬季公開招聘備考題庫附答案詳解
- 麗水市2025浙江麗水云和縣事業(yè)單位招聘35人-統(tǒng)考筆試歷年參考題庫典型考點附帶答案詳解(3卷合一)
- 臨湘市2025湖南岳陽臨湘市場監(jiān)督管理局下屬單位招20人筆試歷年參考題庫典型考點附帶答案詳解(3卷合一)
- 東莞東莞市石排鎮(zhèn)下屬事業(yè)單位2025年招聘4人筆試歷年典型考點題庫附帶答案詳解
- 上海市2025第一季度上海歌劇院(第二批)工作人員招聘1人筆試歷年參考題庫典型考點附帶答案詳解(3卷合一)
- 上海上海芭蕾舞團2025年第三季度第二批工作人員招聘筆試歷年備考題庫附帶答案詳解
- 2025年兒童安全教育五年推廣:課程開發(fā)與場景模擬政策影響報告
- 2026長治日報社工作人員招聘勞務(wù)派遣人員5人參考題庫及答案1套
- 2026年菏澤學(xué)院單招職業(yè)傾向性考試題庫附答案解析
- 實際問題與一次函數(shù)課件2025-2026學(xué)年人教版八年級數(shù)學(xué)下冊
- 2025年天津科技大學(xué)毛澤東思想和中國特色社會主義理論體系概論期末考試模擬題及答案1套
- 2024年鹽城市體育局直屬事業(yè)單位招聘真題
- 南方航空安全員培訓(xùn)
- 2025-2026學(xué)年嶺南美版(新教材)初中美術(shù)七年級上冊期末綜合測試卷及答案
- DB11∕T 2398-2025 水利工程巡視檢查作業(yè)規(guī)范
- 2025秋國家開放大學(xué)《政府經(jīng)濟學(xué)》期末機考精準復(fù)習(xí)題庫
- PCB設(shè)計規(guī)范-MD元器件封裝庫尺寸要求
- 番茄的營養(yǎng)及施肥
評論
0/150
提交評論