QQ群采集器使用方法_第1頁
QQ群采集器使用方法_第2頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 4/4QQ群采集器使用方法 http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用方法 群是騰訊公司推出的多人聊天交流的一個公眾平臺,群主在創(chuàng)建群以后,可以邀請朋友或者有共同興趣愛好的人到一個群里面聊天。所以群對于營銷人員來說是一個很精準的渠道,那么如何使用群采集器去采集呢。下面為大家詳細使用八爪魚采集器采集群的方法。 采集網站: http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /member.html 使用功能點: Cookie登錄 Ajax點擊 修

2、改Xpath 步驟1:創(chuàng)建群采集任務 1)進入主界面,選擇“自定義采集” http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟1 2)將要采集的網站URL復制粘貼到輸入框中,點擊“保存網址” http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟2 步驟2:Cookie登錄 1)打開網頁后,需要先登錄,可以先在手機登錄, 采集時點擊登錄按鈕,之后掃碼就可以成功登錄?;蛘唠娔X登錄,點擊二維碼右邊的頭像進行登錄。 http:/./doc/8f

3、68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟3 2)登陸后,在高級選項中選擇自定義cookie,勾選打開網頁時使用固定cookie,再點擊獲取當前頁面cookie,最后點擊“確定”,這樣以后再采集時就不用重復登錄了。(cookie有效時間以具體情況為準,到一定時間會失效,失效需重新登錄獲取cookie,另外如果是點擊頭像(電腦登錄的)需要把之前的點擊頭像登錄的點擊元素刪除) http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟4 步驟3:Ajax點擊 登錄

4、后,選擇需要采集的群,然后在右面的提示框中選擇“點擊該元素” http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟5 由于網頁涉及Ajax技術。所以需要選中點擊元素,打開“高級選項”,勾選“Ajax 加載數據”,設置時間為“15秒”。執(zhí)行前等待設置7秒, 因為頁面打開后需要向下滑動才可以出現更多內容,所以還需要設置頁面滾動,滾動次數選擇20次,(滾動次數具體看群成員的數量,如果500個人,一般來說選擇25次能全部加載完)每次間隔1秒,完成后,點擊“確定”。 http:/./doc/8f68e694cf2f0066f

5、5335a8102d276a2002960e6.html 群采集器使用步驟6 步驟4:提取元素 1)選擇第一個號碼以及昵稱(綠色的位置),如果想采集群名片,性別,Q齡,入群時間,最后發(fā)言,也是可以選擇的,然后在右面的提示框中選擇“選中全部”,隨后選擇“采集元素”。 http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟7 步驟5:修改Xpath 1)手動執(zhí)行規(guī)則,發(fā)現循環(huán)列表里并沒有定位到所有元素,所以需要修改xpath,在循環(huán)方式中選擇不固定元素列表,修改xpath為/tbodyclass=list/tr http

6、:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟8 步驟5:數據采集及導出 1)打開流程按鈕,修改采集字段名稱,點擊“保存并開始采集” http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟9 2)啟動本地采集 http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟10 3)采集完成后,會跳出提示,選擇“導出數據”選擇“合適的導出方式”,將采集好的數據導出這里我們選

7、擇excel作為導出為格式,一份完好的號碼以及昵稱數據就采集好了,數據導出后如下圖 http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 群采集器使用步驟11 http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 相關采集教程: 說說采集:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/sscj 微博粉絲信息采集:http:/./doc/8f68e694cf2f0066f5335a81

8、02d276a2002960e6.html /tutorial/wbyhxxcj 百家號爆文采集:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/bjharticlecj 微博采集方法:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/weibocj 百度相關搜索關鍵詞采集:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/bdxgssc

9、j 百度知道問答采集方法以及詳細步驟:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/zhidao 微信公眾號熱門文章采集:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/wxcjimg 豆瓣電影爬蟲使用方法:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/dbmoviecrawl 知乎爬蟲規(guī)則使用方法:http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html /tutorial/zhihucrawl 八爪魚90萬用戶選擇的網頁數據采集器。 http:/./doc/8f68e694cf2f0066f5335a8102d276a2002960e6.html 1、操作簡單,任何人都可以用:無需技術背景,會上網就能采集。完全可視化流程,點擊鼠標完成操作,2分鐘即可快速入門。 2、功能強大,任何網站都可以采:對于點擊、登陸、翻頁、識別驗證碼、瀑布流、Ajax腳本異步加載數據的網

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論