版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、Python快速入門嵩 天實例3:中文詞語統(tǒng)計嵩 天Python快速入門單元開篇單元開篇(1) 中文詞語統(tǒng)計需求分析(2) 中文詞語統(tǒng)計實例編寫實例3:中文詞語統(tǒng)計聊天記錄詞語統(tǒng)計網(wǎng)絡(luò)文章詞語統(tǒng)計新聞文章詞語統(tǒng)計經(jīng)典名著詞語統(tǒng)計英文文本詞語統(tǒng)計文本重點信息概要詞語統(tǒng)計寫作風(fēng)格分析實例3:中文詞語統(tǒng)計Python快速入門中文詞語統(tǒng)計需求分析程序需求統(tǒng)計中文詞語出現(xiàn)次數(shù) 以政府一為例,統(tǒng)計出現(xiàn)的中文詞語數(shù)量 按照一定標(biāo)準(zhǔn)輸出,如出現(xiàn)次數(shù)等 需要解決中文分詞問題,如:這是一門好課-這是一門好課統(tǒng)計中文詞語出現(xiàn)次數(shù) 以每年政府一為例統(tǒng)計中文詞語出現(xiàn)次數(shù) 輸入:2018年一.txt 輸出:出現(xiàn)次數(shù)超過5
2、0次的詞語,不包括換行Python快速入門中文詞語統(tǒng)計實例編寫代碼演示#WordsCount.pyimport jiebaf =open(2018年一.txt, r,encoding=utf-8) txt =f.read()f.close() ls=jieba.lcut(txt) d=forw inls:fordw k in=d.get(w, d:0)+1if dk = 50and k !=n:print(出現(xiàn)次.format(k, dk)#WordsCount.py注釋import jiebaf =open(2018年一.txt, r,encoding=utf-8)txt =f.read()
3、 f.close()ls=jieba.lcut(txt) d=forw inls:fordw k in=d.get(w, d:0)+1if dk = 50and k !=n:print(出現(xiàn)次.format(k, dk)#WordsCount.pyimport jiebaf =open(2018年一.txt, r,encoding=utf-8) txt =f.read()f.close() ls=jieba.lcut(txt) d=for w in ls:dw=d.get(w, 0)+1for k in d:if dk = 50and k !=n:print(出現(xiàn)次.format(k, dk)
4、引入外部功能庫#WordsCount.pyimport jiebaf =open(2018年一.txt, r,encoding=utf-8) txt =f.read()f.close() ls=jieba.lcut(txt) d=for w in ls:dw=d.get(w, 0)+1for k in d:if dk = 50and k !=n:print(出現(xiàn)次.format(k, dk)打開文件關(guān)閉文件#WordsCount.pyimport jiebaf =open(2018年一.txt, r,encoding=utf-8) txt =f.read()f.close() ls=jieba
5、.lcut(txt) d=for w in ls:dw=d.get(w, 0)+1for k in d:if dk = 50and k !=n:print(出現(xiàn)次.format(k, dk)讀入文本#WordsCount.pyimport jiebaf =open(2018年一.txt, r,encoding=utf-8) txt =f.read()f.close() ls=jieba.lcut(txt) d=for w in ls:dw=d.get(w, 0)+1for k in d:if dk = 50and k !=n:print(出現(xiàn)次.format(k, dk)中文分詞#WordsC
6、ount.pyimport jiebaf =open(2018年一.txt, r,encoding=utf-8) txt =f.read()f.close() ls=jieba.lcut(txt) d=forw inls:fordw k in=d.get(w, d:0)+1if dk = 50and k !=n:print(出現(xiàn)次.format(k, dk)建立字典#WordsCount.pyimport jiebaf =open(2018年一.txt, r,encoding=utf-8) txt =f.read()f.close() ls=jieba.lcut(txt) d=for w in ls:dw=d.get(w, 0)+1for k in d:if dk = 50and k !=n:print(出現(xiàn)次.format(k, dk)利用字典詞語統(tǒng)計#WordsCount.pyimport jiebaf =open(2018年一.txt, r,encoding=utf-8) txt =f.read()f.close() ls=jieba.lcut(txt) d=for w in ls:dw=d.get(w, 0)+1for k in d:if dk = 50and k !=n:print(出現(xiàn)次.format(k, dk)遍歷結(jié)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026安徽皖信人力資源管理有限公司馬鞍山分公司招聘13人考試參考試題及答案解析
- 2026年滄州醫(yī)學(xué)高等專科學(xué)校單招綜合素質(zhì)筆試備考題庫帶答案解析
- 2026江蘇常州人才科創(chuàng)集團有限公司招收就業(yè)見習(xí)人員考試備考試題及答案解析
- 2026福建廣電網(wǎng)絡(luò)集團龍海分公司招聘2人考試備考題庫及答案解析
- 2026福建南平市順昌縣工業(yè)園區(qū)開發(fā)有限公司招聘1人考試參考試題及答案解析
- 2026年安康紫陽縣農(nóng)業(yè)發(fā)展集團有限公司招聘考試參考題庫及答案解析
- 2026全國工商聯(lián)直屬單位招聘5人考試參考試題及答案解析
- 2026廣西南寧橫州市總工會招聘社會化工會工作者8人考試參考試題及答案解析
- 2026青海西寧湟源縣公益性崗位招聘考試參考題庫及答案解析
- 2026年昭通市鹽津縣公安局警務(wù)輔助人員招聘(21人)考試參考試題及答案解析
- 2025年7月遼寧省普通高中學(xué)業(yè)水平合格性考試生物試題(原卷版)
- 抖音直播違規(guī)考試題及答案
- T/CAEPI 34-2021固定床蜂窩狀活性炭吸附濃縮裝置技術(shù)要求
- 購銷合同解除退款協(xié)議書
- 掛名合同協(xié)議書
- 2024年國家公務(wù)員考試國考中國人民銀行結(jié)構(gòu)化面試真題試題試卷及答案解析
- 商品混凝土實驗室操作手冊
- 裝飾裝修工程監(jiān)理月報
- 標(biāo)準(zhǔn)商品房買賣合同文本大全
- LY/T 3408-2024林下經(jīng)濟術(shù)語
- 2019人教版高中物理必修第一冊《第二章 勻變速直線運動的研究》大單元整體教學(xué)設(shè)計2020課標(biāo)
評論
0/150
提交評論