Python數(shù)據(jù)挖掘與機器學習實戰(zhàn) - 選題_第1頁
Python數(shù)據(jù)挖掘與機器學習實戰(zhàn) - 選題_第2頁
Python數(shù)據(jù)挖掘與機器學習實戰(zhàn) - 選題_第3頁
Python數(shù)據(jù)挖掘與機器學習實戰(zhàn) - 選題_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、 Python數(shù)據(jù)挖掘與機器學習實戰(zhàn)選題大綱(一組一章,第一章除外)第一章:Python機器學習入學指南1.1、機器學習要解決的任務 1.2、有監(jiān)督與無監(jiān)督問題 1.3、線性回歸算法原理推導 1.4、Python語言基礎1.5、Python數(shù)據(jù)結構(列表,字典,元組)1.6、科學計算庫Numpy基礎 1.7、Numpy數(shù)組操作 1.8、Numpy矩陣基本操作 1.9、Numpy矩陣初始化與創(chuàng)建 1.10、Numpy排序與索引第二章:邏輯回歸與數(shù)據(jù)分析處理庫Pandas2.1、Pandas數(shù)據(jù)讀取與現(xiàn)實 2.2、Pandas樣本數(shù)值計算與排序2.3、Pandas數(shù)據(jù)預處理與透視表 2.4、Pan

2、das自定義函數(shù) 2.5、Pandas核心數(shù)據(jù)結構Series詳解 2.6、Pandas數(shù)據(jù)索引2.7、邏輯回歸-sigmoid函數(shù) 2.8、邏輯回歸原理推導2.9、最優(yōu)化問題 2.10、實戰(zhàn)梯度下降算法案例實戰(zhàn):(自己定)第三章:案例實戰(zhàn)(自己定)3.1、數(shù)據(jù)與算法簡介3.2、樣本不平衡問題解決思路3.3、下采樣解決方案 3.4、正則化參數(shù)選擇 3.5、邏輯回歸建模 3.6、過采樣與SMOTE算法3.7、Matplotlib繪制第一個折線圖 3.8、Matplotlib條形圖,直方圖,四分圖繪制3.9、Matplotlib數(shù)據(jù)可視化分析 第四章:決策樹與隨機森林4.1、熵原理,信息增益 4.

3、2、決策樹構造原理推導4.3、ID3,C4.5算法 4.4、決策樹剪枝策略4.5、隨機森林算法原理 4.6、基于隨機森林的特征重要性選擇案例實戰(zhàn):(自己定)第五章:Kaggle機器學習案例實戰(zhàn)5.1、泰坦尼克船員獲救預測(可自己定)5.2、使用pandas庫進行數(shù)據(jù)讀取與缺失值預處理5.3、使用scikit-learn庫對比回歸模型與隨機森林模型5.4、GBDT構造原理 5.5、特征的選擇與重要性衡量指標5.6、機器學習中的級聯(lián)模型 5.7、使用級聯(lián)模型再戰(zhàn)泰坦尼克第六章:支持向量機算法6.1、SVM要解決的問題 6.2、線性SVM原理推導6.3、SVM對偶問題與核變換 6.4、soft支持向

4、量機問題 6.5、多類別分類問題解決方案 案例實戰(zhàn):SVM中參數(shù)對結果的影響(可自己定)第七章:神經(jīng)網(wǎng)絡模型7.1、前向傳播與反向傳播結構 7.2、激活函數(shù)7.3、神經(jīng)網(wǎng)絡結構 7.4、深入神經(jīng)網(wǎng)絡細節(jié) 7.5、神經(jīng)網(wǎng)絡表現(xiàn)效果 案例實戰(zhàn):神經(jīng)網(wǎng)絡處理圖像分類任務(可自己定)第八章:mnist手寫字體識別8.1、Tensorflow框架 8.2、CNN網(wǎng)絡結構 8.3、構造CNN網(wǎng)絡結構8.4、基于tensorflow的網(wǎng)絡框架 8.5、迭代優(yōu)化訓練第九章:經(jīng)典案例實戰(zhàn)(根據(jù)自己情況確定)9.1、鳶尾花數(shù)據(jù)集分析 9.2、基于NLP的股價預測 9.3、員工離職預測9.4、新聞分類任務 9.5、

5、詞向量模型與LSTM情感分析第十章:聚類與集成算法10.1、k-means,DBSCAN等經(jīng)典聚類算法原理 10.2、python實現(xiàn)k-means算法10.3、聚類算法應用場景與特征工程 10.4、Adaboost集成算法原理案例實戰(zhàn):聚類算法可視化演示(可自己定)第十一章:其他機器學習算法11.1 在線學習 11.2 遷移學習 11.3增強學習 11.4 LSTM 11.5 GAN最新機器學習算法(可自己定)案例實戰(zhàn):(可自己定)或從下列選題中選擇:(除第1講)選題名稱內(nèi)容結構內(nèi)容要求第1講機器學習與Python庫(該講不可選)解釋器Python3.6與IDE:Anaconda/Pycha

6、rm1.Python基礎:列表/元組/字典/類/文件2.numpy/scipy/matplotlib/panda的介紹和典型使用3.多元高斯分布4.典型圖像處理5.scikit-learn的介紹和典型使用6.多種數(shù)學曲線7.多項式擬合8.快速傅里葉變換FFT9.奇異值分解SVD10.Soble/Prewitt/Laplacian算子與卷積網(wǎng)絡代碼和案例實踐1.卷積與(指數(shù))移動平均線2.股票數(shù)據(jù)分析3.實際生產(chǎn)問題中算法和特征的關系4.缺失數(shù)據(jù)的處理5.環(huán)境數(shù)據(jù)異常檢測和分析 第2講回歸線性回歸1.Logistic/Softmax回歸2.廣義線性回歸3.L1/L2正則化4.Ridge與LASS

7、O5.Elastic Net6.梯度下降算法:BGD與SGD7.特征選擇與過擬合8.Softmax回歸的概念源頭9.最大熵模型10.K-L散度代碼和案例實踐1.股票數(shù)據(jù)的特征提取和應用2.泰坦尼克號乘客缺失數(shù)據(jù)處理和存活率預測3.環(huán)境檢測數(shù)據(jù)異常分析和預測4.模糊數(shù)據(jù)查詢和數(shù)據(jù)校正方法5.PCA與鳶尾花數(shù)據(jù)分類6.二手車數(shù)據(jù)特征選擇與算法模型比較7.廣告投入與銷售額回歸分析8.鳶尾花數(shù)據(jù)集的分類第3講決策樹和隨機森林熵、聯(lián)合熵、條件熵、KL散度、互信息1.最大似然估計與最大熵模型2.ID3、C4.5、CART詳解3.決策樹的正則化4.預剪枝和后剪枝5.Bagging6.隨機森林7.不平衡數(shù)據(jù)集

8、的處理8.利用隨機森林做特征選擇9.使用隨機森林計算樣本相似度10.異常值檢測代碼和案例實踐1.隨機森林與特征選擇2.決策樹應用于回歸3.多標記的決策樹回歸4.決策樹和隨機森林的可視化5.社會學人群收入預測6.葡萄酒數(shù)據(jù)集的決策樹/隨機森林分類7.泰坦尼克乘客存活率估計第4講SVM線性可分支持向量機1.軟間隔2.損失函數(shù)的理解3.核函數(shù)的原理和選擇4.SMO算法5.支持向量回歸SVR6.多分類SVM代碼和案例實踐:1.原始數(shù)據(jù)和特征提取2.調(diào)用開源庫函數(shù)完成SVM3.葡萄酒數(shù)據(jù)分類4.數(shù)字圖像的手寫體識別5.MNIST手寫體識別6.SVR用于時間序列曲線預測7.SVM、Logistic回歸、隨

9、機森林 三者的橫向比較第5講聚類各種相似度度量及其相互關系1.Jaccard相似度和準確率、召回率2.Pearson相關系數(shù)與余弦相似度3.K-means與K-Medoids及變種4.AP算法(Sci07)/LPA算法及其應用5.密度聚類DBSCAN/DensityPeak(Sci14)6.譜聚類SC7.聚類評價和結果指標代碼和案例實踐:1.K-Means+算法原理和實現(xiàn)2.向量量化VQ及圖像近似3.并查集的實踐應用4.密度聚類的異常值檢測5.譜聚類用于圖片分割第6講隱馬爾科夫模型HMM主題模型LDA1.詞潛入和word2vec2.前向/后向算法3.HMM的參數(shù)學習4.Baum-Welch算法

10、詳解5.Viterbi算法詳解6.隱馬爾科夫模型的應用優(yōu)劣比較7.共軛先驗分布8.Laplace平滑9.Gibbs采樣詳解10.Metropolis-Hastings算法11.MCMC代碼和案例實踐:1.敏感話題分析2.網(wǎng)絡爬蟲的原理和代碼實現(xiàn)3.LDA開源包的使用和過程分析4.HMM用于中文分詞第7講卷積神經(jīng)網(wǎng)絡卷積神經(jīng)網(wǎng)絡模型介紹1.神經(jīng)網(wǎng)絡結構,濾波器,卷積,池化,激活函數(shù),反向傳播2.目標分類與識別、目標檢測與追蹤l 經(jīng)典AlexNet3.高級卷積網(wǎng)絡模型:VGG、ResNet、GoogleLeNet、DenseNet4.深度圖片生成網(wǎng)絡U-Net5.物體檢測:RCNN,F(xiàn)ast-RCNN,F(xiàn)aster-RCNN, FPN系列代碼和案例實踐:1.如何搭建自己的卷積神經(jīng)網(wǎng)絡2.遷移學習(Transfer Learning)3.基于CNN的圖像識別4.實時人臉檢測系統(tǒng)(視頻流處理+識別+定位 RCNN)5.CNN文本分類6.卷積神經(jīng)網(wǎng)絡調(diào)參經(jīng)驗分享第8講循環(huán)神經(jīng)網(wǎng)絡RNN進階1.RNN基本原理2.LSTM、GRU3.注

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論