《大數(shù)據(jù)分析技術(shù)》-課程設(shè)計(jì)課題 鉆石品質(zhì)的識(shí)別_第1頁
《大數(shù)據(jù)分析技術(shù)》-課程設(shè)計(jì)課題 鉆石品質(zhì)的識(shí)別_第2頁
《大數(shù)據(jù)分析技術(shù)》-課程設(shè)計(jì)課題 鉆石品質(zhì)的識(shí)別_第3頁
《大數(shù)據(jù)分析技術(shù)》-課程設(shè)計(jì)課題 鉆石品質(zhì)的識(shí)別_第4頁
《大數(shù)據(jù)分析技術(shù)》-課程設(shè)計(jì)課題 鉆石品質(zhì)的識(shí)別_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

PAGEPAGE2學(xué)號(hào)組長成員1成員2成員3大數(shù)據(jù)分析技術(shù)課程設(shè)計(jì)課題鉆石品質(zhì)的識(shí)別學(xué)生姓名組長成員1成員2成員3院部數(shù)學(xué)與計(jì)算機(jī)學(xué)院專業(yè)班級(jí)指導(dǎo)教師二○二*年六月PAGE3目錄摘要 3一.問題描述 1二.?dāng)?shù)學(xué)建模 22.1問題分析 22.2符號(hào)系統(tǒng) 22.3合理的簡化的假設(shè) 22.4模型建立 2三.系統(tǒng)開發(fā) 33.1系統(tǒng)設(shè)計(jì) 33.1.1系統(tǒng)參數(shù)說明 33.1.2系統(tǒng)架構(gòu) 33.2系統(tǒng)實(shí)現(xiàn) 33.3系統(tǒng)使用說明 4四.結(jié)論 5參考文獻(xiàn) 6摘要從總體上闡述文章要解決的問題、分析問題的主要思路、針對(duì)問題建立的模型以及最終的計(jì)算結(jié)果,摘要內(nèi)容不少于500字。關(guān)鍵詞:列出文章中出現(xiàn)的關(guān)鍵詞匯及數(shù)學(xué)用語。PAGE7一.問題描述鉆石(Diamonds)數(shù)據(jù)集是python自帶數(shù)據(jù)集。該數(shù)據(jù)集包含了53940顆鉆石的重量、切割質(zhì)量、顏色、純度、深度、臺(tái)面、價(jià)格、長x、寬y、高z共十個(gè)特征,詳情見文件鉆石數(shù)據(jù)集.xlsx中“鉆石相關(guān)數(shù)據(jù)”表。其中相應(yīng)特征的含義見圖1及表1。圖1鉆石示意圖表1鉆石十個(gè)特征的具體含義序號(hào)特征含義1克拉鉆石的重量2切割質(zhì)量鉆石的切工,有5個(gè)等級(jí),由低到高依次為Fair(最低)、Good、VeryGood、Premium、Ideal(最高)3顏色從J(最差)到D(最好)4純度鉆石的純凈度,從低到高依次為I1(最差)、SI2、SI1、VS2、VS1、VVS2、VVS1、IF(最佳)5深度鉆石的總深度,由X,Y,Z計(jì)算而得:深度=100×6臺(tái)面鉆石的臺(tái)面比例7價(jià)格以美元計(jì)價(jià)8長(X)鉆石長度,單位:mm9寬(Y)鉆石寬度,單位:mm10高(Z)鉆石高度,單位:mm本設(shè)計(jì)需要完成下述任務(wù):有理由相信,鉆石價(jià)格體現(xiàn)了鉆石的品質(zhì)。試由“鉆石相關(guān)數(shù)據(jù)”表分析影響價(jià)格的因素有哪些?給出對(duì)價(jià)格影響由大到小的因素的順序。試根據(jù)表“鉆石相關(guān)數(shù)據(jù)”建立價(jià)格由其他9個(gè)特征表征的數(shù)學(xué)模型,對(duì)模型進(jìn)行評(píng)估,并應(yīng)用于預(yù)測(cè)“待識(shí)別鉆石”表中77顆鉆石的價(jià)格。鉆石價(jià)格是對(duì)鉆石品質(zhì)的精細(xì)刻畫,但有時(shí)對(duì)鉆石品質(zhì)的描述不必如此細(xì)致,按等級(jí)來描述鉆石的品質(zhì)更為常見。請(qǐng)自擬標(biāo)準(zhǔn)對(duì)表“鉆石相關(guān)數(shù)據(jù)”中的價(jià)格分為5個(gè)等級(jí),建立鉆石等級(jí)模型,并應(yīng)用于預(yù)測(cè)“待識(shí)別鉆石”表中77顆鉆石的等級(jí)。將上述解答過程整理為一個(gè)通用的鉆石品質(zhì)識(shí)別模型,并通過Python或其它語言實(shí)現(xiàn)后封裝為鉆石品質(zhì)識(shí)別函數(shù),供相關(guān)單位或個(gè)人使用。注:需附使用說明。

二.?dāng)?shù)學(xué)建模2.1問題分析2.2符號(hào)系統(tǒng)2.3合理的簡化的假設(shè)2.4模型建立2.5模型求解

三.系統(tǒng)開發(fā)將前面研究結(jié)果集成為一個(gè)系統(tǒng)。3.1系統(tǒng)設(shè)計(jì)3.1.1系統(tǒng)參數(shù)說明一、輸入?yún)?shù)二、輸出參數(shù)3.1.2系統(tǒng)架構(gòu)AppSVM建模SVC訓(xùn)練fit評(píng)估內(nèi)預(yù)測(cè)準(zhǔn)確率accuracy_score預(yù)測(cè)3.2系統(tǒng)實(shí)現(xiàn)#集成開始#〇、導(dǎo)庫fromsklearn.svmimportSVC#導(dǎo)入數(shù)據(jù)分割函數(shù):將數(shù)據(jù)分割為訓(xùn)練集和測(cè)試集fromsklearn.model_selectionimporttrain_test_split#導(dǎo)入模型評(píng)估函數(shù)fromsklearn.metricsimportaccuracy_score#一、算法集成defAppSVM(X,y,data,c=1,kernel='rbf',gamma=2,test_size=0.3):#輸入?yún)?shù)說明~~~~~~~~~#1.X,y=對(duì)象在其特征上的觀測(cè)數(shù)據(jù)及其對(duì)應(yīng)的類別,都是數(shù)據(jù)框,是已經(jīng)完成預(yù)處理的數(shù)據(jù)。#2.data=待識(shí)別對(duì)象在其特征上的觀測(cè)值,是一個(gè)數(shù)據(jù)框,是已經(jīng)完成預(yù)處理的數(shù)據(jù)。#3.支持向量機(jī)參數(shù)設(shè)置#c=懲罰因子,應(yīng)用于SVC;默認(rèn)參數(shù),默認(rèn)值為1。#kernel=指定支持向量機(jī)的核函數(shù);默認(rèn)參數(shù),默認(rèn)值為“rbf”(高斯核函數(shù))。#gamma=僅當(dāng)核函數(shù)為“rbf”時(shí)有效,是平衡支持向量個(gè)數(shù)的參數(shù):#gamma越大,支持向量越少,gamma值越小,支持向量越多;#默認(rèn)參數(shù),默認(rèn)值為1。#4.test_size=X,y中數(shù)據(jù)用于測(cè)試的比例,默認(rèn)參數(shù),默認(rèn)值為0.3。#輸出參數(shù)說明~~~~~~~~~#1.results=字典型數(shù)據(jù),其鍵為:#labels=對(duì)應(yīng)的預(yù)測(cè)結(jié)果#accuracy=模型的識(shí)別準(zhǔn)確率,包含回代準(zhǔn)確率和測(cè)試準(zhǔn)確率#套路開始#1.建模model=SVC(C=c,kernel=kernel,gamma=gamma)#2.訓(xùn)練#2.1分割訓(xùn)練集和測(cè)試集X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=test_size,random_state=42)#2.2訓(xùn)練模型model.fit(X_train,y_train)#3.評(píng)估#3.1系統(tǒng)內(nèi)預(yù)測(cè)以計(jì)算預(yù)測(cè)準(zhǔn)確率#3.1.1回代預(yù)測(cè)y_pred_train=model.predict(X_train)#3.1.2測(cè)試預(yù)測(cè)y_pred_test=model.predict(X_test)#3.2據(jù)內(nèi)預(yù)測(cè)結(jié)果計(jì)算預(yù)測(cè)準(zhǔn)確率#3.2.1回代準(zhǔn)確性acc_train=accuracy_score(y_train,y_pred_train)print("訓(xùn)練集預(yù)測(cè)準(zhǔn)確率:",acc_train)#3.2.2測(cè)試準(zhǔn)確性acc_test=accuracy_score(y_test,y_pred_test)print("測(cè)試集預(yù)測(cè)準(zhǔn)確率:",acc_test)#4.預(yù)測(cè)labels=model.predict(data)#5.輸出結(jié)果--results={}results['預(yù)測(cè)類別'

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論