大數(shù)據(jù) 處理技術(shù) 標(biāo)準(zhǔn)_第1頁(yè)
大數(shù)據(jù) 處理技術(shù) 標(biāo)準(zhǔn)_第2頁(yè)
大數(shù)據(jù) 處理技術(shù) 標(biāo)準(zhǔn)_第3頁(yè)
大數(shù)據(jù) 處理技術(shù) 標(biāo)準(zhǔn)_第4頁(yè)
大數(shù)據(jù) 處理技術(shù) 標(biāo)準(zhǔn)_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《大數(shù)據(jù)采集與預(yù)處理技術(shù)》課程標(biāo)準(zhǔn)課程類別:專業(yè)核心課適用對(duì)象:人工智能技術(shù)應(yīng)用授課單位:人工智能學(xué)院學(xué)分:3 學(xué)時(shí):56編寫執(zhí)筆人及編寫日期:***2025年6月12日審定負(fù)責(zé)人及審定日期:***2025年6月12日一、課程定位和課程設(shè)計(jì)(一)課程的性質(zhì)大數(shù)據(jù)采集與預(yù)處理技術(shù)是人工智能技術(shù)應(yīng)用專業(yè)核心課,是人工智能專業(yè)學(xué)生的必須掌握的基礎(chǔ)技能之一。該課程是程序設(shè)計(jì)基礎(chǔ)、數(shù)據(jù)分析技術(shù)等課程的延伸,是計(jì)算機(jī)視覺(jué)技術(shù)、深度學(xué)習(xí)應(yīng)用等核心課的基礎(chǔ)要求,是學(xué)生進(jìn)入人工智能領(lǐng)域的基礎(chǔ)必須條件。它主要介紹不同類型的人工智能數(shù)據(jù)采集方法及其預(yù)處理技術(shù),是大數(shù)據(jù)和人工智能等專業(yè)的基礎(chǔ)教程,通過(guò)豐富的項(xiàng)目案例,演示不同數(shù)據(jù)的采集方法。通過(guò)本課程的學(xué)習(xí),在學(xué)習(xí)過(guò)程中,通過(guò)各種類型的AI數(shù)據(jù)實(shí)踐項(xiàng)目和案例分析,學(xué)生將掌握面向不同人工智能任務(wù)的數(shù)據(jù)采集方法和預(yù)處理方法,從而加深人工智能數(shù)據(jù)采集和預(yù)處理的理解、應(yīng)用能力,為未來(lái)的專業(yè)發(fā)展打下堅(jiān)實(shí)的基礎(chǔ)。該課程以實(shí)踐為主,強(qiáng)調(diào)基于工作過(guò)程系統(tǒng)化學(xué)習(xí),是工學(xué)結(jié)合課程。(二)人才培養(yǎng)中的作用本課程主要學(xué)習(xí)大數(shù)據(jù)的采集、預(yù)處理方法和相關(guān)工具。目標(biāo)是培養(yǎng)人工智能訓(xùn)練師、數(shù)據(jù)標(biāo)注工程師、人工智能開發(fā)工程師對(duì)數(shù)據(jù)的采集和預(yù)處理能力。該課程作為人工智能技術(shù)應(yīng)用專業(yè)的專業(yè)核心課,開設(shè)學(xué)期為大二第一學(xué)期,具有較強(qiáng)的綜合應(yīng)用性和專業(yè)前瞻性,學(xué)生需具備python程序設(shè)計(jì)基礎(chǔ)、數(shù)據(jù)分析技術(shù)等專業(yè)基礎(chǔ)課程知識(shí),通過(guò)本門課程的學(xué)習(xí)進(jìn)一步鞏固專業(yè)知識(shí)和技能。本課程后續(xù)專業(yè)課程為計(jì)算機(jī)視覺(jué)應(yīng)用技術(shù)、深度學(xué)習(xí)框架、自然語(yǔ)言處理技術(shù)等課程,以實(shí)現(xiàn)對(duì)本專業(yè)知識(shí)的綜合應(yīng)用和專業(yè)能力的集中鍛煉。Python程序設(shè)計(jì)基礎(chǔ)Python程序設(shè)計(jì)基礎(chǔ)Python數(shù)據(jù)分析技術(shù)數(shù)據(jù)庫(kù)技術(shù)應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)深度學(xué)習(xí)框架應(yīng)用自然語(yǔ)言處理技術(shù)大模型應(yīng)用開發(fā)技術(shù)大數(shù)據(jù)采集與預(yù)處理為后續(xù)課程案例提供必要數(shù)據(jù)支持?jǐn)?shù)據(jù)采集和處理的必要技能數(shù)據(jù)標(biāo)注工程師人工智能訓(xùn)練師人工智能開發(fā)工程師對(duì)標(biāo)以下崗位必備技能(三)課程設(shè)計(jì)思路課程設(shè)計(jì)從課程對(duì)應(yīng)的就業(yè)崗位調(diào)研入手,分析得到對(duì)應(yīng)的四個(gè)典型數(shù)據(jù)類型采集項(xiàng)目,按“內(nèi)容由業(yè)務(wù)流程驅(qū)動(dòng)、遞進(jìn)實(shí)現(xiàn)業(yè)務(wù)目標(biāo)”的原則進(jìn)行整合后提煉出三個(gè)對(duì)應(yīng)的應(yīng)用項(xiàng)目九個(gè)任務(wù)。然后,根據(jù)高職學(xué)生的能力水平和學(xué)習(xí)特點(diǎn),采用真實(shí)應(yīng)用項(xiàng)目方式將教學(xué)案例設(shè)計(jì)為與工作情景對(duì)應(yīng)的九個(gè)學(xué)習(xí)情景。課程構(gòu)建實(shí)踐與理論教學(xué)并行的教、學(xué)、做三個(gè)層次的課程教學(xué)體系。即項(xiàng)目導(dǎo)向設(shè)計(jì)教學(xué);職業(yè)體驗(yàn)組織教學(xué);多種平臺(tái)實(shí)施教學(xué)。教學(xué)過(guò)程是讓學(xué)生通過(guò)工作角色扮演的方式進(jìn)入學(xué)習(xí)情景的課程實(shí)踐。通過(guò)職業(yè)體驗(yàn)式的學(xué)習(xí)來(lái)實(shí)現(xiàn)知識(shí)的學(xué)習(xí)和職業(yè)技能的培養(yǎng),以提高學(xué)生的學(xué)習(xí)興趣和增強(qiáng)學(xué)生未來(lái)的崗位適應(yīng)能力。二、課程目標(biāo)(一)素質(zhì)目標(biāo)通過(guò)大數(shù)據(jù)采集與預(yù)處理技術(shù)的學(xué)習(xí),能夠明白AI數(shù)據(jù)在當(dāng)前信息經(jīng)濟(jì)的重要作用,對(duì)工業(yè)生產(chǎn)、信息傳輸?shù)耐苿?dòng)作用。通過(guò)掌握人工智能各類任務(wù)的數(shù)據(jù)采集方法、數(shù)據(jù)預(yù)處理技術(shù)等基本知識(shí)和技能,培養(yǎng)學(xué)生的職業(yè)基本素養(yǎng)。通過(guò)項(xiàng)目鍛煉學(xué)生能熟練掌握?qǐng)D像數(shù)據(jù)、文本數(shù)據(jù)、語(yǔ)音數(shù)據(jù)的采集和預(yù)處理方法,掌握常見(jiàn)數(shù)據(jù)標(biāo)注軟件的使用技巧,使學(xué)生具有較強(qiáng)的動(dòng)手能力和精益求精的精神,通過(guò)持續(xù)實(shí)踐實(shí)驗(yàn)項(xiàng)目,使學(xué)生具備較強(qiáng)的動(dòng)手能力、實(shí)踐能力和繼續(xù)學(xué)習(xí)的能力。課程思政目標(biāo)職業(yè)素養(yǎng)工匠精神雙創(chuàng)精神1.培養(yǎng)學(xué)生樹立正確的價(jià)值觀;2.采取啟發(fā)式手段,引導(dǎo)學(xué)生批判性思考;3.將社會(huì)主義核心價(jià)值觀融入教學(xué)。1.掌握良好用戶體驗(yàn)的設(shè)計(jì)理念;2.掌握機(jī)器視覺(jué)的基本知識(shí)及應(yīng)用技能;3.培養(yǎng)良好的團(tuán)隊(duì)合作精神。1.精心打造軟件產(chǎn)品的追求和理念;2.不斷吸收前沿技術(shù)能力;3.追求精益求精的精神。1.不斷創(chuàng)造新成果的能力;2.具有把成果推廣、應(yīng)用到市場(chǎng)的能力。(二)能力目標(biāo)學(xué)生能夠根據(jù)人工智能應(yīng)用場(chǎng)景完成不同類型的數(shù)據(jù)采集,掌握通過(guò)公開數(shù)據(jù)集、爬蟲采集圖像數(shù)據(jù)、文本數(shù)據(jù)以及語(yǔ)音數(shù)據(jù),并能夠完成不同類型數(shù)據(jù)的清洗和預(yù)處理,根據(jù)深度模型業(yè)務(wù)需求,完成數(shù)據(jù)對(duì)象標(biāo)注,為數(shù)據(jù)分析和模型訓(xùn)練提供數(shù)據(jù)集。掌握通過(guò)爬蟲技術(shù)采集圖像數(shù)據(jù),能熟練使用常見(jiàn)的爬蟲依賴庫(kù)如lxml、requests、BeautifulSoup、scrapy等完成爬蟲程序編寫,了解反爬機(jī)制和反反爬處理方法。熟悉公開的圖像數(shù)據(jù)集的使用方法。掌握常見(jiàn)圖像處理庫(kù)如opencv、pytorch的使用,能通過(guò)圖像預(yù)處理程序完成圖像數(shù)據(jù)集的增強(qiáng)處理。能夠使用常見(jiàn)的圖像標(biāo)注工具完成圖像分類標(biāo)注、2D框標(biāo)注、多邊形標(biāo)注、關(guān)鍵點(diǎn)標(biāo)注等。掌握使用分布式爬蟲程序采集文本數(shù)據(jù)的方法,了解常見(jiàn)的文本公開數(shù)據(jù)集,并完成常見(jiàn)文本數(shù)據(jù)的采集和存儲(chǔ);能夠應(yīng)用常見(jiàn)的數(shù)據(jù)預(yù)處理工具對(duì)文本數(shù)據(jù)進(jìn)行清洗,能夠使用文本標(biāo)注工程軟件完成文本數(shù)據(jù)的標(biāo)注。能夠通過(guò)傳感器采集語(yǔ)音數(shù)據(jù),并使用常見(jiàn)語(yǔ)音轉(zhuǎn)換接口對(duì)語(yǔ)音數(shù)據(jù)轉(zhuǎn)換文本和標(biāo)注。掌握多模態(tài)數(shù)據(jù)的采集方式,并使用預(yù)處理工具對(duì)數(shù)據(jù)進(jìn)行清洗和預(yù)處理。三、課程內(nèi)容與要求(一)課程教學(xué)內(nèi)容與教學(xué)要求1、表情圖像數(shù)據(jù)采集1.1教學(xué)內(nèi)容:1.1.1表情圖像數(shù)據(jù)采集環(huán)境準(zhǔn)備1.1.2理解requests、lxml等依賴庫(kù)的使用1.1.3集成開發(fā)環(huán)境和OpenCV、PyTorch的安裝1.1.4了解常見(jiàn)的公開圖像數(shù)據(jù)集1.2教學(xué)要求掌握常見(jiàn)圖像數(shù)據(jù)的采集方法,能夠安裝配置圖像數(shù)據(jù)采集環(huán)境,配置相關(guān)的采集工具、接口。2、表情圖像數(shù)據(jù)采集實(shí)施2.1教學(xué)內(nèi)容:2.1.1編寫表情圖像采集爬蟲程序2.1.2分析常見(jiàn)網(wǎng)頁(yè)結(jié)構(gòu)和數(shù)據(jù)爬取方法2.1.3掌握爬蟲依賴庫(kù)requests使用方法2.1.4能夠解析爬取的網(wǎng)頁(yè)并提取數(shù)據(jù)2.2教學(xué)要求:能夠利用爬蟲依賴庫(kù)編寫表情圖像采集爬蟲程序,理解常見(jiàn)網(wǎng)頁(yè)結(jié)構(gòu)和數(shù)據(jù)讀取解析方法。完成表情圖像數(shù)據(jù)的爬取采集。3、表情圖像數(shù)據(jù)預(yù)處理3.1教學(xué)內(nèi)容:3.1.1PyTorch、OpenCV等對(duì)圖片進(jìn)行預(yù)處理3.1.2圖片批量預(yù)處理的方法和程序設(shè)計(jì)3.1.3對(duì)圖像進(jìn)行翻轉(zhuǎn)、旋轉(zhuǎn)、縮放、截取、平滑、銳化等常見(jiàn)處理3.1.4完成爬取圖像的TENSOR化、歸一化3.2教學(xué)要求:理解常見(jiàn)的圖片預(yù)處理庫(kù)的使用方法,掌握常見(jiàn)的PyTorch圖片預(yù)處理接口。對(duì)爬取的圖像進(jìn)行翻轉(zhuǎn)、旋轉(zhuǎn)、縮放、截取、平滑、銳化等預(yù)處理并Tensor化。4、表情圖像數(shù)據(jù)標(biāo)注4.1教學(xué)內(nèi)容:4.1.1掌握常見(jiàn)圖像標(biāo)注工具Labelme和LabelImg的安裝和配置。4.1.2熟悉圖像分類、2D框、多邊形、關(guān)鍵點(diǎn)等標(biāo)注4.1.3完成表情圖像數(shù)據(jù)的分類標(biāo)注,使用Labelme完成表情圖像的2D框標(biāo)注以及多邊形標(biāo)注,使用LabelImg完成表情圖像的關(guān)鍵點(diǎn)標(biāo)注。4.2教學(xué)要求:理解常見(jiàn)的圖片標(biāo)注工具使用方法,掌握常見(jiàn)的圖像標(biāo)注類型。學(xué)生能夠完成圖像數(shù)據(jù)的分類標(biāo)注、2D框標(biāo)注、多邊形標(biāo)注以及關(guān)鍵點(diǎn)標(biāo)注。5、豆瓣圖書數(shù)據(jù)采集5.1教學(xué)內(nèi)容:5.1.1了解分布式爬蟲框架的安裝和使用;5.1.2掌握爬蟲工具scrapy和redis框架的爬蟲程序開發(fā)流程;5.1.3掌握自然語(yǔ)言公開數(shù)據(jù)集的使用方法。5.2教學(xué)要求:了解scrapy框架、redis的安裝和配置,完成豆瓣圖書信息數(shù)據(jù)的爬蟲程序開發(fā)。掌握爬蟲數(shù)據(jù)數(shù)據(jù)庫(kù)存儲(chǔ)方法。了解常見(jiàn)的公開文本數(shù)據(jù)集的使用方法。6、圖書信息數(shù)據(jù)預(yù)處理6.1教學(xué)內(nèi)容:6.1.1掌握pandas數(shù)據(jù)處理依賴庫(kù)的安裝與配置;6.1.2完成圖書信息數(shù)據(jù)的重復(fù)值、缺失值、異常值處理;6.1.3完成圖書數(shù)據(jù)清洗,將描述性變量轉(zhuǎn)換為數(shù)值型變量;6.1.4完成文本數(shù)據(jù)的訓(xùn)練集、測(cè)試集劃分,將數(shù)據(jù)進(jìn)行規(guī)范化處理。6.2教學(xué)要求:完成圖書信息數(shù)據(jù)的預(yù)處理,能夠掌握文本數(shù)據(jù)重復(fù)值、缺失值、異常值處理方法;并能夠根據(jù)應(yīng)用場(chǎng)景完成描述性變量轉(zhuǎn)換、訓(xùn)練集測(cè)試集劃分以及規(guī)范化處理。7、圖書信息數(shù)據(jù)標(biāo)注7.1教學(xué)內(nèi)容: 7.1.1掌握常見(jiàn)的文本標(biāo)注類型,了解文本分類標(biāo)注、命名實(shí)體標(biāo)注、詞性標(biāo)注、句法依存分析、關(guān)系抽取、情感標(biāo)注、事件標(biāo)注、序列標(biāo)注等常見(jiàn)標(biāo)注類型。7.1.2掌握常見(jiàn)的文本標(biāo)注工具doccano、labelstudio等安裝使用方法。7.1.3能夠使用常見(jiàn)的文本標(biāo)注工具對(duì)圖書介紹等文本數(shù)據(jù)完成標(biāo)注。8、語(yǔ)音直播數(shù)據(jù)采集8.1教學(xué)內(nèi)容:8.1.1理解音頻基礎(chǔ)知識(shí)和常用的語(yǔ)音采集軟件;8.1.2了解常見(jiàn)的語(yǔ)音公開數(shù)據(jù)集下載方法;8.1.3能夠通過(guò)OBS等工具完成直播語(yǔ)音數(shù)據(jù)的采集;8.1.4能夠調(diào)用常見(jiàn)的語(yǔ)音轉(zhuǎn)寫接口完成語(yǔ)音轉(zhuǎn)寫。8.2教學(xué)要求:掌握語(yǔ)音采集設(shè)備的安裝和查看方法,完成語(yǔ)音收集源準(zhǔn)備,能夠編寫語(yǔ)音采集程序并完成語(yǔ)音轉(zhuǎn)寫。8、語(yǔ)音直播數(shù)據(jù)預(yù)處理8.1教學(xué)內(nèi)容:8.1.1了解常見(jiàn)的語(yǔ)音預(yù)處理類型如降采樣、去噪、分幀、預(yù)加重、特征提取、傅里葉變換、時(shí)間和幀率變換、可視化、語(yǔ)音增強(qiáng)等。8.1.2熟悉常見(jiàn)的語(yǔ)音預(yù)處理庫(kù)librosa、Scipy以及Noisereduce的安裝和使用;8.1.3能夠使用常見(jiàn)的語(yǔ)音預(yù)處理工具完成語(yǔ)音數(shù)據(jù)的預(yù)處理。8.2教學(xué)要求:掌握常見(jiàn)語(yǔ)音預(yù)處理工具如librosa、Scipy以及Noisereduce的安裝和使用,能夠使用以上工具完成語(yǔ)音數(shù)據(jù)的常見(jiàn)預(yù)處理操作。9、語(yǔ)音直播數(shù)據(jù)標(biāo)注9.1教學(xué)內(nèi)容:9.1.1了解常見(jiàn)的語(yǔ)音數(shù)據(jù)標(biāo)注類型庫(kù),如語(yǔ)音段標(biāo)注、語(yǔ)音詞語(yǔ)標(biāo)注、情感標(biāo)注以及標(biāo)注的質(zhì)量控制;9.1.2掌握常見(jiàn)的語(yǔ)音標(biāo)注工具如Praat、LabelStudio的安裝和使用;9.1.3完成語(yǔ)音直播數(shù)據(jù)文本轉(zhuǎn)錄、情感標(biāo)注以及事件標(biāo)注等典型標(biāo)注任務(wù);9.2教學(xué)要求:了解語(yǔ)音數(shù)據(jù)的常見(jiàn)標(biāo)注類型,能夠掌握常見(jiàn)的語(yǔ)音標(biāo)注工具的安裝和使用;能夠根據(jù)應(yīng)用場(chǎng)景完成語(yǔ)音數(shù)據(jù)的常見(jiàn)標(biāo)注任務(wù)。(二)課程學(xué)時(shí)分配學(xué)時(shí)分配表序號(hào)教學(xué)內(nèi)容(按課題或知識(shí)單元)學(xué)時(shí)其中講授實(shí)踐其他1表情圖像數(shù)據(jù)采集8442表情圖像數(shù)據(jù)預(yù)處理8443表情圖像數(shù)據(jù)標(biāo)注4224圖書信息數(shù)據(jù)采集8445圖書信息數(shù)據(jù)預(yù)處理8446圖書信息數(shù)據(jù)標(biāo)注4227語(yǔ)音直播數(shù)據(jù)采集4228語(yǔ)音直播數(shù)據(jù)預(yù)處理8449語(yǔ)音直播數(shù)據(jù)標(biāo)注422學(xué)時(shí)總計(jì)562828四、實(shí)踐教學(xué)(一)課內(nèi)實(shí)踐項(xiàng)目實(shí)驗(yàn)一1、名稱:表情圖像數(shù)據(jù)采集實(shí)驗(yàn)2、內(nèi)容:(1)安裝配置數(shù)據(jù)集成開發(fā)環(huán)境;(2)安裝采集環(huán)境依賴包lxml、requests以及BeautifulSoup;(3)使用公開數(shù)據(jù)集采集表情圖像數(shù)據(jù);(4)分析常見(jiàn)的網(wǎng)站爬蟲表情圖片方法;(5)開發(fā)表情圖像爬蟲采集程序并完成圖像數(shù)據(jù)采集。3、目的要求:(1)掌握python爬蟲程序相關(guān)依賴庫(kù)的安裝和使用。(2)掌握常見(jiàn)的圖像數(shù)據(jù)集采集方法。4、課時(shí)數(shù):4學(xué)時(shí)實(shí)驗(yàn)二1、名稱:表情圖像數(shù)據(jù)預(yù)處理實(shí)驗(yàn)2、內(nèi)容:(1)安裝配置torchvision等常見(jiàn)的圖像預(yù)處理庫(kù),掌握常見(jiàn)的圖像預(yù)處理類型;(2)完成表情圖像常見(jiàn)的翻轉(zhuǎn)、旋轉(zhuǎn)、顏色轉(zhuǎn)換、飽和度增強(qiáng)、清晰化、濾波等操作。(3)完成表情圖像數(shù)據(jù)的歸一化、張量化、訓(xùn)練集和測(cè)試集劃分操作。3、目的要求:(1)掌握?qǐng)D像數(shù)據(jù)的常見(jiàn)預(yù)處理方法;(2)掌握?qǐng)D像數(shù)據(jù)面向人工智能模型的常見(jiàn)操作;4、課時(shí)數(shù):4學(xué)時(shí)實(shí)驗(yàn)三1、名稱:表情圖像數(shù)據(jù)標(biāo)注實(shí)驗(yàn)2、內(nèi)容:(1)安裝常見(jiàn)的圖像數(shù)據(jù)標(biāo)注軟件如Labelme\LabelImg等;(2)熟悉常見(jiàn)的圖像標(biāo)注類型如分類、2D框、多邊形、關(guān)鍵點(diǎn)等標(biāo)注;(3)結(jié)合表情圖像面向的不同深度學(xué)習(xí)模型處理任務(wù)完成圖像標(biāo)注;3、目的要求:(1)掌握常見(jiàn)的圖像標(biāo)注工具安裝和使用;(2)掌握?qǐng)D像標(biāo)注類型和標(biāo)注方法;(3)能夠根據(jù)業(yè)務(wù)場(chǎng)景完成圖像標(biāo)注。4、課時(shí)數(shù):4學(xué)時(shí)實(shí)驗(yàn)四1、名稱:圖書信息數(shù)據(jù)采集2、內(nèi)容:(1)安裝配置Scrapy爬蟲依賴庫(kù)和分布式工具redis;(2)設(shè)計(jì)開發(fā)分布式豆瓣圖書數(shù)據(jù)爬蟲程序;(3)完成圖像信息數(shù)據(jù)的采集和數(shù)據(jù)持久化。3、目的要求:(1)掌握分布式爬蟲程序的開發(fā)方法;(2)掌握常見(jiàn)的分布式爬蟲工具;(3)能夠根據(jù)業(yè)務(wù)場(chǎng)景完成數(shù)據(jù)持久化。4、課時(shí)數(shù):2學(xué)時(shí)實(shí)驗(yàn)五1、名稱:圖書信息數(shù)據(jù)預(yù)處理實(shí)驗(yàn)2、內(nèi)容:(1)安裝和配置常見(jiàn)數(shù)據(jù)清洗工具如pandas,掌握其常用的數(shù)據(jù)處理接口;(2)完成圖書信息數(shù)據(jù)的預(yù)處理,如重復(fù)值、缺失值、異常值等處理;(3)完成圖書信息數(shù)據(jù)的描述性變量轉(zhuǎn)換、訓(xùn)練集測(cè)試集劃分、數(shù)據(jù)規(guī)范化等操作;3、目的要求:(1)掌握常見(jiàn)文本數(shù)據(jù)清洗方法;(2)掌握文本數(shù)據(jù)常見(jiàn)預(yù)處理操作。4、課時(shí)數(shù):4學(xué)時(shí)實(shí)驗(yàn)六1、名稱:圖書信息數(shù)據(jù)標(biāo)注實(shí)驗(yàn)2、內(nèi)容:(1)安裝和配置常見(jiàn)文本標(biāo)注工具如doccano、LabelStudio等;(2)了解常見(jiàn)的文本標(biāo)注類型如命名實(shí)體標(biāo)注、情感標(biāo)注、關(guān)系標(biāo)注等;(3)面向不同的深度學(xué)習(xí)處理模型完成圖像信息數(shù)據(jù)的文本標(biāo)注。3、目的要求:(1)掌握常見(jiàn)文本數(shù)據(jù)標(biāo)注工具使用方法;(2)掌握文本數(shù)據(jù)常見(jiàn)的標(biāo)注操作。(3)熟悉不同文本標(biāo)注數(shù)據(jù)所適用的深度學(xué)習(xí)模型處理場(chǎng)景。4、課時(shí)數(shù):4學(xué)時(shí)實(shí)驗(yàn)七1、名稱:語(yǔ)音直播數(shù)據(jù)采集實(shí)驗(yàn)2、內(nèi)容:(1)掌握音頻數(shù)據(jù)采集環(huán)境配置(2)熟悉語(yǔ)音數(shù)據(jù)的采集場(chǎng)景和采集方法(3)完成語(yǔ)音數(shù)據(jù)程序的編寫(4)完成語(yǔ)音數(shù)據(jù)的采集和保存3、目的要求:(1)掌握語(yǔ)音數(shù)據(jù)采集環(huán)境配置方法(2)能夠根據(jù)實(shí)際場(chǎng)景編寫語(yǔ)音采集程序(3)能夠?qū)φZ(yǔ)音數(shù)據(jù)進(jìn)行采集保存(4)掌握循環(huán)、實(shí)時(shí)、自動(dòng)采集程序編寫方法4、課時(shí)數(shù):4學(xué)時(shí)實(shí)驗(yàn)八1、名稱:語(yǔ)音直播數(shù)據(jù)預(yù)處理實(shí)驗(yàn)2、內(nèi)容:(1)完成語(yǔ)音預(yù)處理常見(jiàn)庫(kù)librosa、Scipy、Noisereduce等安裝和使用場(chǎng)景;(2)完成語(yǔ)音數(shù)據(jù)的預(yù)處理如去噪、預(yù)加重、傅里葉變換、特征提取、濾波等;(3)完成語(yǔ)音直播數(shù)據(jù)的預(yù)處理操作。3、目的要求:(1)了解常見(jiàn)語(yǔ)音數(shù)據(jù)預(yù)處理方法;(2)掌握常見(jiàn)的語(yǔ)音預(yù)處理工具使用;(3)掌握常見(jiàn)的語(yǔ)音預(yù)處理程序開發(fā)設(shè)計(jì)方法。4、課時(shí)數(shù):2學(xué)時(shí)實(shí)驗(yàn)九1、名稱:數(shù)據(jù)直播標(biāo)注實(shí)驗(yàn)2、內(nèi)容:(1)完成常見(jiàn)語(yǔ)音數(shù)據(jù)標(biāo)注工具如Praat、LabelStudio的安裝,熟悉其使用方法。(2)使用語(yǔ)音數(shù)據(jù)標(biāo)注工具完成語(yǔ)音直播數(shù)據(jù)的文本轉(zhuǎn)錄;(3)使用語(yǔ)音數(shù)據(jù)標(biāo)注工具完成語(yǔ)音直播數(shù)據(jù)的情感標(biāo)注、事件標(biāo)注等任務(wù);3、目的要求:(1)了解常見(jiàn)的語(yǔ)音標(biāo)注工具安裝和使用方法;(2)熟悉語(yǔ)音數(shù)據(jù)標(biāo)注類型和適用場(chǎng)景;(3)掌握常見(jiàn)的語(yǔ)音數(shù)據(jù)標(biāo)注方法。4、課時(shí)數(shù):2學(xué)時(shí)實(shí)踐教學(xué)安排表(以實(shí)踐項(xiàng)目先后順序編排)序號(hào)實(shí)踐項(xiàng)目學(xué)時(shí)備注1表情圖

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論