人工智能基礎(chǔ)與應(yīng)用 課件 2.3人工智能的數(shù)據(jù)服務(wù)_第1頁(yè)
人工智能基礎(chǔ)與應(yīng)用 課件 2.3人工智能的數(shù)據(jù)服務(wù)_第2頁(yè)
人工智能基礎(chǔ)與應(yīng)用 課件 2.3人工智能的數(shù)據(jù)服務(wù)_第3頁(yè)
人工智能基礎(chǔ)與應(yīng)用 課件 2.3人工智能的數(shù)據(jù)服務(wù)_第4頁(yè)
人工智能基礎(chǔ)與應(yīng)用 課件 2.3人工智能的數(shù)據(jù)服務(wù)_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人工智能基礎(chǔ)與應(yīng)用人工智能的數(shù)據(jù)服務(wù)主講人:郁云人工智能課程團(tuán)隊(duì)目錄|

CONTENTS數(shù)據(jù)采集和預(yù)處理01數(shù)據(jù)標(biāo)注和標(biāo)記數(shù)據(jù)存儲(chǔ)和管理0302數(shù)據(jù)分析和挖掘04數(shù)據(jù)隱私和安全0501數(shù)據(jù)采集和預(yù)處理AI數(shù)據(jù)服務(wù)首要步驟,目標(biāo)是獲取足夠數(shù)量和質(zhì)量的數(shù)據(jù)以支持AI模型的訓(xùn)練。來(lái)源公開(kāi)數(shù)據(jù)集、企業(yè)內(nèi)部數(shù)據(jù)、用戶生成內(nèi)容等數(shù)據(jù)采集對(duì)收集到的原始數(shù)據(jù),進(jìn)行噪聲、缺失值和異常值等問(wèn)題處理數(shù)據(jù)預(yù)處理數(shù)據(jù)采集和預(yù)處理02數(shù)據(jù)標(biāo)注和標(biāo)記數(shù)據(jù)標(biāo)注和標(biāo)記

將原始數(shù)據(jù)轉(zhuǎn)化為機(jī)器學(xué)習(xí)算法可理解的形式的過(guò)程,通過(guò)標(biāo)注后的數(shù)據(jù),機(jī)器可以學(xué)習(xí)到各種任務(wù),如分類(lèi)、回歸、目標(biāo)檢測(cè)等數(shù)據(jù)標(biāo)注和標(biāo)記標(biāo)注類(lèi)型定義用例圖像標(biāo)注對(duì)未經(jīng)處理的圖片數(shù)據(jù)進(jìn)行加工處理,轉(zhuǎn)換為機(jī)器可識(shí)別信息,然后輸送到人工智能算法和模型里完成調(diào)用。有語(yǔ)義分割、矩形框標(biāo)注、多邊形標(biāo)注、關(guān)鍵點(diǎn)標(biāo)注、點(diǎn)云標(biāo)注、3D立方體標(biāo)注、2D/3D融合標(biāo)注、目標(biāo)追蹤等。語(yǔ)音標(biāo)注標(biāo)注員把語(yǔ)音中包含的文字信息、各種聲音先“提取”出來(lái),再進(jìn)行轉(zhuǎn)寫(xiě)或者合成,標(biāo)注后的數(shù)據(jù)主要被用于人工智能機(jī)器學(xué)習(xí),使計(jì)算機(jī)可以擁有語(yǔ)音識(shí)別能力。有ASA語(yǔ)音轉(zhuǎn)寫(xiě)、語(yǔ)音切割、語(yǔ)音清洗、情緒判斷、聲紋識(shí)別、音素標(biāo)注、韻律標(biāo)注、發(fā)音校對(duì)等。3D點(diǎn)云標(biāo)注一般由激光雷達(dá)等3D掃描設(shè)備獲取空間若干點(diǎn)的信息,包括XYZ位置信息、RGB顏色信息和強(qiáng)度信息等,是一種多維度的復(fù)雜數(shù)據(jù)集合。有3D點(diǎn)云目標(biāo)檢測(cè)標(biāo)注、3D點(diǎn)云語(yǔ)義分割標(biāo)注、2D3D融合標(biāo)注、點(diǎn)云連續(xù)幀標(biāo)注等。文本標(biāo)注對(duì)文本進(jìn)行特征標(biāo)記的過(guò)程,使其打上具體的語(yǔ)義、構(gòu)成、語(yǔ)境、目的、情感等數(shù)據(jù)標(biāo)簽,通過(guò)標(biāo)注好的訓(xùn)練數(shù)據(jù),教會(huì)機(jī)器如何來(lái)識(shí)別文本中所隱含的意圖或者情感,使機(jī)器可以更好地理解語(yǔ)言。有OCR轉(zhuǎn)寫(xiě)、詞性標(biāo)注、命名實(shí)體標(biāo)注、語(yǔ)句泛化、情感分析、句子編寫(xiě)、意圖匹配、文本判斷、文本匹配、文本信息抽取、文本清洗、機(jī)器翻譯等。數(shù)據(jù)標(biāo)注在人工智能中的重要性

在人工智能發(fā)展歷程中,數(shù)據(jù)一直被當(dāng)作“血液”。數(shù)據(jù)標(biāo)注是人工智能算法得以有效運(yùn)營(yíng)的關(guān)鍵環(huán)節(jié),想要實(shí)現(xiàn)人工智能就要先讓計(jì)算機(jī)學(xué)會(huì)理解并具備判斷事物的能力。數(shù)據(jù)標(biāo)注的過(guò)程就是通過(guò)人工貼標(biāo)的方式,為機(jī)器系統(tǒng)提供大量學(xué)習(xí)的樣本,數(shù)據(jù)標(biāo)注是把需要機(jī)器識(shí)別和分辨的數(shù)據(jù)打上標(biāo)簽,然后讓計(jì)算機(jī)不斷地學(xué)習(xí)這些數(shù)據(jù)的特征,最終實(shí)現(xiàn)計(jì)算機(jī)能夠自主識(shí)別。可以說(shuō)數(shù)據(jù)決定了AI的落地程度,精準(zhǔn)的數(shù)據(jù)集產(chǎn)品和高度定制化數(shù)據(jù)服務(wù)更是受到各大企業(yè)的重視。這要求我們?cè)讷@取數(shù)據(jù)、處理數(shù)據(jù)都需要保持謹(jǐn)慎、細(xì)致的工作態(tài)度。數(shù)據(jù)標(biāo)注和標(biāo)記03數(shù)據(jù)存儲(chǔ)和管理數(shù)據(jù)存儲(chǔ)和管理數(shù)據(jù)存儲(chǔ)和管理是指對(duì)數(shù)據(jù)的保存、組織、保護(hù)和使用的過(guò)程。在現(xiàn)代信息系統(tǒng)中,數(shù)據(jù)存儲(chǔ)和管理是至關(guān)重要的,它們確保企業(yè)能夠有效地利用數(shù)據(jù)資源,支持業(yè)務(wù)運(yùn)營(yíng)和決策制定。用于數(shù)據(jù)分析和報(bào)告,而大數(shù)據(jù)技術(shù)適用于處理大規(guī)模數(shù)據(jù)集數(shù)據(jù)倉(cāng)庫(kù)云存儲(chǔ)服務(wù)關(guān)系型數(shù)據(jù)庫(kù)(如MySQL和PostgreSQL)和非關(guān)系型數(shù)據(jù)庫(kù)(如MongoDB和Cassandra),用于不同的數(shù)據(jù)存儲(chǔ)需求存儲(chǔ)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),支持大數(shù)據(jù)分析數(shù)據(jù)湖用于數(shù)據(jù)分析和報(bào)告,而大數(shù)據(jù)技術(shù)(如Hadoop和Spark)適用于處理大規(guī)模數(shù)據(jù)集數(shù)據(jù)倉(cāng)庫(kù)提供可擴(kuò)展的在線存儲(chǔ)解決方案云存儲(chǔ)服務(wù)關(guān)系型數(shù)據(jù)庫(kù)(如MySQL和PostgreSQL)和非關(guān)系型數(shù)據(jù)庫(kù)(如MongoDB和Cassandra),用于不同的數(shù)據(jù)存儲(chǔ)需求數(shù)據(jù)庫(kù)用于數(shù)據(jù)提取、轉(zhuǎn)換和加載數(shù)據(jù)集成和ETL工具04數(shù)據(jù)分析和挖掘數(shù)據(jù)分析和挖掘數(shù)據(jù)挖掘是指對(duì)大規(guī)模數(shù)據(jù)進(jìn)行分析,以發(fā)現(xiàn)其中潛在的模式、規(guī)律或關(guān)聯(lián)性的過(guò)程。其目的在于從數(shù)據(jù)中提取有價(jià)值的信息,以支持決策制定、預(yù)測(cè)未來(lái)趨勢(shì)等。數(shù)據(jù)分析是指對(duì)數(shù)據(jù)進(jìn)行收集、清洗、轉(zhuǎn)換和建模等處理,以獲得對(duì)問(wèn)題的洞察和理解的過(guò)程,旨在揭示數(shù)據(jù)背后的意義,為決策提供支持和指導(dǎo)。數(shù)據(jù)分析和挖掘在醫(yī)學(xué)領(lǐng)域,腫瘤判斷的分類(lèi)模型可能采用傳統(tǒng)的機(jī)器學(xué)習(xí)算法,如支持向量機(jī)、決策樹(shù)和隨機(jī)森林等,也可能采用深度學(xué)習(xí)模型,如卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)。05數(shù)據(jù)隱私和安全數(shù)據(jù)隱私?主要關(guān)注個(gè)人或組織的敏感信息、隱私和權(quán)利的保護(hù),確保這些信息不被未經(jīng)授權(quán)的人訪問(wèn)、收集、使用或泄露。01保護(hù)數(shù)據(jù)免受外部攻擊者和惡意內(nèi)部人員的侵害,確保數(shù)據(jù)在存儲(chǔ)、傳輸和處理過(guò)程中不受損害、不被篡改、不被丟失或泄露02數(shù)據(jù)隱私數(shù)據(jù)安全數(shù)據(jù)隱私和安全數(shù)據(jù)隱私和安全種類(lèi)描述信息泄露?數(shù)據(jù)可能被盜取或竊取,包括通過(guò)網(wǎng)絡(luò)攻擊、黑客攻擊、病毒攻擊等方式。數(shù)據(jù)濫用?數(shù)據(jù)可能被濫用,如用于詐騙、身份盜竊、勒索等不正當(dāng)用途。數(shù)據(jù)篡改數(shù)據(jù)可能被篡改,包括通過(guò)數(shù)據(jù)挖掘、數(shù)據(jù)篡改等技術(shù)手段。?數(shù)據(jù)丟失?由于數(shù)據(jù)發(fā)布或傳輸流程存在缺陷、存儲(chǔ)介質(zhì)丟失、維修或處置失誤等原因?qū)е旅舾袛?shù)據(jù)泄露。?數(shù)據(jù)完整性受損?數(shù)據(jù)可能被篡改、刪除或破壞,導(dǎo)致無(wú)法正確使用

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論