人工智能技術導論-課件 第3章 人工智能數(shù)據(jù)需求_第1頁
人工智能技術導論-課件 第3章 人工智能數(shù)據(jù)需求_第2頁
人工智能技術導論-課件 第3章 人工智能數(shù)據(jù)需求_第3頁
人工智能技術導論-課件 第3章 人工智能數(shù)據(jù)需求_第4頁
人工智能技術導論-課件 第3章 人工智能數(shù)據(jù)需求_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第3章人工智能數(shù)據(jù)需求目錄3.1事物、數(shù)據(jù)與信息3.2大數(shù)據(jù)基本特征3.3大數(shù)據(jù)的作用3.4人工智能依賴大數(shù)據(jù)學習目標本章主要從人工智能處理數(shù)據(jù)的視角,圍繞數(shù)據(jù)的類型、數(shù)據(jù)的特征、數(shù)據(jù)的作用、大數(shù)據(jù)與人工智能的相互關系等問題進行分析和討論,希望帶領讀者理解不同數(shù)據(jù)的形態(tài)和價值,正確看待人工智能時代的數(shù)字世界。理解事物、數(shù)據(jù)與信息的關系理解大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別理解大數(shù)據(jù)的類型、特征和作用理解人工智能與大數(shù)據(jù)的聯(lián)系與區(qū)別目錄3.1事物、數(shù)據(jù)與信息3.1事物、數(shù)據(jù)與信息

事物即客觀存在于自然界的一切物體或現(xiàn)象。

數(shù)據(jù)是一種將客觀事物按照某種測度感知而獲取的原始記錄,是反映客觀事物屬性的記錄,也是信息的具體表現(xiàn)形式。

自然界中事物的種類和形式的多種多樣的。隨著時代的變遷,記錄和描述事物的方式也不斷變化。3.1事物、數(shù)據(jù)與信息3.1.1自然事物與數(shù)據(jù)

數(shù)據(jù)和信息是兩個不同的概念,信息具有時效性且較為宏觀,它由數(shù)據(jù)的有序排列組合而成,傳達給讀者某個概念或方法等,而數(shù)據(jù)是構成信息的基本單位,離散且冗余的數(shù)據(jù)幾乎沒有任何實用價值。3.1.2數(shù)據(jù)與信息

數(shù)據(jù)和信息之間是相互聯(lián)系的。數(shù)據(jù)可以直接來自測量儀器的實時記錄,也可以來自人的認識,但是大量的數(shù)據(jù)多是借助于數(shù)據(jù)處理系統(tǒng)自動地從數(shù)據(jù)源進行采集和組織的。數(shù)據(jù)源是指客觀事物發(fā)生變化的實時數(shù)據(jù)。數(shù)據(jù)經(jīng)過加工處理之后,就成為信息。3.1.3數(shù)據(jù)的類型

數(shù)據(jù)有很多種,比如數(shù)字、文字、圖像、聲音等。常見的數(shù)據(jù)類型包括文本、圖片、音頻、視頻等。(1)文本

文本數(shù)據(jù)是指不能參與算術運算的任何字符,也稱為字符型數(shù)據(jù)。在計算機中,文本數(shù)據(jù)一般保存在文本文件中。文本文件是一種由若干行字符構成的計算機文件,常見格式包括ASCII、MIME和TXT等。

一個英文字母一個中文漢字一本新華字典一本康熙字典一套二十四史字符數(shù)量11720000665400050000000字節(jié)12144000013308000100000000存儲空間1B2B1.37M6.35M95.4M不同文本數(shù)據(jù)的所占存儲空間(ASCII碼格式)3.1.3數(shù)據(jù)的類型(2)圖片

圖片是指由圖形、圖像等構成的平面媒體,一般用圖片格式的文件來保存。圖片格式可分為點陣圖和矢量圖兩大類。jpg、bmp、gif、png、9.png等格式的圖片屬于點陣圖。Flash動畫制作軟件所生成的SWF等格式的文件和Photoshop繪圖軟件所生成的PSD等格式的圖片屬于矢量圖。同一畫面、不同屬性的照片所占存儲空間不同3.1.3數(shù)據(jù)的類型格式jpggifpng16位bmp24位bmp32位bmp存儲空間1.1M1.05M2.5M3.95M5.93M7.91M(3)音頻

數(shù)字化的聲音數(shù)據(jù)就是音頻數(shù)據(jù)。在計算機中,音頻數(shù)據(jù)一般用音頻文件的格式來保存。音頻文件是指存儲聲音內(nèi)容的文件,把音頻文件用一定的音頻程序執(zhí)行,就可以還原以前錄下的聲音。音頻文件的格式很多,包括WAV、MP3、WMA、AMR、CD、MID、RM等。同一內(nèi)容、不同格式的音頻數(shù)據(jù)所占存儲空間不同3.1.3數(shù)據(jù)的類型某段20秒音頻WAVMP3WMAAMR存儲空間3.19M297KB324KB322KB(4)視頻

視頻數(shù)據(jù)是指連續(xù)的圖像序列。在計算機中,視頻數(shù)據(jù)一般用視頻文件的格式來保存。視頻文件常見的格式包括MPEG-4、AVI、WMV、FLV、DAT、RM、MOV、ASF、DivX等。同一內(nèi)容、碼率、幀率、分辨率,但不同格式的視頻數(shù)據(jù)所占存儲空間不同3.1.3數(shù)據(jù)的類型某段10分鐘視頻MPEG-4AVIWMVFLV存儲空間21M96M81M95M3.2大數(shù)據(jù)基本特征

維克托?邁爾?舍恩伯格在《大數(shù)據(jù)時代》中提出了大數(shù)據(jù)的特點,即“4V”特征,包括:數(shù)據(jù)量大(Volume)、數(shù)據(jù)類型繁多(Variety)、處理速度快(Velocity)和價值密度低(Value)。維克托?邁爾?舍恩伯格

大數(shù)據(jù)(BigData)的中心詞是“數(shù)據(jù)”。從數(shù)據(jù)量的角度而言,大數(shù)據(jù)包括結構化、半結構化和非結構化數(shù)據(jù)。隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、智能手機等各種數(shù)字化終端設備的普及,數(shù)據(jù)呈現(xiàn)出爆炸式指數(shù)級增長,數(shù)字化已經(jīng)成為構建現(xiàn)代社會的基礎力量,每個人時刻都在產(chǎn)生大量的數(shù)據(jù)。3.2.1數(shù)據(jù)量大大數(shù)據(jù)的數(shù)據(jù)來源眾多,科學研究、企業(yè)應用和Web應用等都在源源不斷地生成新的類型繁多的數(shù)據(jù)。生物大數(shù)據(jù)、交通大數(shù)據(jù)、醫(yī)療大數(shù)據(jù)、電信大數(shù)據(jù)、電力大數(shù)據(jù)、金融大數(shù)據(jù)等,都呈現(xiàn)出“井噴式”增長,各行各業(yè),每時每刻,都在生成各種不同類型的數(shù)據(jù)。3.2.2數(shù)據(jù)類型繁多(1)消費者大數(shù)據(jù)(2)金融大數(shù)據(jù)(3)醫(yī)療大數(shù)據(jù)(4)城市大數(shù)據(jù)(5)工業(yè)大數(shù)據(jù)(6)其他大數(shù)據(jù)3.2.2數(shù)據(jù)類型繁多

大數(shù)據(jù)時代的數(shù)據(jù)產(chǎn)生速度非常快,很多應用都需要基于快速生成的數(shù)據(jù)給出實時分析結果,用于指導生產(chǎn)和生活實踐。因此,隨著科技的發(fā)展,科學計算對計算機的計算能力提出了越來越高的需求,衍生出了“超級計算機”。3.2.3處理速度快中國科學技術大學潘江偉院士團隊構建的量子計算原型機“九章二號”

大數(shù)據(jù)時代,數(shù)據(jù)的價值密度卻遠遠低于傳統(tǒng)關系型數(shù)據(jù)庫中已經(jīng)存在的那些數(shù)據(jù),很多有價值的信息都是分散在海量數(shù)據(jù)中。以我國的“天網(wǎng)監(jiān)控系統(tǒng)”為例,如果沒有意外事件發(fā)生,則連續(xù)不斷產(chǎn)生的數(shù)據(jù)都是沒有任何價值的,當發(fā)生特殊情況時,也只有記錄了事件過程的那一小段視頻是有價值的。由此可見,大數(shù)據(jù)的價值密度高低與其總量的大小成反比。3.2.4價值密度低3.3大數(shù)據(jù)的作用大數(shù)據(jù)的關鍵在于信息共享和互通,大數(shù)據(jù)的核心在于分析和決策。大數(shù)據(jù)正成為信息產(chǎn)業(yè)持續(xù)高速增長的新引擎,大數(shù)據(jù)的利用正成為提高核心競爭力的關鍵因素,各行各業(yè)的決策手段正在從“業(yè)務驅動”轉變?yōu)椤皵?shù)據(jù)驅動”。

大數(shù)據(jù)作為一種重要的戰(zhàn)略資產(chǎn),已經(jīng)不同程度地滲透到每個行業(yè)領域和部門,其深度應用不僅有助于企業(yè)經(jīng)營活動,還有利于推動國民經(jīng)濟發(fā)展,推動社會各個主體共同參與社會治理。3.3.1改變經(jīng)濟社會管理方式工業(yè)化時代商品和交易的快速流通催生大規(guī)模制造業(yè)發(fā)展。大數(shù)據(jù)時代,信息的大量、快速流通將伴隨著行業(yè)的融合發(fā)展,單一數(shù)據(jù)無法發(fā)揮最大效能,行業(yè)或部門之間相互交換數(shù)據(jù)已成為一種發(fā)展趨勢,使經(jīng)濟形態(tài)發(fā)生大范圍變化。3.3.2促進行業(yè)融合發(fā)展

信息消費作為一種以信息產(chǎn)品和服務為消費對象的活動,覆蓋多種服務形態(tài)、多種信息產(chǎn)品和多種服務模式。當圍繞數(shù)據(jù)的業(yè)務在數(shù)據(jù)規(guī)模、類型和變化速度達到一定程度時,大數(shù)據(jù)對產(chǎn)業(yè)發(fā)展的影響將隨之顯現(xiàn)。3.3.3推動產(chǎn)業(yè)轉型升級傳統(tǒng)產(chǎn)業(yè)實現(xiàn)產(chǎn)業(yè)轉型升級的四個階段

信息資源的開發(fā)和利用水平,在某種程度上代表著信息時代下社會的整體發(fā)展水平和運轉效率。大數(shù)據(jù)與智慧城市是信息化建設的內(nèi)容與平臺,兩者互為推動力量。智慧城市是大數(shù)據(jù)的源頭,大數(shù)據(jù)是智慧城市的內(nèi)核。3.3.4助力智慧城市建設

大數(shù)據(jù)時代,產(chǎn)業(yè)發(fā)展模式和格局正在發(fā)生深刻變革。圍繞著數(shù)據(jù)價值的行業(yè)創(chuàng)新發(fā)展將悄然影響各行各業(yè)的主營業(yè)態(tài)。而隨之帶來的,則是大數(shù)據(jù)產(chǎn)業(yè)下的創(chuàng)新商業(yè)模式。3.3.5創(chuàng)新商業(yè)模式大數(shù)據(jù)時代,采集、存儲、傳輸和處理數(shù)據(jù)都已經(jīng)成了容易實現(xiàn)的事情。面對復雜對象,可以通過大量數(shù)據(jù)甚至海量數(shù)據(jù)來全面、完整地刻畫對象,通過處理海量數(shù)據(jù)來找到研究對象的規(guī)律和本質。相比依賴于小數(shù)據(jù)和精確性的抽樣時代,大數(shù)據(jù)因為強調數(shù)據(jù)的完整性和混雜性,突出事務的關聯(lián)性,為解決問題提供了新的視角,幫助研究者進一步接近事實的真相。3.3.6改變科學研究的方法論傳統(tǒng)抽樣3.4人工智能依賴大數(shù)據(jù)

人工智能與大數(shù)據(jù)是緊密相關、相輔相成的兩種技術。從某種意義上來說人工智能本身也是一種大數(shù)據(jù)應用,正是大數(shù)據(jù)推動了人工智能技術的突破和產(chǎn)業(yè)落地,使其煥發(fā)出勃勃生機。人工智能三大要素

大數(shù)據(jù)時代,人工智能涉及的領域非常廣泛,深入人們的工作和生活各個方面,需要大量數(shù)據(jù)的應用和積累。隨著數(shù)據(jù)的不斷增加,引發(fā)了分析的需求,而分析讓大量的數(shù)據(jù)有了價值,嵌有人工智能的機器開始懂得用戶想要什么、需要干什么,并可以預測未來的變化或趨勢。當硬件性能逐漸提升、算力與算法越來越強大時,成本卻越來越低廉。在對人工智能系統(tǒng)進行訓練使用的數(shù)據(jù)量越大,數(shù)據(jù)質量越好,人工智能系統(tǒng)的質量就越高。3.4.1人工智能與大數(shù)據(jù)的聯(lián)系3.4.1人工智能與大數(shù)據(jù)的聯(lián)系(1)智能機器人(2)智能制造(3)智能農(nóng)業(yè)(4)其他

大數(shù)據(jù)將有用的數(shù)據(jù)從大量繁雜的數(shù)據(jù)中分離出來;人工智能則從大數(shù)據(jù)中獲取需要的數(shù)據(jù),并且借助大數(shù)據(jù)的處理速度來實現(xiàn)更快的運算與更好的應用。

大數(shù)據(jù)不會根據(jù)結果采取行動,只是分析結果。而人工

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論