2023人工智能技術(shù)基礎(chǔ)_第1頁
2023人工智能技術(shù)基礎(chǔ)_第2頁
2023人工智能技術(shù)基礎(chǔ)_第3頁
2023人工智能技術(shù)基礎(chǔ)_第4頁
2023人工智能技術(shù)基礎(chǔ)_第5頁
已閱讀5頁,還剩282頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

目錄TOC\o"1-3"\h\u25526 724291.1AI 729441.1.1火熱的 7149451.1.2AI 987491.2AI 951021.3AI 14286551. 145242. 14275283.基于大數(shù)據(jù)的AI 15227944. 15139091.4AI 154991.5AI 1613773AI 17211372.1 1776762.2 23139582.3 2773532.4AI 3314877(1) 335033(2) 3319656(3) 3432596(4) 3499(5) 3423503(6) 3429617 3571133.1 35188703.1.1 35115233.1.2 35237613.1.3 3675413.1.4 3750693.1.5 37201443.1.6 38123433.2 39207983.2.1 39268213.2.2 4041083.2.3 40306093.2.4 41297343.2.5 41172573.2.6 42110823.3 43175573.3.1 43205113.3.2 4322263.3.3 44268983.4 4557911. 4569462. 45149863. 4561904. 45173075. 45195793.5 45183893.5.1scikit-learn 45116543.5.2 46266613.5.3Jupyter 47236553.5.4 497602 5382704.1 5389434.1.1 5386724.1.2把定量特征二值化(用于列向量 54240624.1.3 54221424.1.4缺失值處理(用于列向量 5580354.1.5 56170804.1.6 56243474.2 56136984.2.1 57131944.2.2Wrapper 57271094.2.3 57227674.2.4 57110594.3 5854214.4 58143644.4.1數(shù)據(jù)相關(guān)性分析(手工選擇特征 58253914.4.2 59171594.4.3 61271944.4.4 628865 63104615.1 6370445.2誤差和 6414440 6413405 64299675.3 65204755.4 66307505.5 69259055.5.1 69319875.5.2 6910866(1) 6920114(2) 6931626(3)早停法(Early 692832(4) 7012770(5) 70131025.6 70113175.7 7428622 76267876.1 7610796.1.1 76277656.1.2 77233536.1.3 78202606.1.4 78108356.1.5 7910266.1.6K 79324796.1.7 80198366.1.8 80243746.1.9隨機森林(Random 81163266.1.10 81290686.2支持向量機(SVM) 82255406.3 84124676.4KNN 85288196.4.1超參數(shù) 86185811.基于距離的權(quán)重 8657842.KNN 8750306.4.2KNN 87275616.4.3 89104436.5 89189056.6 9296026.6.1 92157416.6.2集成算法之 92323436.6.3集成算法之 92174946.7 93122616.7.1K 94284206.7.2 94156036.7.3 95161816.7.4 9626726.7.5 97123336.7.6 98287626.8 9911736.8.1 100201816.8.2 10029926.8.3 10112540 104249457.1 10449137.1.1 10420547.1.2 105207277.1.3 106283597.1.4 10678377.1.5 106229687.2 107218277.2.1 107302027.2.2 107194557.2.3 10727817.2.4 10738847.3 107298147.3.1 10738797.3.2 109153261.L1/L2 109271422.Dropout(隨機失活 1096587.4 110205037.5 117249577.6 11716668 11986348.1TensorFlow 11942578.1.1tf.estimator 11992388.2第一個TensorFlow 123209698.2.1 12341528.2.2 124174448.2.3 12478198.2.4 126117168.2.5 129250888.2.6 135102468.2.7 138216208.3 14180858.3.1 142105358.3.2 143304688.3.3 14429158.4 152233828.4.1 152285368.4.2字符串數(shù)據(jù)和獨熱編碼(One-Hot 153259978.4.3枚舉數(shù)據(jù)(分類數(shù)據(jù) 153288188.4.4 153147588.4.5 153189898.4.6分箱(分桶) 15458268.4.7 15512849TensorFlow 165105699.1 165166459.1.1 165141379.1.2FTRL 167161489.1.3分箱(分桶) 170164029.1.4 173111599.2L2 175135629.3 177119459.4 179212549.4.1ROC和 179309509.4.2 179145429.4.3 180259009.5L1 19222974 201542910.1 2011759410.1.1 2011846210.1.2 202846110.1.3 2032511710.1.4 204711010.2 213587510.3 232432310.3.1 2322991610.3.2 2332227410.3.3 2341537110.4 248241710.4.1 248382410.4.2 2491940310.4.3 2491072310.4.4 25070541. 25212532.深度神經(jīng)網(wǎng)絡(luò)(DNN) 254100593.在DNN 2556285 261828211.1 261189911.2 261254071. 262141732. 262297293. 2626834. 262307175. 262995811.3 2632265811.4 2642011附錄 26528597 26516848附錄 26829968 26816119附錄 27026107 2705048附錄 27220308 272第1機器人是人類的古老夢想。古希臘神話中已經(jīng)出現(xiàn)了機器人,至今機器人仍然是眾多科幻小說的重要元素。實現(xiàn)這個夢想的第一步是了解如何將人類的思考過程形式化和機械化??茖W家們被這一夢想深深吸引,開始研究記憶、學習和推理。在20世紀30年代末到50年代初,神經(jīng)學研究發(fā)現(xiàn)大腦是由神經(jīng)元組成的電子網(wǎng)絡(luò),克勞德香農(nóng)提出的信息論則描述了數(shù)字信號,圖靈的計算理論證明了一臺僅能處理0和1號的機械設(shè)備能夠模擬任意數(shù)學推理。這些密切相關(guān)的成果暗示了構(gòu)建電子大腦的可能性。在1956年的達特茅斯會議上,人工智能(lngn,)一詞被首次提出,其目標是制造機器模仿學習的各個方面或智能的各個特性,使機器能夠讀懂語言,形成抽象思維,解決人們目前的各種問題,并能自我完善。這也是我們今天所說的強人工智能可以和人做得一樣好。今天所說的弱人工智能是指只處理特定問題的人工智能,如計算機視覺、語音識別、自然語言處理,不需要具有人類完整的認知能力,只要看起來像有智慧就可以了。一個弱人工智能的經(jīng)典例子就是那個會下圍棋并且僅僅會下圍棋的pho。從政府到資本、業(yè)界都熱情擁抱人工智能,以人工智能驅(qū)動的智能化變革正在引發(fā)第4次工業(yè)革命。雖然人工智能在某些方面還處于炒作周期工智能技術(shù)的壁壘在哪里?了解商業(yè)化的邊界在哪里,才能更好地理解人工智能。AI人工智能是一門利用計算機模擬人類智能行為科學的統(tǒng)稱,它涵蓋了訓練計算機使其能夠完成自主學習、判斷、決策等人類行為的范疇。人工智能的英文lngn的首字母的組合,它是當前人類所面對的最為重要的技術(shù)變革。技術(shù)給予了機器(這里的機器不僅僅指機器人,還包括消費產(chǎn)品,如音箱、汽車等范圍更廣的物體)一定的視聽感知和思考能力。例如,蘋果和亞馬遜ho智能音箱可以幫助我們通過語音控制的方式設(shè)置鬧鐘、播放音樂、回復(fù)信息、詢問天氣,還可以聊天;滴滴出行和b應(yīng)用也是在人工智能技術(shù)的驅(qū)動下幫助司機選擇最佳路線。除了日常生活外,人工智能在工業(yè)、金融、安防、醫(yī)療、司法等領(lǐng)域也發(fā)揮了巨大的作用。工業(yè)機器人代替人類完成焊接、鑄造、裝配、包裝、搬運、分發(fā)貨物等單調(diào)、重復(fù)、繁重的工作;在金融領(lǐng)域,人工智能技術(shù)可以幫助金融機構(gòu)提供投資組合建議,創(chuàng)建高精度的風險控制模型,實現(xiàn)精準營銷等金融活動;對于安防行業(yè),以圖像識別、人臉識別為代表的人工智能技術(shù)對攝像頭獲取的海量視頻信息進行解析,已被廣泛應(yīng)用于門禁系統(tǒng)、車輛檢測、追蹤嫌犯等場景中,對增強安防水平、維護社會穩(wěn)定、提高刑偵效率等都有重大意義;在醫(yī)療領(lǐng)域,的人工智能系統(tǒng)on(沃森)已被多家醫(yī)療機構(gòu)采用,它可以幫助醫(yī)生更快、更準確地診斷疾病,還能提出對醫(yī)療方案的療效及風險的評估,這將有效地彌補有些地區(qū)醫(yī)療資源不足的缺陷;美國人工智能律師oengn可以理解律師向它提出的問題,收集已有的法律條文、參考文獻和法律案件等數(shù)據(jù),進行推論,給出基于證據(jù)的高度相關(guān)性答案,這樣的系統(tǒng)可以減少法律服務(wù)成本,使更多的人能夠獲得法律幫助?;馃岬淖罱鼛啄?,在算法、大數(shù)據(jù)、計算力等技術(shù)的推動下,人工智能開始真正解決問題,在各行業(yè)的應(yīng)用場景逐漸明朗,并帶來實際的商業(yè)價值。目前,無論在學術(shù)界、投資界,還是在職場,異?;馃?。論文發(fā)表數(shù)量激增:自從1996年以來,每年發(fā)表的論文數(shù)量增加了9倍以上,如圖11所示。斯坦福大學入學選修人工智能和機器學習入門課程的學生人數(shù)從1996年以來增長了11倍以上。在美國,有資本投資的數(shù)量從2000年以來增加了14倍,如圖12所示。在美國,投資創(chuàng)業(yè)的基金數(shù)量也在增長,從2000年以來,每年投入創(chuàng)業(yè)的資本額增加了6倍。美國最近幾年中,每年都有幾十億美元的風險資本()進入領(lǐng)域,人工智能相關(guān)崗位的需求也在急劇增長。圖13展示了ndd.om平臺上,從2013年1月份起,技術(shù)相關(guān)工作崗位的份額的增長。在開源軟件使用和生態(tài)上,軟件也是異常火熱的。圖14展示了各個軟件包在ub上加星標的次數(shù)。排在第一的noo是排在第二的kn的4倍左右。本書的例子都是在noo和kn軟件包上實現(xiàn)的?!鴪D1-1AI▲圖1-2美國AI▲圖1-3需要AI▲圖1-4AIAI表1-1訓練數(shù)據(jù)量與醫(yī)療圖像模型準確性的關(guān)系A(chǔ)I以圖像識別和人臉識別為代表的感知技術(shù)已經(jīng)走向了應(yīng)用市場,特別是在交通、醫(yī)療、工業(yè)、農(nóng)業(yè)、金融、商業(yè)等領(lǐng)域,帶動了一批新業(yè)態(tài)、新模式、新產(chǎn)品的突破式發(fā)展,帶來了深刻的產(chǎn)業(yè)變革。蘋果公司的hon手機包含e、13芯片等技術(shù)。蘋果的e技術(shù)有人臉驗證功能。hon的頂部集成了實現(xiàn)e功能的器件,包括紅外鏡頭、泛光感應(yīng)元件、點陣投影器和普通攝像頭。從原理上講,當紅外攝像頭發(fā)現(xiàn)一張面孔時,點陣投影器會閃射出3萬個光點,接著紅外攝像頭會捕捉這些光點的反饋,從而采集一張人臉的3數(shù)據(jù)模型,并與13芯片中存儲的模型進行比對。如果互相匹配,就可以解鎖了,hon隨即被喚醒。為了更加精確地進行人臉識別,蘋果芯片中包含了一個神經(jīng)引擎,用神經(jīng)網(wǎng)絡(luò)處理圖像和點陣模式,并邀請好萊塢特效面具公司制作面具來訓練神經(jīng)網(wǎng)絡(luò),以保證安全性。heg(美國科技媒體網(wǎng)站)曾借用了一臺具有夜視功能的攝像機,成功拍攝到這些肉眼不可見的紅外光點,可以看到這3萬個光點非常密集,不只是投射至人臉,連衣服上也有,視覺效果極其震撼。如圖15所示,在大規(guī)模視覺識別挑戰(zhàn)賽()比賽中,圖像標簽的錯誤率從2010年的28.5下降到了2.5,系統(tǒng)對物體識別的性能已經(jīng)超越了人類。在國內(nèi),視覺與圖像領(lǐng)域的融資排在第一,在整個投資中占比23(數(shù)據(jù)來源:騰訊的《中美兩國人工智能產(chǎn)業(yè)發(fā)展報告》),圖1-5物體識別能力比較(直線為人類,曲線為自然語言理解是指機器接受人類提問的語音輸入,先通過語音識別將人類語音轉(zhuǎn)化為文字,再運用自然語義分析理解人類提問的含義(人類的行為),面,系統(tǒng)在確定句子語法結(jié)構(gòu)上的能力已經(jīng)接近人類能力的94。在從文檔中找到既定問題的答案的能力已經(jīng)越來越接近人類(見圖16左圖)。系統(tǒng)識別語音錄音的表現(xiàn)早在2016年就已經(jīng)達到了人類水平(見圖16右圖)。圖1-6問答準確性比較(左圖)和語音識別能力比較(右圖:直線為人類,曲線為理已經(jīng)具備了基本的問答、對話以及上下文理解功能。它們正在打造全新的人機交互方式,為用戶提供多場景的便捷服務(wù)。例如,智能音箱是最近幾年美國消費中的熱門產(chǎn)品。雖然語音交互的老大依然是蘋果公司的,但是onx正在快速崛起(見圖17左邊的產(chǎn)品),它不僅可以對話應(yīng)答,還可以和多種智能家居設(shè)備進行交互,比如:語音關(guān)燈等。谷歌的智能音箱產(chǎn)品(見圖17中間的產(chǎn)品),功能類似x。蘋果也于2018年2月9日正式上市od智能音箱(見圖17右邊的產(chǎn)品)。圖1-7語音交互可以說是人與機器交流在整個投資中占比19。國內(nèi)企業(yè)中,京東與科大訊飛公司合作布局了智能音箱,致力于成為家庭控制中心。阿里推出了名叫天貓精靈的智能音箱,小米推出了小米音箱。激烈的音箱之爭背后其實是下一代服務(wù)入口之爭。搭載百度u的智能硬件產(chǎn)品也在陸續(xù)面世。u是百度基于技術(shù)打造的對話式人工智能系統(tǒng)。搭載u的設(shè)備可讓用戶以自然語言對話的交互方式(比如小度小度,我想聽陳百強的歌)實現(xiàn)影音娛樂、信息查詢、生活服務(wù)、出行路況等多項功能。目前,騰訊的所有語音端都采用自己研發(fā)的技術(shù),而阿里的淘寶、支付寶電話客服、天貓精靈、優(yōu)酷、蝦米音樂等都應(yīng)用了自己的語音技術(shù)。除了使用自家語音技術(shù)外,也在加速對外開放平臺,滾動擴張。阿里云、騰訊云小微、百度u平臺都開放了語音識別、視覺識別等技術(shù)。百度還宣布語音技術(shù)全系列接口永久免費開放。在谷歌大會上,語音助手oogen更像人。作為谷歌用戶感觀最直接的語音助手,谷歌試圖將其打造得更近似人:其一是聲音擬人化,其二是對話日常化。大會現(xiàn)場展示了指令oogen預(yù)定餐廳座位,然后發(fā)出指令的人即可忙自己的事,而將自行打電話給餐廳,通過多輪對話與餐廳工作人員敲定好時間。在這個展示上,突顯的亮點是,對話能力加強,近似日常交流習慣,極大地提高了與機器對話的用戶體驗。(BostonDynamics)的研究重點是像狗一樣的細長機器人,它可以爬樓梯,在與人類的拔河中保持住姿勢,并可以開門,讓其他機器人通過。圖1-8從全球范圍來看,日本ASMOActroid-F仿人機器人、Pepper智能機器人、美國BigDog仿生機器人等一大批智能機器人快速涌現(xiàn),巨頭企業(yè)也紛紛通過收購機器人企業(yè),將智能機器人作為人工智能重要的載體,推動人工智能發(fā)展,例如,谷歌相繼收購Schaft、RedwoodRobotics等9家機汽車行業(yè)正經(jīng)歷大規(guī)模的顛覆,汽車廠商越來越意識到,半自動和全自動駕駛車輛將需要基于斯拉推出了多款電動車,包括odl、odl3(這兩個為小轎車)、odl()、電動卡車等車型。這些車型配備了半自動化駕駛技術(shù),包括自動制動、車道保持以及車道偏離警告等功能。在國內(nèi),自動駕駛/輔助駕駛的融資在整個國內(nèi)投資中占比18。中國的自動駕駛/輔助駕駛企業(yè)雖然只有31家,但融資額卻排在第三。(RedundancyinSystem)人類的聰明之處就在于可以通過既有的認知觸類旁通地推理出未知的問題。如圖19所示,人類看書(書就是數(shù)據(jù))從書中提煉出智慧;機器學習是讓計算機利用已知數(shù)據(jù)得出適當?shù)哪P?,并利用此模型對新的情境給出判斷的過程。機器學習本質(zhì)上是一種計算機算法,計算機通過大量樣本數(shù)據(jù)的訓練,能夠?qū)σ院筝斎氲膬?nèi)容做出正確的反饋。訓練的過程就是通過合理的試錯來調(diào)整參數(shù),使得出錯率降低,當出錯率低到滿足預(yù)期的時候,就可以拿出來應(yīng)用了。機器學習分為監(jiān)督式學習和非監(jiān)督式學習。圖1-9機器學習重要的成果是2006年關(guān)于深度學習(DeepLearning)的突破。深度學習起源于20世紀八九十年代的神經(jīng)網(wǎng)絡(luò)研究。深度學習模型的靈美國大筆投資在機器學習應(yīng)用上,占美國整個投資的21。這一領(lǐng)域是僅次于芯片的吸金領(lǐng)域(芯片投資的占比為31)。機器學習熱潮是由三個基本因素的融合推動的:①深度學習算法的持續(xù)突破;②大數(shù)據(jù)的快速增長;③機器學習的計算加速,如芯片這樣的機器學習硬件,將訓練時間從幾個月縮短到幾天、甚至幾個小時。這些硬件芯片正在迅速發(fā)展,谷歌、英偉達、英特爾等公司都宣布推出下一代硬件,這將進一步加快訓練速度的10~100倍。軍蓋瑞·卡斯帕羅夫(GaryKasparov)。如今,在智能手機上運行的國際象棋程序可以表現(xiàn)出大師級的水平。2016年3月,谷歌DeepMind團隊開發(fā)的AlphaGo系統(tǒng)擊敗了圍棋冠軍。DeepMind后來發(fā)布了AlphaGoMaster,并在2017年3月?lián)魯×伺琶澜绲谝坏目聺崱?017年10月,DeepMind發(fā)表在Nature上的論文詳細介紹了AlphaGo的另一個新版本—AlphaGoZero,它以100︰0擊敗了最初的AlphaGo成功的背后是結(jié)合了深度學習、強化學習(ReinforcementLearning)與搜索樹算法(TreeSearch)三大技術(shù)。簡單來說,當時的AlphaGo有兩個核心:策略網(wǎng)絡(luò)(PolicyNetwork)和評價網(wǎng)絡(luò)(ValueNetwork),這兩個核心都是由卷積神經(jīng)網(wǎng)絡(luò)(onvouonlulok,)所構(gòu)成的。具體而言,首先在策略網(wǎng)絡(luò)中輸入大量棋譜,機器會進行監(jiān)督式學習,然后使用部分樣本訓練出一個基礎(chǔ)版的策略網(wǎng)絡(luò),并使用完整樣本訓練出進階版的策略網(wǎng)絡(luò),讓這兩個網(wǎng)絡(luò)對弈,機器通過不斷新增的環(huán)境數(shù)據(jù)調(diào)整策略,也就是所謂的強化學習。而策略網(wǎng)絡(luò)的作用是選擇落子的位置,再由評價網(wǎng)絡(luò)來判斷盤面,分析每個步數(shù)的權(quán)重,預(yù)測游戲的輸贏結(jié)果。當這兩個網(wǎng)絡(luò)把落子的可能性縮小到一個范圍內(nèi)時,機器計算需要龐大運算資源的負擔減少了,再利用蒙特卡洛搜索樹于有限的組合中算出最佳解。而phoo與pho不同,它沒有被輸入任何棋譜,而是從一個不知道圍棋游戲規(guī)則的神經(jīng)網(wǎng)絡(luò)開始,僅通過全新的強化學習算AI人工智能如今處在發(fā)展的早期階段,非常像十幾年前互聯(lián)網(wǎng)的成長。推動發(fā)展的三個動力是算法、算力和數(shù)據(jù)(見圖110)。第一個是算法,尤其是機器學習的算法在過去幾年迅速發(fā)展,不斷有各種各樣的創(chuàng)新,深度學習、、、到,不停地有新的發(fā)明創(chuàng)造出來;第二個是計算能力,隨著云計算的普及,計算的成本在不斷下降,服務(wù)器也變得越來越強大,我們將在第2章中詳細介紹人工智能芯片產(chǎn)業(yè);第三個是數(shù)據(jù),數(shù)據(jù)的產(chǎn)生仍然在以一個非常高的速度發(fā)展,數(shù)據(jù)越多,訓練越全面,就會進一步推動算法的不斷創(chuàng)新,以及對計算能力提出更新的要求。數(shù)據(jù)是的根本和基礎(chǔ),和大數(shù)據(jù)密不可分。沒有海量數(shù)據(jù)支撐的人工智能就是人工智障。圖1-10推動AI圖1-11基于大數(shù)據(jù)的AI好與購買習慣,甚至做到“比用戶更了解用戶自己。這樣的畫像就可以精準地推送廣告和產(chǎn)品;對企業(yè)畫像,可以準確地判斷其信用及面臨的風險??傊?,把用戶、數(shù)據(jù)和算法巧妙地連接起來的是應(yīng)用(或I產(chǎn)品)。最終,大數(shù)據(jù)的成功最關(guān)鍵的一步往往是一個極富想象力的創(chuàng)新應(yīng)用。比如金融行業(yè)的“秒貸,就是基于算法的數(shù)據(jù)智能實時發(fā)揮作用,最終實現(xiàn)秒級放貸,這個是傳統(tǒng)的金融服務(wù)沒法想象的。這樣的智能商業(yè)才是對傳統(tǒng)商業(yè)的顛覆。再比如,美國的快遞公司建立了基于大數(shù)據(jù)的預(yù)測性分析系統(tǒng)來檢測全美60000輛車輛的實時車況,以便及時地進行防御性修理。傳統(tǒng)的數(shù)據(jù)分析方法,無論是傳統(tǒng)的技術(shù)還是數(shù)據(jù)挖掘技術(shù),都難以應(yīng)付大數(shù)據(jù)的挑戰(zhàn)。首先是執(zhí)行效率低,在處理太字節(jié)()級以的方向。自2006年深度學習界泰斗oynon在Snc雜志上發(fā)表epeefeor的論文后,激活了神經(jīng)網(wǎng)絡(luò)的研究,開啟了深度神音識別領(lǐng)域的準確率獲得了20%~30的提升,突破了近十年的瓶頸。圖像識別領(lǐng)域早在2013年就通過深度學習將準確率提高到了89%。神經(jīng)網(wǎng)絡(luò)算法的結(jié)構(gòu)和流程特性非常適合大數(shù)據(jù)分布式處理平臺進行計算,通過神經(jīng)網(wǎng)絡(luò)能夠?qū)崿F(xiàn)各領(lǐng)域的分析算法和應(yīng)用。AI正如前文所提到的,推動發(fā)展的三個動力是算法、算力和數(shù)據(jù)(見圖110)。隨著云計算的普及,計算的成本在不斷下降,計算能力也變得越來越強大,這是推動發(fā)展的必備條件。I是今后產(chǎn)業(yè)發(fā)展的巨大引擎。無論是國內(nèi)的,還是美國的谷歌、亞馬遜、微軟、boo、蘋果等公司,都已經(jīng)擁有了海量的云計算基礎(chǔ)設(shè)施。它們各自推出的功能都是為了給予云端客戶更強的數(shù)據(jù)分析能力,從而構(gòu)建基于人工智能的云服務(wù),這符合未來云服務(wù)的“云發(fā)展趨勢。例如,亞馬遜利用云正嘗試為云端客戶提供高效的解決方案,如圖112所示。谷歌寄希望于借在云計算領(lǐng)域趕超。基于微軟云平臺u的智能涵蓋了五大方向的人工智能技術(shù),包括計算機視覺、語音、語言、知識、搜索五大類。圖1-12AWS比如用戶使用谷歌開源的TensorFlow平臺訓練和導(dǎo)出自己所需要的人工智能模型,然后把模型導(dǎo)入TensorFlowServing對外提供預(yù)測類云服務(wù),AIkn簡稱為k,是針對yhon編程語言的開源軟件機器學習庫。它具有各種分類、回歸和聚類算法,包括支持向量機、隨機森林、梯度提升、k均值和。k是ub上最受歡迎的機器學習庫之一。kn與許多其他yho庫很好地集成在一起,例如pob和poy用于繪圖,u用于數(shù)組矢量化,nds數(shù)據(jù)幀等。作為專門面向機器學習的yho開源框架,kn實現(xiàn)了各種各樣成熟的算法,容易安裝和使用,樣例豐富,而且教程和文檔也非常詳細。k的性能表現(xiàn)也是非常不錯的。當然,kn也有缺點,例如它不支持深度學習和強化學習,而它們在今天已經(jīng)是應(yīng)用非常廣泛的技術(shù)。此外,它不支持yhon之外的語言,對的使用并不高效。本書的前面6是基于k實現(xiàn)的。2015年,谷歌發(fā)布第二代人工智能系統(tǒng)noo,并宣布將其開源。noo包括很多常用的深度學習技術(shù)、功能和例子的框架,本書用3章內(nèi)容詳細介紹noo。2013年,卷積神經(jīng)網(wǎng)絡(luò)發(fā)明者nnun加入boo,帶領(lǐng)公司在圖像識別技術(shù)和自然語言處理技術(shù)方面得到大幅提升。boo的深度學習框架是在之前的oh基礎(chǔ)上實現(xiàn)的,于2015年12月開源。表1列出了各個公司所提供的I開源平臺。表1-2AI除了上述的AI開源平臺和框架之外,AWS推出了SageMaker,Apache有SparkMLlib。SparkMLlib是一個具有高度拓展性的機器學習庫,在插入Hadoop工作流程中。它提供了機器學習算法,如分類、回歸、聚類等。這個強大的庫在處理大規(guī)模的數(shù)據(jù)時,速度非??臁parkMLlib的官網(wǎng)地址是/mllib/。SparkMLlib的優(yōu)點是,對于大規(guī)模數(shù)據(jù)處理來說,非常快,可用于多種語言。缺點是,陡峭的學習曲第2AI人工智能作為全球科技革命和產(chǎn)業(yè)變革的制高點,已經(jīng)成為推動經(jīng)濟社會發(fā)展的新引擎。人工智能產(chǎn)業(yè)是指一個以人工智能關(guān)鍵技術(shù)為核心的、由基礎(chǔ)支撐和應(yīng)用場景組成的、覆蓋領(lǐng)域非常廣闊的產(chǎn)業(yè)。與人工智能的學術(shù)定義不同,人工智能產(chǎn)業(yè)更多的是經(jīng)濟和產(chǎn)業(yè)上的一種概括。如圖21所示,人工智能產(chǎn)業(yè)分為三層:基礎(chǔ)層、技術(shù)層和應(yīng)用層。其中,基礎(chǔ)層包括芯片、大數(shù)據(jù)、網(wǎng)絡(luò)等多項基礎(chǔ)設(shè)施,為人工智能產(chǎn)業(yè)奠定硬件和數(shù)據(jù)基礎(chǔ)。技術(shù)層包括計算機視覺、語音語義識別、機器學習等,多數(shù)人工智能技術(shù)公司以一項或多項技術(shù)細分領(lǐng)域為切入點。而最終人工智能技術(shù)能否落地且產(chǎn)生巨大的商業(yè)價值,還需要應(yīng)用層中多場景的應(yīng)用。目前,人工智能技術(shù)應(yīng)用到多個行業(yè)中,包括金融、安防、智能家居、醫(yī)療、機器人、自動駕駛等。應(yīng)用層市場空間大,參與的企業(yè)多,這些企業(yè)發(fā)展垂直應(yīng)用,解決行業(yè)痛點,實現(xiàn)場景落地。圖2-1AI人工智能產(chǎn)業(yè)鏈分為基礎(chǔ)層、技術(shù)層和應(yīng)用層。圖22所示為基礎(chǔ)層,包括芯片、傳感器、大數(shù)據(jù)、云計算等領(lǐng)域,為撐。除了上述列出的領(lǐng)域外,其他領(lǐng)域,如大帶寬也是人工智能基礎(chǔ)層的內(nèi)容。通過大帶寬提供良好的基礎(chǔ)設(shè)施,以便在更大范圍內(nèi)進行數(shù)據(jù)的收集,以更快的速度進行數(shù)據(jù)的傳輸,為大數(shù)據(jù)的分析、計算等環(huán)節(jié)提供時間和數(shù)據(jù)量方面的基本保障。圖2-2隨著中興事件和華為芯片斷供事件的發(fā)生,大家都高度重視芯片。的確,的大腦在于芯片和算法。芯片也被稱為加速器或計算卡,即專門用于處理人工智能應(yīng)用中的大量計算任務(wù)的模塊。當前,芯片主要分為、、和類腦芯片。在人工智能時代,它們各自發(fā)揮優(yōu)勢,呈現(xiàn)出百花齊放的狀態(tài)。在美國人工智能企業(yè)中,融資占比排名第一的領(lǐng)域為芯片/處理器,占比31。芯片由于投資周期長、專業(yè)技術(shù)壁壘厚,導(dǎo)致競爭非常激烈且難以進入。芯片的計算場景可分為云端和終端。英偉達首席科學家my將深度學習的計算場景分為三類,分別是數(shù)據(jù)中心的訓練、數(shù)據(jù)中心的推理和嵌入式設(shè)備的推理。前兩者可以總結(jié)為云端的應(yīng)用,后者可以概括為終端的應(yīng)用。終端智能芯片的一個經(jīng)典案例是蘋果的13神經(jīng)引擎,每秒運算次數(shù)最高可達萬億次。它實現(xiàn)了基于深度學習的高準確性人臉識別解鎖方式(e),并解決了云接口(oudd)帶來的延時和隱私問題,以及龐大的訓練數(shù)據(jù)和計算量與終端硬件限制的矛盾。芯片目前有三個技術(shù)路徑,通用的(既能作為圖形處理器引爆游戲業(yè)務(wù),又能滲透數(shù)據(jù)中心橫掃訓練端)、可編程的(適用于迭代升級,各類場景化應(yīng)用前景超大)以及專業(yè)的(叩開終端的大門)用芯片和半定制芯片都有布局,掌握強大的先發(fā)優(yōu)勢,在數(shù)據(jù)中心、汽車等重要藍海布局扎實;在方面,谷歌從出發(fā)開源生態(tài)進行布局,且展露了訓練端芯片市場的野心。定制化的特點有效規(guī)避了傳統(tǒng)巨頭的壟斷局面,有著可靠健康的發(fā)展路線。表21總結(jié)了目前幾個主流的芯片廠商。表2-1AI英偉達是的行業(yè)領(lǐng)袖。入人工智能芯片領(lǐng)域的。谷歌的是專門為其深度學習算法noo設(shè)計的,也用在了pho系統(tǒng)中。第三代oud理論算力達到了420Top,能夠?qū)C器學習模型的訓練和運行帶來顯著的加速效果。類腦芯片是一種基于神經(jīng)形態(tài)工程,借鑒人腦信息處理方式,具有學習能力的超低功耗芯片。從2008年開始模擬人類大腦的芯片項目。蘋果公司的蘋果神經(jīng)引擎(ppeulngn,簡稱)是一款專用芯片。該芯片定位于本地設(shè)備的任務(wù)處理,把人臉識別、語音識別等任務(wù)集中到模塊上,提升算法效率。蘋果神經(jīng)引擎芯片屬于嵌入式神經(jīng)網(wǎng)絡(luò)處理器()。自動駕駛系統(tǒng)與芯片緊密相關(guān),比如,特斯拉的電動車使用的是英偉達的芯片。在美國市場上,正在逐漸形成英偉達與英特爾oby聯(lián)盟兩大競爭者。oby已經(jīng)被英特爾收購。oby的機器視覺算法與英特爾的芯片、數(shù)據(jù)中心、和傳感器融合,加上地圖服務(wù),正協(xié)同打造一個全新的自動駕駛供應(yīng)商。在oby的官網(wǎng)上,有一段40分鐘的視頻,它記錄了在特別復(fù)雜的街道上自動駕駛的整個過程。對于自動駕駛感興趣的讀者,可以觀看一下,我相信你一定會深有體會的。圖23實況,其中上面有一個圓圈的汽車就是自動駕駛的汽車。圖2-3隨著摩爾定律的終止,傳統(tǒng)處理器的計算力已遠遠不能滿足海量并行計算與浮點運算的深度學習訓練需求,而在人工智能領(lǐng)域反映出強大適應(yīng)性的成為標配。比擁有更多的運算器(hcn),只需要進行高速運算而不需要邏輯判斷,其海量數(shù)據(jù)并行運算的能力與深度學習的需求不謀而合。因此,在深度學習上游訓練端(主要用于云計算數(shù)據(jù)中心),是第一選擇。目前,的市場格局以英偉達為主(超過70),為輔,預(yù)計3~5年內(nèi)仍然是深度學習市場的第一選擇。截至目前(2020年8月),英偉達毫無疑問是這波人工智能浪潮最大的受益者,它的市值超過了英特爾的體量。英偉達的崛起完全得益于這場突如其來的人工智能大革新。圖2-4英偉達GPU開發(fā)環(huán)境CUDA在的市場份額中,nx的份額約為49,主要應(yīng)用于工業(yè)和通信領(lǐng)域,近年亦致力于云計算數(shù)據(jù)中心的服務(wù)器以及無人駕駛的應(yīng)用。(已被英特爾收購)的市場份額約為40,定位同nx類似。萊迪斯半導(dǎo)體(eonduo)的市場份額約為6,主要市場為消費電子產(chǎn)品和移動傳輸,以降低耗電量、縮小體積及縮減成本為主。o()的市場份額約為4,瞄準通信、國防與安全、航天與工業(yè)等市場。目前,的產(chǎn)品被用于微軟u云服務(wù)中,包括必應(yīng)搜索、機器翻譯等應(yīng)用中。ASIC是ApplicationSpecificIntegratedCircuit的英文縮寫,中文名為專用集成電路或特殊應(yīng)用集成電路。終端設(shè)備的模型推理方面,由于低功(ML)模型。CloudTPU是谷歌設(shè)計的一種硬件加速器,使用多個定制化ASIC構(gòu)建,單個CloudTPUv3的計算能力達到420萬億次浮點運算,(TPUPod)圖2-5谷歌的學習專用芯片:張量處理器(TensorProcessingUnit,TPU),它旨在優(yōu)化機器學習工作負載。2017年又推出了它的第二代產(chǎn)品(CloudTPU)。目前的最新產(chǎn)品是CloudTPUv3。這是一種被認為比CPU,甚至GPU更加高效的機器學習專用芯片。價格大約為每個云TPU每(GoogleImageSearch)、谷歌照片(GooglePhoto)和街景(StreetView)等產(chǎn)品的基礎(chǔ)精確視覺模型,TPU也幫助了谷歌翻譯質(zhì)量的提升,而其強大的計算能力也在DeepMindAlphaGo的勝利中發(fā)揮了重要作用。CloudTPU的目的是為TensorFlow工作負載提供差異化的性能,使機器學習工程師實現(xiàn)更快迭代,他們可以在一系列CloudTPU上訓練同樣模型的不同變體,而且第二天就可以將準確率最高的訓練模型部署到生產(chǎn)過程。使用單個CloudTPU并遵循教程(hpoud.goog.opudouon),就可以在不到一天的時間內(nèi)訓練50,使其在g基準上達到期望的準確率。傳統(tǒng)上,編寫自定義和超級計算機的程序需要極高的專業(yè)水平,而對于oud而言,可以使用高級noow進行編程。谷歌開源了一系列高性能oud模型實現(xiàn),比如50和圖像分類模型(hpghub.onoopuodo),用于機器翻譯和語言建模的no(hpoud.goog.opudouono),用于目標檢測的n(hpghub.onoopubobodonn)。有意思的是,谷歌的全面開放讓英偉達警覺的神經(jīng)再次緊繃。我們可以認為,谷歌是英偉達在人工智能算力市場最大的競爭對手。隨著第三代的發(fā)布及其在人工智能專有領(lǐng)域,特別是在搭載了谷歌noo框架的深度神經(jīng)網(wǎng)絡(luò)訓練效率方面的表現(xiàn),外界越來越認識到二者間的差距逐漸縮小。谷歌在人工智能領(lǐng)域的雄心十分明顯,從一開始對的只字不提到后來開放上云,谷歌已逐漸認識到算力市場的巨大潛力并渴求牢牢抓住這一契機。noo云訓練的模式讓谷歌獲得了迄今為止其他科技巨頭尚不具備的人工智能核心競爭實力。這一點已經(jīng)引起其他科技公司的注意,他們認為,各行各業(yè)的公司都有自己的數(shù)據(jù)驅(qū)動業(yè)務(wù),算力不應(yīng)該被掌控在一家巨頭手上。是算力的戰(zhàn)爭。亞馬遜最近推出了自己的芯片,名字叫von2研發(fā)芯片的大型科技公司。這些科技公司之所以這樣做,是為了實現(xiàn)自家產(chǎn)品的個性化。但對于英特爾和英偉達等傳統(tǒng)芯片公司而言,他們的客戶就要變成競爭對手了。當前,英特爾控制著服務(wù)器主芯片市場98的份額,而英偉達則為這些服務(wù)器開發(fā)與英特爾主芯片協(xié)同工作的人工智能芯片。芯片授權(quán)初創(chuàng)公司xogxhnoogs(of)稱:如果這種趨勢持續(xù)下去,將來,數(shù)據(jù)中心所有者將自主研發(fā)芯片,與當前的芯片供應(yīng)商相競爭?!鄙疃葘W習工程的兩大關(guān)鍵環(huán)節(jié)nng(訓練)和nn(推理或推測)需要大量的算力支撐,而在訓練環(huán)節(jié)扮演著不可或缺的角色。但隨著人工智能應(yīng)用場景的延伸,并非所有深度學習計算任務(wù)的充分條件,(現(xiàn)場可編程門陣列)和(專用集成電路)同樣有著相當大的表現(xiàn)空間。前者通過內(nèi)置可靈活組合的邏輯、、連線模塊為專用計算服務(wù),后者是不可配置的高度定制化芯片。谷歌就是的一種方案。憑借,英偉達公司一直是趨勢的最大受益者。因為其圖形處理器()是訓練系統(tǒng)的早期選擇。能夠同時執(zhí)行大量復(fù)雜的數(shù)學運算,這使它在早期成為應(yīng)用的最佳選擇。后來,科技巨頭紛紛研發(fā)自己的芯片,包括谷歌的、蘋果的神經(jīng)引擎、微軟的,以及亞馬遜正在為x研發(fā)的定制芯片。身noo云的資源吸引開發(fā)者和拓展企業(yè)級市場、專用領(lǐng)域,但該模式的前提必須是谷歌極力維系noo作為深度學習主流框架而長期存在,一旦神經(jīng)網(wǎng)絡(luò)算法主流架構(gòu)有變,歌的計劃順利實施,其壟斷的生態(tài)優(yōu)勢同樣對英偉達形成巨大威脅。時剝離任何可識別個人身份的信息,從而更大程度地保證用戶的隱私和安全。蘋果公司開發(fā)了一種神經(jīng)引擎,作為其新的13仿生芯片的一部分,該芯片是一款可在本地處理多種功能的先進處理器。這大大減少了傳輸?shù)皆贫说挠脩粜畔⒘?,有助于保護用戶數(shù)據(jù)。雖然這些公司都采用了不同的處理器策略,但是仍在大量使用英偉達的,英偉達的使用增長仍在繼續(xù)。競爭是不可避免的,但到目前為止還沒有解決方案能夠完全取代。相比集群,因其定制化、低功耗和忽略延遲的特點,在終端推測環(huán)節(jié)有著廣泛應(yīng)用,所以它被微軟、亞馬遜等云商以及蘋果、三星等手機制造商所接受。而與作為訓練環(huán)節(jié)的主力,則開啟了兩種不同產(chǎn)品形態(tài)爭鋒對立的局面,也就是說,在深度學習訓練領(lǐng)域,完全成了英偉達和谷歌兩者之間的戰(zhàn)爭。革命已經(jīng)讓業(yè)界嗅到了熟悉的工業(yè)革命的氣息。正如19世紀蒸汽機、內(nèi)燃機的迭代結(jié)束了大洋之上縱橫數(shù)個世紀的風帆時代,人工智能算力的突破亦將成為摩爾定律的變革者,將延續(xù)了近一個世紀的計算機科學文明引入下一階段。功能。目前在國內(nèi)使用的簡便的智能視覺傳感器占了機器視覺系統(tǒng)市場60左右的份額。視覺傳感器的優(yōu)點是探測范圍廣、獲取信息豐富,實際應(yīng)用中常使用多個視覺傳感器或者與其他傳感器配合使用,通過一定的算法可以得到物體的形狀、距離、速度等諸多信息。以深度攝像頭為基礎(chǔ)的計算視覺領(lǐng)域已經(jīng)成為整個高科技行業(yè)的投資和創(chuàng)業(yè)熱點之一。有意思的是,這一領(lǐng)域的許多尖端成果都是由初創(chuàng)公司先推出的,再被巨頭收購后發(fā)揚光大,例如英特爾收購n實感攝像頭,蘋果收購n的技術(shù)供應(yīng)商n,uu收購了一家主攻高精度手勢識別技術(shù)的以色列技術(shù)公司bbsn。從20世紀50年代開始,貝爾實驗室開發(fā)了世界上第一個語音識別udy系統(tǒng),可以識別10個英文數(shù)字。到20世紀70年代,聲音識別技術(shù)得到快速發(fā)展,動態(tài)時間規(guī)整()算法、向量量化()以及隱馬爾可夫模型()理論等相繼被提出,實現(xiàn)了基于技術(shù)的語音識別共闖語音技術(shù)領(lǐng)域。度傳感器這8種傳感器對機器人極為重要,尤其是機器人的五大感官傳感器是必不可少的,從擬人功能出發(fā),視覺、力覺、觸覺最為重要,目前已進入實用階段,但其他的感官,如聽覺、嗅覺、味覺、滑覺等對應(yīng)的傳感器還等待一一攻克。手機和其他消費者設(shè)備所收集的數(shù)據(jù)。運動傳感器數(shù)據(jù)及其他信息(比如信息)可提供大量不同的數(shù)據(jù)集。本節(jié)最后以常見的運動傳感器為例來說明和傳感器的綜合應(yīng)用。過軸向運動傳感器得以收集,例如智能手機、可穿戴設(shè)備和其他便攜式設(shè)備中的加速度計和陀螺儀。這些設(shè)備獲取三個坐標軸(x、y、)上的運動數(shù)據(jù),以便于連續(xù)跟蹤和評估活動。對于人工智能的監(jiān)督式學習,需要用標記數(shù)據(jù)來訓練模型,以便分類引擎可以使用此模型對實際示性特征可以包括濾波信號,例如身體加速(來自傳感器的原始加速度數(shù)據(jù)),或?qū)С鲂盘?,例如高速傅里葉變換()值或標準差計算。舉例來說,加州大學歐文分校()的機器學習數(shù)據(jù)庫創(chuàng)建了一個定義了561個特征的數(shù)據(jù)集,這個數(shù)據(jù)集以30名志愿者的6項基本活動(即站立、坐姿、臥姿、行走、下臺階和上臺階)為基礎(chǔ)。使用默認的b內(nèi)核訓練的模型進行活動分類的測試,準確度高達91.84。在完成培訓和特征排名后,選擇最重要的19項功能足以達到85.38速度原始數(shù)據(jù)的平均值、最大值和最小值。技術(shù)層是在基礎(chǔ)層之上,結(jié)合軟硬件能力所實現(xiàn)的、針對不同細分應(yīng)用開發(fā)的技術(shù)。如圖26音及自然語言處理三個方面。主要技術(shù)領(lǐng)域包括圖像識別、語音識別、自然語言處理和其他深度學習應(yīng)用等。涉及的領(lǐng)域包括機器視覺、指紋識別、人臉識別、視網(wǎng)膜識別、虹膜識別、掌紋識別、專家系統(tǒng)、自動規(guī)劃、智能搜索、定理證明、博弈、自動程序設(shè)計、智能控制、機器人學習、語言和圖像理解等。圖2-6AI合性科技巨頭外,創(chuàng)業(yè)企業(yè)也依賴自身技術(shù)的積累和細分領(lǐng)域的積累快速崛起。在發(fā)展路徑上,以2、2或22為主。一方面,面向企業(yè)級從而滿足用戶需求。人工智能、機器學習、深度學習是我們經(jīng)常聽到的三個熱詞。關(guān)于三者的關(guān)系,簡單來說,機器學習是實現(xiàn)人工智能的一種方法,深度學習是實現(xiàn)機器學習的一種技術(shù)(見圖27)是利用一系列深層次的神經(jīng)網(wǎng)絡(luò)模型來解決更復(fù)雜問題的技術(shù)。圖2-7人工智能的核心是通過不斷地進行機器學習,而讓自己變得更加智能。自2015年以來,人工智能開始大爆發(fā)。一方面是由于巨頭整合了平臺和芯片,技術(shù)快速發(fā)展,的廣泛應(yīng)用,使得并行計算變得更快、更便宜、更有效;另一方面在于云計算、云存儲的發(fā)展和當下海量數(shù)據(jù)的爆發(fā),各類圖像數(shù)據(jù)、文本數(shù)據(jù)、交易數(shù)據(jù)等為機器學習奠定了基礎(chǔ)。機器學習利用大量的數(shù)據(jù)來訓練,通過各種算法從數(shù)據(jù)中學習如何完成任務(wù),使用算法來解析數(shù)據(jù)、從中學習,然后對真實世界中的事件做出決策和預(yù)測。我們將在第3~6章中講解機器學習。深度學習是機器學習的重要分支,作為新一代的計算模式,深度學習力圖通過分層組合多個非線性函數(shù)來模擬人類神經(jīng)系統(tǒng)的工作過程,其技術(shù)的突破掀起了人工智能的新一輪發(fā)展浪潮。深度學習的人工神經(jīng)網(wǎng)絡(luò)算法與傳統(tǒng)計算模式不同,本質(zhì)上是多層次的人工神經(jīng)網(wǎng)絡(luò)算法,即模仿人腦的神經(jīng)網(wǎng)絡(luò),從最基本的單元上模擬了人類大腦的運行機制,它能夠從輸入的大量數(shù)據(jù)中自發(fā)地總結(jié)出規(guī)律,再舉一反三,應(yīng)用到其他的場景中。因此,它不需要人為地提取所需解決問題的特征。巨頭爭相開源人工智能平臺,各種開源深度學習框架層出不窮。2015年以來,全球人工智能頂尖巨頭陸續(xù)開源自身核心的人工智能平臺,其中包括、、、on、noo、hno和oh等。我們將在第7~10章講解深度學習。深度學習的典型代表是谷歌pho,而phoo采用純強化學習的方法進一步擴展了人工智能技術(shù),不需要人類的樣例或指導(dǎo),不需要提供基本規(guī)則以外的任何領(lǐng)域知識,在它自我對弈的過程中,神經(jīng)網(wǎng)絡(luò)被調(diào)整、更新,以預(yù)測下一個落子位置,并以100︰0的戰(zhàn)績擊敗pho。深度學習使得機器學習能夠?qū)崿F(xiàn)眾多的應(yīng)用,使所有的機器輔助功能成為可能,拓展了人工智能的領(lǐng)域范圍。谷歌作為人工智能領(lǐng)深度學習開源平臺noo,可用于編寫并編譯執(zhí)行機器學習算法的代碼,并將機器學習算法變成符號表達的各類圖表。noo目前已應(yīng)用于谷歌搜索、谷歌翻譯等服務(wù)。同時,大量開發(fā)者也接入到平臺中,成為主流的深度學習框架。谷歌還進一步推出了noow,支持移動和其他終端設(shè)備,谷歌已成為人工智能領(lǐng)域不可或缺的巨頭。本書的多個章節(jié)都是以noo為基礎(chǔ)闡述機器學習技術(shù)的。表2-2語音識別與自然語音處理是機器能夠聽懂用戶語言的主要技術(shù)基礎(chǔ),其中語音識別注重對用戶語言的感知,目前在中文語音識別上,國內(nèi)已經(jīng)達到97的語音識別準確率,這要歸功于深度神經(jīng)網(wǎng)絡(luò)的應(yīng)用、算力的提高以及大數(shù)據(jù)的積累。語音識別是機器感知用戶的基礎(chǔ),在聽到用戶的指令之后,更為重要的是如何讓機器懂得指令的意義,這就需要自然語言處理,將用戶的語音轉(zhuǎn)化為機器能夠反應(yīng)過來的機器指令,包括自然語言理解、多輪對話理解、機器翻譯技術(shù)等。對于自然語言處理方面,雖然深度學習能起到的作用還有待觀察,但在語義理解和語言生成等領(lǐng)域都有了重要突破。如圖28能語音交互產(chǎn)品。圖2-8語音識別技術(shù)已趨于成熟。語音識別的目標是將人類語音表達的內(nèi)容轉(zhuǎn)換為機器可讀的輸入,用于構(gòu)建機器的聽覺系統(tǒng)。語音識別技術(shù)經(jīng)歷了長達60年的發(fā)展。近年來,機器學習和深度神經(jīng)網(wǎng)絡(luò)的引入,使得語音識別的準確率提升到足以在實際場景中應(yīng)用。早在2016年年初,美國麻省理工學院()主辦的知名科技期刊《麻省理工科技評論》評選出了2016年十大突破技術(shù),語音識別位列第三,與其他技術(shù)一起一個里程碑式的階段或即將到達這一階段”微軟于2016年10月發(fā)布的hbod語音識別測試中,更是取得了5.9的詞錯誤率,第一次實現(xiàn)了和人類一樣的識別水平,這是一個歷史性突破。語音識別整個過程(見圖29)擬發(fā)音的概率分布,語言模型用來模擬詞語之間的關(guān)聯(lián)關(guān)系,而解碼階段就是利用上述兩個模型將聲音轉(zhuǎn)化為文本。圖2-9向長短時記憶網(wǎng)絡(luò)(BLSTM)、深度卷積神經(jīng)網(wǎng)絡(luò)(DeepCNN)、Residual/Highway網(wǎng)絡(luò)等模型,具體特點見表2-3。表2-3的突破,主要的應(yīng)用包括語音助手、語音輸入、語音搜索等,可應(yīng)用在各類移動應(yīng)用和終端應(yīng)用等對人機交互有較高要求的領(lǐng)域。對于語音識別技術(shù)而言,率先發(fā)展起來的服務(wù)機器人和語音助手已占據(jù)數(shù)據(jù)積累的領(lǐng)先地位,在家居、出行、運動等多個場景中,語音交互正在爆方言識別等更為精準的識別方式。簡單地說,自然語言處理(NaturalLanguageProcessing,NLP)就是用計算機來處理、理解以及運用人類語言,屬于人工智能的一個分支,是表2-4幾種常用的深度神經(jīng)網(wǎng)絡(luò)NLP圖2-10實時進行視頻檢測和數(shù)據(jù)分析(見圖211)。由于機器不疲勞,而且可以全面識別整幀圖像信息,通過使用該技術(shù)處理海量監(jiān)控視頻,可大大降低交管、公安部門的監(jiān)控負擔,具體的應(yīng)用場景包括車輛識別、非法停車檢測、嫌犯追蹤等。圖2-11照該特征規(guī)律進行識別,圖像識別的精準度也得到極大的提升(目前到了95%以上)。機器不再只是通過特定的編程完成任務(wù),而是通過不斷學習來掌握本領(lǐng),這主要依賴高效的模型算法進行大量數(shù)據(jù)訓練。場景包括企業(yè)、住宅的安全管理,公安、司法和刑偵的安全系統(tǒng)、自助服務(wù)等,刷臉支付、刷臉進站等項目逐漸實現(xiàn)。人臉識別包括1︰1臉對比和1︰的人臉對比。1︰1主要指用戶真實的臉部信息與用戶提交的身份證信息進行比對,常見于銀行等金融機構(gòu)和公安系統(tǒng)。1︰更常見于刑偵和國家安防領(lǐng)域,能夠通過與D庫的對比,快速找到犯罪分子或失蹤人員,1︰識別精度的難度要遠遠高于1︰1人臉識別。廠商也針對1︰的精確度做了技術(shù)深耕,百度曾宣布百度大腦的1︰人臉識別監(jiān)測準確率已達99.7術(shù)進行補充。人臉識別技術(shù)另一個關(guān)鍵層面在于D庫的建立,三維人臉識別數(shù)據(jù)采集相對困難,需采集的數(shù)據(jù)量十分巨大,對計算機的計算存儲能力要求較高,D庫的數(shù)據(jù)量是人臉識別技術(shù)算法訓練的基礎(chǔ),數(shù)據(jù)越多,相應(yīng)的準確度才會越高。各廠商仍需繼續(xù)擴充自身的庫規(guī)模。在美國,亞馬遜推出了人臉識別系統(tǒng)kogno(注:亞馬遜故意取名為kognon,有別于識別”對應(yīng)的正確英文單詞ognon),識別不再是一個高價的服務(wù)了。人工智能與行業(yè)的深度結(jié)合,可以實現(xiàn)傳統(tǒng)行業(yè)的智能化,包括金融、醫(yī)療、安防、家居、教育等,如圖21所示。在各個垂直領(lǐng)域中,傳統(tǒng)廠商具備產(chǎn)業(yè)鏈、渠道、用戶數(shù)據(jù)優(yōu)勢,正通過接入互聯(lián)網(wǎng)和搭載人工智能的浪潮進行轉(zhuǎn)型。創(chuàng)業(yè)公司深耕垂直領(lǐng)域,快速崛起,致力于推動技術(shù)進步、場景落地。應(yīng)用層廠商更直接地面對用戶,或者遵循2、2用戶數(shù)據(jù),也需要進一步打磨產(chǎn)品,滿足用戶需求。圖2-12AI圖2-13能視頻分析(IntelligentVideoAnalysis,IVA)技術(shù)是解決海量視頻數(shù)據(jù)處理的有效途徑。IVA采用計算機視覺方式,主要應(yīng)用于兩個方面,一身份認證主要通過人臉識別、指紋識別、聲紋識別、虹膜識別等生物識別技術(shù)快速提取客戶的特征。近年來,金融機構(gòu)對遠程身份識別、遠程獲客需求日益增加,而人臉信息憑借易于采集、較難復(fù)制和盜取、自然直觀等優(yōu)勢,在金融行業(yè)中的應(yīng)用不斷增加。人臉識別可實現(xiàn)客戶“刷臉”即可開戶、登錄賬戶、發(fā)放貸款等,讓金融機構(gòu)遠程獲客和營銷成為可能。在互聯(lián)網(wǎng)金融領(lǐng)域,刷臉刷臉支付等諸多領(lǐng)域。同時,人臉識別可以成為銀行安全防控手段的有效選擇。銀行安防的難點之一是在動態(tài)場景下完成多個移動目標的實時監(jiān)控,人臉識別技術(shù)在銀行營業(yè)廳等人員密集的區(qū)域可有效實現(xiàn)多目標實時在線檢索、比對,在自助設(shè)備、銀行庫區(qū)等多個場景下都可以應(yīng)用。中國人民銀行發(fā)布《中國人民銀行關(guān)于優(yōu)化企業(yè)開戶服務(wù)的指導(dǎo)意見》(銀發(fā)〔2017〕288號),對新設(shè)企業(yè)開立人民幣銀行結(jié)算賬戶服務(wù)提出意見。央行鼓勵銀行積極運用技術(shù)手段提升賬戶審核水平,包括鼓勵銀行將人臉識別、光學字符識別()、二維碼等技術(shù)手段嵌入開戶業(yè)務(wù)流程,作為讀取、收集以及核驗客戶身份信息和開戶業(yè)務(wù)處理的輔助手段。圖2-14金融行業(yè)目前正在打造閉合的全產(chǎn)業(yè)鏈,提供的服務(wù)不僅針對客戶成長中的某一階段,而是全生命周期的服務(wù)。如圖215所示,每個客戶都要經(jīng)歷獲取、提升、保持、流失和衰退幾個階段。在不同的發(fā)展階段,風險特點及對金融服務(wù)需求的特點不盡相同。基于同階段的客戶開展個性化金融業(yè)務(wù)。圖2-15圖2-16目前,智能家居仍處于從手機控制向多控制結(jié)合的過渡階段,手機pp仍是智能家居的主要控制方式,但基于人工智能技術(shù)開發(fā)出來的語音助家居從多控制結(jié)合向感應(yīng)式控制再到機器自我學習自主決策階段發(fā)展。另一方面,政府在積極推動“人工智能醫(yī)療的應(yīng)用進程。2017年7月8日,國務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,提出發(fā)展便捷高效的智能破健康大數(shù)據(jù)分析、物聯(lián)網(wǎng)等技術(shù),構(gòu)建安全便捷的智能化養(yǎng)老基礎(chǔ)設(shè)施體系,加強老年人產(chǎn)品智能化和智能產(chǎn)品適老化等。“人工智能醫(yī)學影像”是將人工智能技術(shù)應(yīng)用在醫(yī)學影像的診斷上,實際上是模仿人類醫(yī)生的閱片模式。人工智能技術(shù)應(yīng)用于醫(yī)學影像主要包括數(shù)據(jù)預(yù)處理、圖像分割、特征提取和匹配判斷4個流程。人工智能強大的圖像識別和深度學習能力,有助于解決傳統(tǒng)醫(yī)學影像中存在的準確成立病理中心,高端診斷服務(wù)將成為影像識別技術(shù)的巨大機會。“人工智能輔助診療”就是將人工智能技術(shù)應(yīng)用于輔助診療中,讓機器學習專家醫(yī)生的醫(yī)療知識,通過模擬醫(yī)生的思維和診斷推理來解釋病癥療方案。如圖217所示,輔助診療的一般模式為:獲取病癥信息→做出假設(shè)→制定治療方案。Mo融合了認知技術(shù)、推理技術(shù)、自然語言處理技術(shù)、機器學習及信息檢索等技術(shù),是目前“人工智能輔助診療”應(yīng)用中最為成熟的案例。Mo已經(jīng)通過了美國職業(yè)醫(yī)師資格考試,并在美國多家醫(yī)院提供輔助診療服務(wù)。Mo可以在17秒內(nèi)閱讀3469本醫(yī)學專著、248000篇論文、69種治療方案、61540次試驗數(shù)據(jù)、106000份臨床報告?!叭斯ぶ悄茌o助診療”服務(wù)基于電子處方、醫(yī)學文獻、醫(yī)學影像等數(shù)據(jù),尋找疾病與解決方案之間的對應(yīng)關(guān)系,構(gòu)建醫(yī)學知識圖譜,在診斷決策層面有效優(yōu)化醫(yī)生的診斷效率。未來,“人工智能輔助診療”的市場空間巨大,尤其在基層常見病診療方面能夠發(fā)揮較大效能,有效提高基層醫(yī)療效率,降低醫(yī)療成本。高效分析能力有效提高醫(yī)療行業(yè)的產(chǎn)能。人工智能廣泛應(yīng)用于醫(yī)療領(lǐng)域有助于帶動基層醫(yī)療服務(wù)。“人工智能醫(yī)療”有望成為一種可復(fù)制的醫(yī)療資源,增加基層醫(yī)生的診斷精準度。圖2-17下,自動安全地操作機動車輛。先進駕駛輔助系統(tǒng)(AdvancedDriverAssistantSystem,ADAS)利用安裝于車上的各式各樣的傳感器,在第一圖2-18感知(傳感···毫米波雷達指工作在毫米波波段的雷達。采用雷達向周圍發(fā)射無線電,波長在1~10,頻率在30~300,比較常見的汽車毫米波雷達工作頻率在24、77、79三個頻率附近。毫米波雷達通過測定和分析反射波以計算障礙物的距離、方向、角度、相對速度和大緊急制動避免碰撞。當碰撞不可避免時,通過對剎車、頭靠、安全帶等進行控制,減輕因碰撞而帶來的危害。芯片在自動駕駛系統(tǒng)中的行業(yè)集中度高,主要有oby、I等公司。oby作為界的大佬,占領(lǐng)了全球汽車安全駕駛系統(tǒng)70%以上的市場份額。在這個領(lǐng)域深耕細作十幾年,有相當深厚的歷史背景,這些經(jīng)驗并不是其他公司短時間可以超越的。由谷歌街景的共同發(fā)明人SebastianThrun領(lǐng)導(dǎo)。谷歌的工程人員使用7輛試驗車,目前已經(jīng)行駛上百萬千米。再比如,Driver.ai公司利用深度學表2-5按照IHSAutomotive保守估計,全球L4/L5自動駕駛汽車產(chǎn)量在2025年將達到接近60萬輛,并在2025—2035年間獲得高速發(fā)展。在這個“無人駕趨勢1趨勢2趨勢3:深度學習算法應(yīng)用于專用集成電路()是根據(jù)特定客戶要求和特定電子系統(tǒng)的需要而設(shè)計、制造的集成電路,即芯片。在批量生產(chǎn)時,與通用集成電路相比具有體積更小、功耗更低、可靠性更高、保密性更強、成本更低等優(yōu)點。將深度學習算法應(yīng)用在自動駕駛并且利用專用芯片技術(shù)來實現(xiàn)深度學習功能的處理器,相比于而言,處理器犧牲了靈活性以換取尺寸和功耗下降,處理器去除了通用芯片中與算法實現(xiàn)無關(guān)的組件,在犧牲靈活性的同時,極大地提升了自動駕駛深度學習的效率。趨勢5使用物流無人駕駛能為物流行業(yè)解決以下3AI·基礎(chǔ)設(shè)施層,主要有基礎(chǔ)數(shù)據(jù)提供商、半導(dǎo)體芯片供應(yīng)商、傳感器供應(yīng)商和云計算服務(wù)商。在過去的5~10年,人工智能技術(shù)得以商業(yè)化,主要得益于傳感器等硬件價格快速下降、云服務(wù)的普及以及經(jīng)基本形成?!ぜ夹g(shù)層,主要有語音識別、自然語言處理、計算機視覺、深度學習技術(shù)提供商。與其他技術(shù)相比,語音識別在技術(shù)和應(yīng)用方面都已經(jīng)較為成然語言處理等方向也將是技術(shù)和應(yīng)用發(fā)展較快的領(lǐng)域。·處于應(yīng)用產(chǎn)品層的企業(yè),主要是把人工智能相關(guān)技術(shù)集成到自己的產(chǎn)品和服務(wù)中,然后切入特定場景(金融、家居、醫(yī)療、安防、車載等)未來數(shù)據(jù)完整(信息化程度原本就比較高的行業(yè)或者數(shù)據(jù)洼地行業(yè))、反饋機制清晰、追求效率動力比較強的場景或?qū)⒙氏葘崿F(xiàn)技術(shù)的大規(guī)模商業(yè)化。目前來看,自動駕駛、醫(yī)療、安防、金融、營銷等領(lǐng)域是業(yè)內(nèi)人士普遍比較看好的方向。圖2-19AI小,專業(yè)型人才開始增多,具有核心知識的專家仍然成為廠商搶奪的重點。在人工智能領(lǐng)域中,國內(nèi)人才集中在技術(shù)層及應(yīng)用層,基礎(chǔ)層人才薄弱,國內(nèi)高校在人工智能人才培養(yǎng)方面也持續(xù)缺失,專業(yè)布局較晚,專家有限,國內(nèi)外在教育系統(tǒng)之間的差距較大,這也導(dǎo)致國內(nèi)在人工智能領(lǐng)域基礎(chǔ)層研究的薄弱。在意識到人才方面的缺失之后,國家及企業(yè)采取各類措施進行追趕,比如采取“千人計劃新一代人工智能發(fā)展規(guī)劃”等政策吸引優(yōu)秀專業(yè)人才回國,企業(yè)圍繞其核心業(yè)務(wù)搶奪人工智能人才。未來需要繼續(xù)建立核心技術(shù)人才培養(yǎng)體系,加強人工智能一級學科建設(shè),實現(xiàn)產(chǎn)學研的有效融合,為人工智能產(chǎn)業(yè)持續(xù)不斷輸送優(yōu)質(zhì)人才。第3從1956年達特茅斯會議人工智能這一概念被提出,到現(xiàn)在已經(jīng)有六十多年了,這期間經(jīng)過了多個階段。2010年以后,隨著深度學習使得語音現(xiàn)的概念,其次是機器學習,最后出現(xiàn)的是深度學習,是當今人工智能大爆炸的核心驅(qū)動(見圖31)。圖3-1機器學習(MachineLearning,簡稱ML)是讓機器從大量樣本數(shù)據(jù)中自動學習其規(guī)則,并根據(jù)學習到的規(guī)則預(yù)測未知數(shù)據(jù)的過程。以上是機器成的,讓機器發(fā)現(xiàn)事物的規(guī)律。在我們小的時候,我們對周邊的事物還并不了解,不知道什么是蘋果,什么是貓,什么是汽車。但在經(jīng)過某種訓練之后,我們逐漸能夠自信而準確地判斷出我們看到的、聽到的、感知到的東西是什么。這個訓練可能來自外部的教導(dǎo),也可能源自于我們自身的探索和嘗試。舉個例子來說,在我們很小的時候,家長帶我們參觀動物園。剛剛學會說話和識字的我們會看到很多令我們驚奇的未知生物。家長告訴我們那個長鼻子的動物是大象,我們似懂非懂地記住了。走了幾步之后,我們又在另一個地方發(fā)現(xiàn)了另一只長得很像之前看到過的動物,家長又告訴我們這也是一只大象?;氐郊抑?,我們拿著洗出來的照片,指著照片上的長鼻子問媽媽,這個是什么來著?媽媽回答我們說是大象。這時我們已經(jīng)逐漸發(fā)現(xiàn)了這個叫作大象的東西長相的特點(見圖32)憑借自己對長鼻子和其他特征的一些判斷,我們向媽媽喊出:看,是大象。圖3-2圖3-3如圖34所示,類似人腦思考,機器經(jīng)過大量樣本的訓練(nng),獲得了一定的經(jīng)驗(模型),從而產(chǎn)生了能夠推測(nn,推斷或推理)新的事物的能力,就是機器學習。這種預(yù)測能力,本質(zhì)上是輸入到輸出的映射。圖3-4圖3-5機器學習也是一門技術(shù),它被數(shù)據(jù)科學家(an)廣泛應(yīng)用,是在數(shù)據(jù)分析中最常用的技術(shù)之一。而數(shù)據(jù)科學家是21世紀最火熱的職機器學習越來越能夠落地而發(fā)揮使用價值。同時,隨著yhon等編程語言的普及以及noo等機器學習框架的完善,這個曾經(jīng)似乎是高端學術(shù)的東西也越來越偏向應(yīng)用,能夠被更多人接受。圖3-6在占極少數(shù)。那么,深度學習究竟為何能夠在短時間內(nèi)異軍突起,擊敗它的老前輩們,成為新時代的寵兒?深度學習的優(yōu)勢究竟在哪里?在本書介紹完機器學習和深度學習后,相信讀者會對它們的本質(zhì)看得更透徹,也會對二者產(chǎn)生更直觀的感性認識,對這個問題我們會在第7章給出解釋。除了深度學習之外,另一個和機器學習類似而被人們廣泛談?wù)摰脑~語是數(shù)據(jù)挖掘(DataMining)。另外,數(shù)據(jù)分析(DataAnalysis)和大數(shù)據(jù)分析(BigDataAnalysis)也似乎和機器學習有著密切的聯(lián)系。下面我們把這幾個概念放到一起談?wù)劇1?-1數(shù)據(jù)挖掘的一個經(jīng)典案例是啤酒和尿布的故事。在20世紀90年代,美國沃爾瑪超市的管理人員從銷售數(shù)據(jù)中發(fā)現(xiàn)了一個有趣的現(xiàn)象:在某些特定的情況下,啤酒與尿布兩件看上去毫無關(guān)系的商品經(jīng)常會出現(xiàn)在同一個購物籃中。經(jīng)過后續(xù)分析發(fā)現(xiàn),同時購買這兩種商品的顧客通親在購買尿布的同時,往往會順便為自己購買啤酒。因此,啤酒和尿布竟然成為會經(jīng)常同時購買的商品。這樣一來,沃爾瑪想出了一個點子,將啤酒和尿布嘗試擺放在同一個貨架區(qū)域,從而讓年輕父親能夠在找到尿布的同時發(fā)現(xiàn)啤酒,于是大大提升了兩種商品的購買率,最終為超市帶來了更高的營業(yè)收入。通過數(shù)據(jù)挖掘,沃爾瑪員工給公司挖掘出了商業(yè)價值。這就是數(shù)據(jù)挖掘的魅力所在。表3-2*數(shù)據(jù)節(jié)選自PythonSeaborn數(shù)據(jù)包。原數(shù)據(jù)包中含244個樣??,7我們通常把表32這樣的樣本數(shù)據(jù)叫作數(shù)據(jù)集(),該數(shù)據(jù)集以結(jié)構(gòu)化的列表形式呈現(xiàn)。數(shù)據(jù)集由若干樣本(nn或xp)組成,每一個樣本是一個觀測數(shù)據(jù)的記錄(od),或者叫觀測值(bvn),在表格中以行(o)的形式體現(xiàn)。在機器學習中,一行、一條記錄和一個樣本的概念可以視為是等價的。在這個情景中,我們關(guān)注的是顧客給予小費的情況,小費這一列是我們關(guān)注的結(jié)果(IndependentVariable),在機器學習領(lǐng)域通常用特征(Feature)這個術(shù)語來表示。特征和標簽在表中通常以列(Column)的形式呈現(xiàn)。整個圖3-7續(xù)型(比如溫度、價格)的時候,我們把這類問題叫作回歸任務(wù)(RegressionTask);當目標變量是離散型(例如某種植物是否具有毒性、貸款人是否會違約、員工所屬部門類別)的時候,我們遇到的問題則是分類任務(wù)(ClassificationTask)?;貧w問題和分類問題是監(jiān)督式學習的兩有時我們遇到的樣本數(shù)據(jù)并沒有標簽數(shù)據(jù),我們把這個問題叫作非監(jiān)督式學習(nupvdnng)。非監(jiān)督式學習雖然沒有標簽數(shù)據(jù),但我們?nèi)匀豢梢酝诰蛱卣鲾?shù)據(jù)的信息進行分析,聚類(ung)就是其中最常見的一種,它根據(jù)樣本數(shù)據(jù)分布的特點將數(shù)據(jù)分成幾個類,雖然我們不知道類別是什么。因此,我們可以把機器學習任務(wù)按圖38進行分類。圖3-8強化學習(ReinforcementLearning)是不同于監(jiān)督式學習和非監(jiān)督式學習的另一種機器學習方法。在傳統(tǒng)機器學習分類中不包括強化學習,而圖3-9機器學習的3強化學習的一個經(jīng)典例子是訓練狗。讓狗蹲下,如果狗聽話蹲下,那么就給它一個獎勵(小食品),通過這么不斷的強化訓練,狗最后就越來越聽話了。所以,強化學習是基于行動反饋斷改進行動,從而適應(yīng)環(huán)境。強化學習與監(jiān)督式學習的主要區(qū)別是,前者是完全靠自己的經(jīng)歷去學習,沒有人告知學習機正確的答案,強化的信號是對學習機行動的反饋;而后者則是有人在監(jiān)督學習機。強化學習就像人類剛出生時探索未知的大自然一樣,是自我摸索尋找行為道路的過程。強化學習目前一個火熱的應(yīng)用是在游戲游戲的機器人要學會如何躲避敵人子彈,找到最合理的開槍和換子彈時機,這些用傳統(tǒng)的機器學習來完成是相當困難的,因為游戲?qū)质莿討B(tài)的、瞬息萬變的,有無數(shù)種可能。要用監(jiān)督式學習教會電腦如何進行這些操作,需要訓練的過程是漫長而煩瑣的。強化學習很好地適應(yīng)了這一問題。我們需要給電腦一個反饋機制,將未能躲避子彈作為懲罰,殺死敵人給予獎賞,剩下的就完全交給電腦去完成。這樣電腦就能通過一遍又一遍的行為探索得到一套成熟有效的行動方案。在機器學習任務(wù)中,我們通常將數(shù)據(jù)集分成三部分:訓練集(TrainingSet)、驗證集(ValidationSet)和測試集(TestSet)。下面介紹這三個學校學習功課,訓練集如同教科書中的題庫,測試集相當于考試試卷。我們通過刷題庫獲得知識,從而在考試中取得優(yōu)異的成績,如圖310所示。圖3-10集上的測試效果通常會很好,但在沒有見過的數(shù)據(jù)集上表現(xiàn)效果可能會明顯下降,這個現(xiàn)象叫作過度擬合(vng,簡稱過擬合)。有關(guān)試集。就像只有考試才能最公平地衡量學生對功課的掌握程度一樣。在常規(guī)的機器學習中,一般把80的數(shù)據(jù)放到訓練集,而把20的數(shù)據(jù)放到測試集。圖3-11一般來說,在“數(shù)據(jù)導(dǎo)入”后,經(jīng)過預(yù)處理,機器學習算法讀入的是像表3-2一樣的結(jié)構(gòu)化數(shù)據(jù)(StructuredData)。在結(jié)構(gòu)化數(shù)據(jù)中,特征都是探索性分析(xpooyny),也叫探索性數(shù)據(jù)分析(xpooyanys)是通過圖表等可視化工具對原始數(shù)據(jù)(wa)進行大致了解和初步分析的過程。探索性分析的目的是讓我們對陌生的數(shù)據(jù)集有個直觀和感性的認識,從而在龐大的數(shù)據(jù)集中發(fā)現(xiàn)有價值的、值得挖掘的信息,找出數(shù)據(jù)集中的“亮點。具體而言,通過探索性分析,我們可以:好的數(shù)據(jù)總是比好的算法要強得多(Betterdatabeatsfancieralgorithms)。任何想從事機器學習的數(shù)據(jù)分析師,首先要記住這句話。如果數(shù)據(jù)質(zhì)量差,雜亂無章,即使再好的算法也沒有用,就好比加工垃圾一樣,用再先進的技術(shù)加工出來的成品也是垃圾(Garbagein,garbageout)。之所以要進行數(shù)據(jù)清洗(DataCleaning),是因為在現(xiàn)實生活中,我們遇到的絕大多數(shù)數(shù)據(jù)集都是“不干凈的”。比如會出現(xiàn)以下情形(見表3-·表3-3*NaN設(shè)想一下,假如我們遇到表33據(jù)亂不等于它沒有分析價值,只要經(jīng)過專業(yè)的數(shù)據(jù)清洗和特征工程處理,我們?nèi)匀荒艿玫匠錾姆治鲂Ч,F(xiàn)實中數(shù)據(jù)來源紛雜多樣,絕大多數(shù)做機器學習的人都需要花費大量時間進行數(shù)據(jù)預(yù)處理和清洗。圖3-12特征工程(uengnng)又稱特征提取,是機器學習建模之前的一個重要步驟。前文提到,機器學習的本質(zhì)是要找從特征(通常用x表示)到目標(通常用y表示)的映射,我們最終的目標是輸出y。如果x“不給力找到合適的特征集x的過程。比如,通過對客戶流失數(shù)據(jù)集的特征提取,可以得到導(dǎo)致客戶流失的一系列主要特征,利用這些特征可以有效地預(yù)測客戶的流失(目標/標簽)。程是漫長而艱苦的過程。在gg數(shù)據(jù)科學競賽中,選手們平均花在構(gòu)建特征集的時間在70%以上。一個好的特征集通常能戰(zhàn)勝一個好的模型或者算法。特征工程往往還包含一些同特征選取和降維相關(guān)的預(yù)處理。我們將在第4章詳細講解。機器學習常用的算法有分類、聚類、回歸、神經(jīng)網(wǎng)絡(luò)等。本節(jié)簡要概述機器學習算法,讓讀者有一個整體的印象。第5式學習的范疇。主要的分類算法包括決策樹、KNN法(K-NearestNeighbor)、SVM法、Bayes法、神經(jīng)網(wǎng)絡(luò)等。分類算法是有局限性的。分類主要的聚類算法可以劃分為5類,即劃分方法、層次方法、基于密度的方法、基于網(wǎng)格的方法和基于模型的方法。每一類中都存在得到廣泛應(yīng)用的算法,劃分方法中有ns應(yīng)用到客戶群體的分類、客戶背景分析、客戶購買趨勢預(yù)測、市場的細分等。輸給已有的框架進行分析和處理,縮短了開發(fā)時間,提升了訓練效果,極大地推動了技術(shù)的商業(yè)化進程。在本節(jié)中,我們以kn為例看看機器學習框架和庫是什么樣子的。表3-4Python對于初次接觸yhon語言的讀者,我們推薦下載nond。nond集成了yhon基本環(huán)境和常見程序包,安裝方便,非常適合初學者使用。讀者只需從nond官網(wǎng)上免費下載其最新版本,就可以編寫yhon程序。本書中所有實例代碼都可以在nondayhon中實現(xiàn)。在nonda上,我們可以選擇pyd進行代碼的編寫。pyd是yhon的一款。如同其他編程語言一樣,yhon在編寫代碼時需要一個集成開發(fā)環(huán)境,就是集成開發(fā)環(huán)境的縮寫,它給用戶提供了編程需要的圖形化界面、編輯器、編譯器、調(diào)試器等。scikit-learn一款成熟的機器學習商業(yè)軟件。kn是一個針對機器學習的強大yho程序包,主要用于構(gòu)建模型,使用諸如uy、y和pob等程序包構(gòu)建,對于統(tǒng)計建模技術(shù)(如分類、回歸、集群等)非常有效。kn的特性包括監(jiān)督式學習算法、非監(jiān)督式學習算法和交叉驗證,官網(wǎng)地址是\hhpkn.og。kn的基本功能主要被分為六大部分:分類、回歸、聚類、數(shù)據(jù)降維、模型選擇和數(shù)據(jù)預(yù)處理?!し诸悾╫):用于解決二元分類問題、多分類問題、圖像識別等。算法有邏輯回歸、M、最近鄰、隨機森林、樸素貝葉斯、神經(jīng)網(wǎng)絡(luò)等?!ぞ垲悾–lustering):可應(yīng)用于客戶細分、分組實驗結(jié)果等應(yīng)用場景。算法有k-Means、spectralclustering(譜聚類)、mean-shift(均值漂移)·模型選擇(ModelSelection):它的功能是通過參數(shù)調(diào)整提高精度。模塊有pipeline(流水線)、grid_search(網(wǎng)格搜索)、cross_validation(交另外,kn還包括模型融合的模塊,如:nb(集成學習)和一些輔助工具模塊,如:xpon(異常和警告)、d(自帶數(shù)據(jù)集)等。正如上節(jié)中提到的,yhon中有完備的機器學習程序包k無須知道算法的原理,也無須懂得模型的含義,甚至無須會編程,即可調(diào)用程序包,執(zhí)行并得到我們需要的結(jié)果。整個過程不過只是幾行代碼,就像把大象放到冰箱一樣,只需三步。下面我們以k為例,來看看它如何解決機器學習經(jīng)典案例——泰坦尼克(nc)沉船生存預(yù)測。(hp\h.kgg.on)開始講解。這個數(shù)據(jù)集包含3個文件,我們現(xiàn)在只關(guān)心兩個文件,一個是訓練數(shù)據(jù)(n.v),一個是測試數(shù)據(jù)(.v)。另一個文件是提交給gg競賽的樣本文件(輸出結(jié)果文件)。我們利用泰坦尼克號訓練數(shù)據(jù)集,運用隨機森林算法根據(jù)乘客的不同變量參數(shù)特征進行學習,最后用測試數(shù)據(jù)集得出其他乘客的預(yù)測值(是否幸存)。表3-5訓練數(shù)據(jù)樣Jupyter準確的標簽。之后就是根據(jù)業(yè)務(wù)特性來嘗試不同的機器學習算法。隨著云計算的普及,機器學習也經(jīng)常在云端完成,我們在云端創(chuàng)建u,導(dǎo)入數(shù)據(jù)并進行訓練。訓練結(jié)束后關(guān)閉u。一個流行的開源工具就是upyrobook。JupyterNotebook的本質(zhì)是一個Web應(yīng)用程序,便于創(chuàng)建和共享程序文檔,支持實時代碼、數(shù)學方程、可視化和Markdown。它可廣泛用在數(shù)據(jù)清理和轉(zhuǎn)換、數(shù)值模擬、統(tǒng)計建模、機器學習等領(lǐng)域。有人認為JupyterNotebook是用Python做機器學習最好用的IDE。那么,什

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論