人工智能基礎應用 課件全套 曾香金模塊1-5 人工智能基礎-人工智能安全與人工智能倫理_第1頁
人工智能基礎應用 課件全套 曾香金模塊1-5 人工智能基礎-人工智能安全與人工智能倫理_第2頁
人工智能基礎應用 課件全套 曾香金模塊1-5 人工智能基礎-人工智能安全與人工智能倫理_第3頁
人工智能基礎應用 課件全套 曾香金模塊1-5 人工智能基礎-人工智能安全與人工智能倫理_第4頁
人工智能基礎應用 課件全套 曾香金模塊1-5 人工智能基礎-人工智能安全與人工智能倫理_第5頁
已閱讀5頁,還剩322頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

任務一

初識人工智能

任務二

探究人工智能技術應用任務一

初識人工智能本任務的兩個活動分別介紹了人工智能的概念和人工智能的發(fā)展歷程,并安排了體驗

人工智能和仿圖靈測試兩個學習任務。本任務旨在使學生明確人工智能的定義和研究領域,

了解人工智能的分類、主要的研究學派、發(fā)展階段,以及我國人工智能的發(fā)展現(xiàn)狀,形成

對人工智能的初步認知。學習導圖活動一

了解人工智能的概念一、人工智能的定義及研究領域人工智能(Arti?cialIntelligence,AI)是研究、開發(fā)用于模擬、延伸和擴展人類智能的理論、方法、技術及應用系統(tǒng)的一門新興技術科學。它結合了計算機科學、數(shù)學、心理學、哲學等多學科的理論和技術,旨在探索智能的本質,生產出一種新的能以與人類智能相似的方式做出反應的智能機器。人工智能的研究領域廣泛,包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。其目標是使機器能夠勝任一些通常需要人類智能才能完成的復雜工作。人工智能的發(fā)展以算法、算力和數(shù)據(jù)為驅動力,其中算法是核心,算力和數(shù)據(jù)是基礎。隨著算法的不斷優(yōu)化和算力的逐步提升,人工智能在多個領域都取得了顯著進展,如機器視覺、語音識別、語義識別、圖像識別、動作控制等。同時,人工智能也開始廣泛滲透到金融、客服、安防、醫(yī)療、無人駕駛、教育和家居等行業(yè),對促進經濟社會的轉型升級發(fā)揮了重要作用。預備知識:人工智能簡介二、人工智能的分類根據(jù)智能程度的不同,人工智能可分為弱人工智能、強人工智能和超人工智能。目前,弱人工智能的應用非常廣泛,強人工智能和超人工智能還處于研究和探索階段。這三類人工智能都有其特定的應用場景和發(fā)展前景。1.弱人工智能弱人工智能是指不具備獨立意識,只能在人類設計的程序范圍內決策,無法自主學習和進化的智能機器。這些機器看起來像是智能的,但并不真正擁有智能,也不會有自主意識。弱人工智能具有以下局限性:(1)弱人工智能只能在特定領域內處理預設的任務,缺乏對新問題和場景的應對靈活性,其工作方式和解決問題的種類非常有限。(2)弱人工智能沒有自主意識,只能模擬人類的某些智能行為,無法像人類一樣具有全面的判斷和決策能力,也無法自主思考問題并制訂最優(yōu)的解決方案,其智能程度遠遠無法與強人工智能相比。弱人工智能的應用主要依賴于預設的程序和大數(shù)據(jù)處理技術,通過對大量數(shù)據(jù)的分析和學習,使計算機能夠自主地完成特定的任務。弱人工智能是人工智能領域中的重要分支,也是目前應用最廣泛的智能技術之一。雖然弱人工智能無法取代人類做出全面和復雜的決策,但它在特定領域內已經取得了顯著的成果,為人類帶來了很多便利和效益。2.強人工智能強人工智能又稱通用人工智能或全人工智能,是指具備類似人類全面智能的人工智能系統(tǒng)。強人工智能系統(tǒng)不僅具備人類的感知、知覺和表象等智能行為,而且能夠理解復雜的概念,以及推理、學習和解釋自己的思考過程。強人工智能系統(tǒng)還能像人類一樣自主地思考問題,制訂最優(yōu)的解決方案,并具有自我意識。目前,強人工智能還處于研究和探索階段,需要進一步的技術突破和工程化實現(xiàn)。強人工智能是人工智能領域中的重要研究方向之一,也是未來智能技術發(fā)展的重要趨勢之一。雖然目前強人工智能還面臨許多技術挑戰(zhàn)和倫理問題,但它的實現(xiàn)將會對人類社會產生深遠的影響。3.超人工智能超人工智能是指智能超越人類的智慧水平,具有超越人類的認知能力、感覺能力、思維能力等。超人工智能的概念主要源于科幻小說和電影,目前還沒有實際實現(xiàn)。但是,隨著人工智能技術的不斷進步和計算機科學的迅速發(fā)展,未來有可能實現(xiàn)超人工智能。三、人工智能研究的主要學派1.符號主義(Symbolism)符號主義又稱為邏輯主義、心理學派或計算機學派,是一種基于邏輯推理的智能模擬方法。其主要采用物理符號系統(tǒng)假設和有限合理性原理。符號主義認為人類認知和思維的基本單元是符號,智能是符號的表征和運算過程。符號主義主張用逆向演繹來進行模型的優(yōu)化,認為智能是可形式化的符號規(guī)則的推導。符號主義的首個代表性成果是啟發(fā)式程序LT(邏輯理論家),它證明了38條數(shù)學定理,表明了可以應用計算機研究人的思維過程,模擬人類智能活動。此后,符號主義走過了一條啟發(fā)式算法—專家系統(tǒng)—知識工程的發(fā)展道路。專家系統(tǒng)是一種程序,能夠依據(jù)一組從專門知識中推演出的邏輯規(guī)則在某一特定領域回答或解決問題。符號主義的代表人物是紐威爾、肖、西蒙和尼爾森等,他們認為人工智能源于數(shù)學邏輯,主張用邏輯推理的方法來模擬人的思維活動。在早期的人工智能研究中,大多數(shù)研究者都屬于符號主義學派。2.連接主義(Connectionism)連接主義又稱為仿生學派或生理學派,其主要采用神經網絡及神經網絡間的連接機制與學習算法。連接主義從神經元的基本功能出發(fā),深入研究神經網絡模型和腦模型,為人工智能的發(fā)展開辟了一條新的道路。在這一框架下,模型的好壞通過連續(xù)誤差測量來評判,其中平方誤差是一個常用的指標,它計算了模型預期值與真實值之間差異的平方總和。3.行為主義(Behaviorism)行為主義又稱為進化主義或控制論學派,其主要采用控制論及感知-動作型控制系統(tǒng)。行為主義的研究方法是個體行為的實驗分析,即分析個體反應與環(huán)境刺激的關系。行為主義主張機器學習遵循“感知-動作”模式,以類似新生兒的學習方式讓機器逐步適應環(huán)境。人工智能具備感知能力、語言處理能力、推理和決策能力、學習能力、自動化和智能化能力,也就是常說的會聽、會看、會說、會思考、會學習、會行動,如圖1-1所示。學習任務:體驗人工智能活動二

回顧人工智能的發(fā)展歷程一、人工智能的發(fā)展階段人工智能的發(fā)展可以劃分為六個階段:起步發(fā)展期、反思發(fā)展期、應用發(fā)展期、低迷發(fā)展期、穩(wěn)步發(fā)展期和蓬勃發(fā)展期。這六個階段反映了人工智能發(fā)展的曲折歷程。雖然經歷了挫折和低谷,但人工智能始終持續(xù)發(fā)展并逐漸改變著我們的生活和工作方式。1.起步發(fā)展期(1956年—20世紀60年代初)這一時期是人工智能的起步階段,隨著人工智能概念的提出,科學家們開始探索如何利用計算機模擬人類的智能。在這個階段,人工智能研究領域相繼取得了一些令人矚目的研究成果,如機器定理證明、跳棋程序等。這些成果不僅證明了人工智能的潛力和可能性,也激發(fā)了更多科學家和工程師對人工智能的熱情和興趣。這些早期的研究成果為后來人工智能的發(fā)展奠定了基礎,并掀起了人工智能發(fā)展的第一個高潮。預備知識:人工智能發(fā)展之路2.反思發(fā)展期(20世紀60年代初—70年代初)在人工智能發(fā)展的初期,隨著一系列突破性進展的出現(xiàn),人們對人工智能的期望不斷提升,開始嘗試更具挑戰(zhàn)性的任務,并設定了一些宏大的研發(fā)目標。然而,這一階段遭遇了多次失敗和預期目標未能實現(xiàn)的情況,使人工智能的發(fā)展走入低谷。3.應用發(fā)展期(20世紀70年代初—80年代中)在這個階段,人工智能開始從理論研究和一般性策略探討轉向實際應用和專門知識的運用,實現(xiàn)了重大突破。其中,專家系統(tǒng)的出現(xiàn)是該階段的重要標志。專家系統(tǒng)是一種模擬人類專家知識和經驗的問題解決系統(tǒng),它利用人工智能技術來模擬人類專家在特定領域的思維和決策過程。4.低迷發(fā)展期(20世紀80年代中—90年代中)隨著人工智能應用的不斷擴大,其局限性也逐漸暴露出來。專家系統(tǒng)在應用領域、知識獲取、推理方法等方面的問題逐漸顯現(xiàn),這些問題使得人工智能的發(fā)展陷入了低迷期。在這個階段,人工智能的發(fā)展面臨了許多挑戰(zhàn)和限制,其應用前景變得渺茫。5.穩(wěn)步發(fā)展期(20世紀90年代中—2010年)隨著網絡技術的快速發(fā)展,特別是互聯(lián)網技術的普及,人工智能技術得到了進一步的應用和推廣。這個階段的特點是人工智能技術的實用化,以及與其他領域的交叉融合和創(chuàng)新。6.蓬勃發(fā)展期(2011年至今)隨著大數(shù)據(jù)、云計算、互聯(lián)網、物聯(lián)網等信息技術的發(fā)展,人工智能技術迎來了新的蓬勃發(fā)展期。這個階段的特點是人工智能技術的飛速進步和應用領域的廣泛拓展。深度學習技術在這個階段取得了突破性的進展,大幅提升了人工智能的性能和應用效果。圖像分類、語音識別、知識問答、人機對弈、無人駕駛等人工智能技術實現(xiàn)了從“不能用、不好用”到“可以用”的技術突破,為各領域的應用提供了強大的支持。在人工智能的發(fā)展史上,圖靈等科學家作出了重要貢獻。人工智能發(fā)展史上的關鍵事件見表1-1。二、我國人工智能發(fā)展之路1.科研起步階段20世紀50年代,我國開始涉足人工智能研究,并取得了一些令人矚目的成果。1956年,我國科學家開始研究人工智能,并于70年代初在自然語言處理領域取得了一系列成果。此后,我國政府開始意識到人工智能的重要性,并將其納入國家發(fā)展戰(zhàn)略。在政策支持下,我國在人工智能領域的投入逐漸增加,科研實力和創(chuàng)新能力不斷提升。在起步階段我們雖然面臨技術落后、人才短缺等困難,但在政府的大力支持和市場的驅動下,我國在人工智能領域的科研實力和創(chuàng)新能力不斷提升,為后續(xù)的發(fā)展奠定了堅實的基礎。2.產業(yè)快速發(fā)展階段自改革開放以來,我國人工智能產業(yè)經歷了快速發(fā)展階段。在這個階段,我國政府出臺了一系列政策扶持人工智能產業(yè),包括資金支持、優(yōu)惠稅收、創(chuàng)新人才引進等,提高了人工智能產業(yè)的發(fā)展士氣和創(chuàng)新活力。同時,在算法、芯片、機器人等領域的技術研發(fā)取得了顯著進展。此外,大數(shù)據(jù)、云計算等細分ICT行業(yè)也得到了快速發(fā)展,為人工智能技術的應用提供了有力支撐。我國人工智能產業(yè)在改革開放后得到了快速發(fā)展,政府和企業(yè)共同努力,推動了人工智能技術的創(chuàng)新和應用,為我國科技事業(yè)的發(fā)展作出了重要貢獻。3.國家戰(zhàn)略規(guī)劃發(fā)展階段國家戰(zhàn)略規(guī)劃發(fā)展階段是我國人工智能發(fā)展的一個重要階段。在這個階段,我國政府對人工智能的發(fā)展進行了全面的戰(zhàn)略規(guī)劃和布局,包括設立人工智能發(fā)展專項基金、建設人工智能產業(yè)園區(qū)、推動人工智能技術的應用示范等,旨在推動人工智能技術的快速發(fā)展和應用,提升國家科技實力和國際競爭力。同時,我國政府還加強了與國際社會的合作,積極參與國際人工智能標準制定和治理體系建設,推動了我國人工智能產業(yè)的國際化發(fā)展。圖靈測試(如圖1-2所示)是由計算機科學和密碼學的先驅艾倫·麥席森·圖靈提出的一種測試機器是否具備人類智能的方法。學習任務:仿圖靈測試任務二

探究人工智能技術應用本任務的兩個活動分別介紹了人工智能的技術支撐以及人工智能應用的行業(yè),并安排了利用大數(shù)據(jù)偵破案件和人工智能在游戲領域的應用兩個學習任務。本任務旨在使學生了解算力、算法和數(shù)據(jù)三大人工智能關鍵技術支撐,以及人工智能在農業(yè)領域、工業(yè)領域、服務業(yè)的應用,并自主探究其在案件偵破活動和游戲領域的應用。學習導圖活動一

探究人工智能的技術支撐人工智能三大技術支撐包括算力、算法和數(shù)據(jù)。算力被視為支撐人工智能走向應用的“發(fā)動機”,芯片、加速計算、服務器等軟硬件技術和產品的完整系統(tǒng)提供超強算力,幫助算法快速運算出結果。數(shù)據(jù)作為大數(shù)據(jù)時代的基石,為人工智能的實際應用提供“燃料”。算法是人工智能落地的“承載體”,其復雜度不斷加深,解決問題的能力以及服務的業(yè)務場景也不斷增強。一、算力算力是指計算機進行各種數(shù)學運算和邏輯運算的能力。算力在人工智能的數(shù)據(jù)處理、模型訓練和部署應用等方面起著至關重要的作用。未來,算力技術的不斷發(fā)展和創(chuàng)新,將為人工智能帶來更加廣闊的發(fā)展空間。(1)數(shù)據(jù)處理。算力是處理大規(guī)模數(shù)據(jù)集的重要工具,對數(shù)據(jù)的分類、聚類、特征提取等任務起著至關重要的作用。算力越強大,數(shù)據(jù)處理的速度就越快,從而加速了人工智能模型的訓練和部署。預備知識:算力、算法及數(shù)據(jù)(2)模型訓練。算力是機器學習模型訓練的基礎。在人工智能中,通過大量的數(shù)據(jù)和算力,訓練出具有高度泛化能力的模型,能夠更好地適應各種實際情況。算力的發(fā)展推動了深度學習等領域的難題突破。(3)部署應用。在人工智能的實際應用中,算力發(fā)揮著關鍵作用。通過高效的算力支持,人工智能系統(tǒng)能夠實時地處理各種任務,為用戶提供快速、準確的智能服務。隨著人工智能技術的不斷發(fā)展,對算力的需求也在不斷增加。目前,云計算、邊緣計算等技術成為算力發(fā)展的重要方向,為人工智能提供了更加強大的算力支持。二、算法算法是解決特定問題求解步驟的描述,在計算機中表現(xiàn)為指令的有限序列,并且每條指令表示一個或多個操作。算法具有五個基本特性:輸入、輸出、有窮性、確定性和可行性。(1)輸入、輸出。算法具有零個或多個輸入。對于絕大多數(shù)算法來說,輸入參數(shù)都是必要的。算法至少有一個或多個輸出。算法是一定需要輸出的。(2)有窮性。算法在執(zhí)行有限的步驟之后自動結束,而不會出現(xiàn)無限循環(huán),并且每個步驟在可接受的時間內完成。(3)確定性。算法的每個步驟都有確定的含義,不會出現(xiàn)二義性。算法在一定條件下,只有一條執(zhí)行路徑,相同的輸入只能有唯一的輸出結果。(4)可行性。算法的每一步都必須是可行的,也就是說,每一步都能夠通過執(zhí)行有限次數(shù)完成。算法是人工智能技術的核心之一,是解決問題的重要工具。不同的算法可能適用于不同的問題和場景,需要根據(jù)具體需求選擇合適的算法。三、數(shù)據(jù)數(shù)據(jù)在人工智能中扮演著重要的角色,是機器學習模型的“燃料”。數(shù)據(jù)的質量、數(shù)量和多樣性對機器學習模型的性能和表現(xiàn)有著至關重要的影響。(1)數(shù)據(jù)的質量。數(shù)據(jù)的質量直接關系到機器學習模型的質量和精度。高質量的數(shù)據(jù)能夠提高模型的預測精度和準確性,使模型更好地理解任務并做出正確的決策。為了獲得更好的模型性能,需要收集和清洗大量高質量的數(shù)據(jù)。數(shù)據(jù)清洗和預處理是必要的步驟,因為原始數(shù)據(jù)可能包含噪聲、異常值和缺失值等問題。這些數(shù)據(jù)問題會影響數(shù)據(jù)的可靠性和一致性,進而影響模型的性能。(2)數(shù)據(jù)的數(shù)量。數(shù)據(jù)的數(shù)量是機器學習模型性能的重要因素之一。足夠的數(shù)據(jù)量可以使得模型更好地理解數(shù)據(jù)分布和特征,從而更好地泛化到新數(shù)據(jù)。在訓練過程中,大量的數(shù)據(jù)可以幫助模型更好地識別模式和趨勢,提高模型的穩(wěn)定性和可靠性。為了獲得更好的模型效果,往往需要更多的訓練數(shù)據(jù)來覆蓋更廣泛的情況,以及驗證數(shù)據(jù)來調整超參數(shù)和選擇模型。(3)數(shù)據(jù)的多樣性。數(shù)據(jù)的多樣性是影響機器學習模型性能的重要因素。不同來源、不同特性的數(shù)據(jù)可以增加模型的泛化能力,使其能夠更好地適應不同的場景和任務。同時,不同類型的數(shù)據(jù)也可以提供更全面的信息,幫助模型更好地理解任務和數(shù)據(jù)特征。數(shù)據(jù)的多樣性還可以幫助模型捕捉到更復雜的模式和關系,從而提高模型的準確性和穩(wěn)定性。為了獲得更好的模型效果,需要充分考慮和處理數(shù)據(jù)的相關問題,并不斷更新和優(yōu)化數(shù)據(jù)集。同時,隨著數(shù)據(jù)量的不斷增長和技術的不斷發(fā)展,數(shù)據(jù)管理和處理技術也需要不斷更新和優(yōu)化。在一個復雜的刑事案件中,警察充分利用指紋收集、血液樣本采集以及大數(shù)據(jù)刪選和比對等多種技術手段,來推進案件的偵破工作。(1)在犯罪現(xiàn)場進行詳細的勘查,并特別關注指紋的收集。隨后這些指紋被送到指紋數(shù)據(jù)庫進行比對排查,以尋找可能的嫌疑人。(2)根據(jù)案情需要,對涉案嫌疑人或被告人進行血液樣本采集。通過與數(shù)據(jù)庫中的DNA信息進行比對,可以進一步確認嫌疑人的身份,或者排除某些人的嫌疑。(3)利用大數(shù)據(jù)技術進行嫌疑人的篩選和定位。通過收集和分析大量的數(shù)據(jù),包括人員的行為習慣、特征數(shù)據(jù)等,警察能夠建立起一個復雜的網絡,從而定位到可能的嫌疑人。此外,大數(shù)據(jù)掃黃技術還能夠幫助警察及時發(fā)現(xiàn)和打擊涉黃犯罪活動,有效遏制這類犯罪的發(fā)生。學習任務:利用大數(shù)據(jù)偵破案件活動二

探究人工智能應用的行業(yè)一、人工智能在農業(yè)領域的應用在農業(yè)領域,人工智能的應用正逐漸改變著傳統(tǒng)的農業(yè)生產方式,在提高生產效率和產量的同時也為農民帶來了更多的便利和收益。(1)智能農業(yè)機器人已經成為農業(yè)現(xiàn)代化的重要工具之一。這些機器人可以在農田中自主導航,完成播種、澆水、除草等農業(yè)操作,不需要人類干預。此外,這些機器人還可以通過搜索引擎等方式獲取天氣信息,從而做出更加準確的決策,提高農業(yè)生產效率。(2)人工智能在精準農業(yè)方面也發(fā)揮著重要作用。利用AI技術,可以通過無人機、衛(wèi)星遙感等手段獲取農田信息,再通過大數(shù)據(jù)分析處理,為農田管理提供更加精準的建議和決策支持。(3)在農業(yè)病蟲害防護領域,人工智能也發(fā)揮著越來越重要的作用。通過深度學習等技術,可以訓練出能夠智能識別作物病蟲害的模型,為農民提供更加準確和及時的病蟲害防治方案,減少農作物損失。預備知識:人工智能在農業(yè)、工業(yè)及服務業(yè)的應用二、人工智能在工業(yè)領域的應用在工業(yè)領域,人工智能的應用正在推動工業(yè)生產向智能化、高效化方向邁進,為企業(yè)帶來前所未有的生產力和競爭優(yōu)勢。(1)智能工業(yè)機器人在生產線上的廣泛應用,使得生產流程更加自動化和精準。這些機器人不僅能夠執(zhí)行重復性的任務,還能通過機器視覺等技術實現(xiàn)精確的操作和檢測,提高產品質量和生產效率。同時,它們還可以根據(jù)實時數(shù)據(jù)進行自適應調整,優(yōu)化生產流程,減少浪費和成本。(2)人工智能在數(shù)據(jù)分析與預測方面展現(xiàn)出巨大潛力。通過對工業(yè)設備的實時監(jiān)測和數(shù)據(jù)分析,AI能夠預測設備的故障和維護需求,提前進行預防性維護,減少生產中斷的風險。此外,AI還可以根據(jù)歷史數(shù)據(jù)和市場需求,預測產品的銷量和趨勢,幫助企業(yè)做出更明智的生產計劃和市場策略。(3)在供應鏈管理方面,人工智能也發(fā)揮著關鍵作用。通過智能算法和大數(shù)據(jù)分析,AI能夠優(yōu)化物料采購、庫存管理和物流配送等環(huán)節(jié),提高供應鏈的響應速度和效率。這不僅可以降低庫存成本,還能減少缺貨和滯銷的風險,提升企業(yè)的市場競爭力。(4)在工業(yè)領域,安全是至關重要的。人工智能可以協(xié)助人們實現(xiàn)工廠的安全監(jiān)控,通過視頻和傳感器數(shù)據(jù)分析來檢測異常行為和潛在風險。這有助于人們及時發(fā)現(xiàn)并處理安全隱患,保障員工和設備的安全。(5)人工智能與工業(yè)物聯(lián)網(IndustrialInternetofThings,IIoT)的結合,使得工業(yè)設備、傳感器和系統(tǒng)的連接更加緊密和智能。通過實時收集和分析IIoT數(shù)據(jù),AI可以提供有價值的洞察,幫助企業(yè)優(yōu)化生產流程、提高能源效率,并開發(fā)新的商業(yè)模式和服務。三、人工智能在服務業(yè)領域的應用在服務業(yè)領域,人工智能正在逐步改變傳統(tǒng)的服務模式,提升了服務質量和服務效率,為消費者帶來了更加便捷和舒適的體驗。(1)智能客服系統(tǒng)已成為服務業(yè)的一大亮點。通過自然語言處理技術,這些系統(tǒng)能夠準確理解并回應客戶的各種問題和需求,無論是查詢訂單狀態(tài)、解決服務問題還是提供產品推薦,都能迅速給出專業(yè)而滿意的答復。這極大地減輕了人工客服的工作負擔,同時也提升了客戶的滿意度。(2)個性化推薦服務在服務業(yè)中也得到了廣泛應用。借助人工智能技術,商家可以分析消費者的歷史行為、偏好和需求,從而為他們提供個性化的商品或服務推薦。這不僅提高了消費者的購買意愿,也增加了商家的銷售額。(3)人工智能可以應用于支付環(huán)節(jié),實現(xiàn)快速、安全的支付與結算。例如,通過人臉識別技術,用戶可以在無須攜帶任何支付工具的情況下完成支付;而智能分析系統(tǒng)則可以對支付數(shù)據(jù)進行實時監(jiān)控和分析,確保交易的安全性和合規(guī)性。(4)在餐飲、酒店等行業(yè)中,人工智能也在助力提升服務品質。例如,通過智能點餐系統(tǒng),顧客可以方便快捷地完成點餐和支付;而智能酒店管理系統(tǒng)則可以根據(jù)客人的喜好和需求,自動調整房間溫度、濕度和燈光等環(huán)境參數(shù),為客人提供更為舒適和貼心的住宿體驗。人工智能在游戲領域的應用日益廣泛,極大地提升了游戲體驗并拓展了游戲的可能性。(1)在游戲角色與劇情設計方面,人工智能賦予了游戲角色更加逼真、智能的行為模式。通過深度學習,游戲中的角色可以實時感知并響應玩家的動作和指令,展現(xiàn)出更加自然、生動的互動。同時,AI算法還可以生成豐富的劇情和故事線,使游戲情節(jié)更加跌宕起伏、扣人心弦。(2)在游戲競技方面,人工智能為玩家提供了更加公平、激烈的對戰(zhàn)體驗。通過智能匹配算法,游戲能夠確保玩家與實力相近的對手進行對戰(zhàn),提高了競技的公平性和挑戰(zhàn)性。同時,AI還可以分析玩家的游戲數(shù)據(jù)和策略,提供個性化的建議和指導,幫助玩家提升游戲水平。(3)在游戲開發(fā)中,AI可以協(xié)助開發(fā)者進行場景構建、角色建模等工作,提高了開發(fā)效率和質量。(4)在游戲測試中,AI可以模擬大量玩家的行為和操作,幫助開發(fā)者發(fā)現(xiàn)潛在的問題和漏洞,優(yōu)化了游戲體驗。(5)虛擬現(xiàn)實和增強現(xiàn)實技術結合人工智能為游戲帶來了前所未有的沉浸式體驗。學習任務:探究人工智能在游戲領域的應用任務一

探究數(shù)字圖像識別技術

任務二

探究語音識別技術

任務三

探究深度學習技術

任務四

探究自然語言處理技術

任務一

探究數(shù)字圖像識別技術本任務的兩個活動分別介紹了數(shù)字圖像識別技術及其應用,并在初步了解常用數(shù)字圖像處理軟件的基礎上,安排了Remove.bg軟件的操作任務。本任務旨在使學生了解數(shù)字圖像識別技術在電商購物、農業(yè)、金融、醫(yī)療、娛樂監(jiān)管等領域的應用,以及完成圖像識別在工業(yè)領域應用的小論文。學習導圖活動一

初探數(shù)字圖像識別技術一、數(shù)字圖像識別技術1.數(shù)字圖像處理數(shù)字圖像處理(DigitalImageProcessing,DIP)是對數(shù)字圖像進行處理,識別或提取相關信息且利用計算機對其進行處理。數(shù)字圖像處理的方法包括圖像變換、圖像增強和復原、圖像分割、圖像描述、圖像分類(識別)。(1)圖像變換是在圖像處理過程中將圖像從一種形式轉換為另一種形式的方法。常見的圖像變換包括傅里葉變換、余弦變換、小波變換等。這些變換可以將圖像從空間域轉換到頻率域,或者將圖像從一種尺度轉換到另一種尺度,不僅可減少計算量,而且可獲得更有效的處理。目前新興的小波變換繼承和發(fā)展了短時傅里葉變換局部化的思想,同時又克服了窗口大小不隨頻率變化等缺點,能夠提供一個隨頻率改變的時間-頻率窗口,是進行信號時頻分析和處理的理想工具。預備知識:數(shù)字圖像識別技術及軟件(2)圖像增強和復原的目的是恢復圖像的原始狀態(tài)或者改善圖像的質量。圖像增強是為了改善圖像的視覺效果,增強圖像的整體或局部特性,擴大圖像中不同物體特征之間的差別,抑制不感興趣的特征,以改善圖像質量,豐富信息量,加強圖像判讀和識別效果,滿足某些特殊分析的需要。圖像復原要求對圖像降質的原因有一定的了解,根據(jù)降質過程建立“降質模型”,再采用某種濾波方法,恢復或重建原來的圖像。(3)圖像分割是數(shù)字圖像處理中的關鍵技術之一。圖像分割是將圖像中有意義的特征部分提取出來,包括圖像的邊緣、區(qū)域和空間位置等,這是進一步進行圖像識別、分析和理解的基礎。在灰度圖像的分割中,通常會基于圖像亮度的兩個基本特性:不連續(xù)性和相似性。對于區(qū)域內部的像素,一般會認為它們具有灰度相似性,而對于區(qū)域邊界上的像素,則一般會認為它們具有灰度不連續(xù)性。雖然目前已開發(fā)出許多邊緣提取、區(qū)域分割的方法,但并未有一種普遍適用于各類圖像分割的有效方法。因此,對圖像分割的研究方案仍需不斷優(yōu)化,這也是目前數(shù)字圖像處理研究的關鍵領域之一。(4)圖像描述是圖像識別和理解的必要前提。圖像描述是指使用文字來描述給定的圖像內容,以幫助人們更好地理解圖像中的信息。圖像描述通常分為兩大類:基于區(qū)域的方法和基于全圖的方法。隨著數(shù)字圖像處理研究的深入發(fā)展,已經開始進行三維物體描述的研究,描述方法涵蓋體積、表面、廣義圓柱體等。(5)圖像分類(識別)屬于模式識別的范疇。圖像經過某些預處理(增強、復原、壓縮)后,進行分割和特征提取,從而進行判決分類。圖像分類的應用非常廣泛,包括但不限于人臉識別、物體檢測、場景分類、圖像語義分割等。2.數(shù)字圖像處理技術的起源與發(fā)展數(shù)字圖像處理技術作為一門智能類學科,起源于20世紀60年代初期。早期的數(shù)字圖像處理主要是改善圖像的識別清晰度,增強視覺效果。自1964年起,美國噴氣推進實驗室對航天探測器“徘徊者7號”由月球發(fā)回的幾千張照片進行了數(shù)字圖像處理技術,并且分析了太陽位置與月球環(huán)境的相互影響,經過計算機處理成功勾勒出月球表面的全景地圖,而后通過數(shù)字圖像處理技術處理了近十萬張?zhí)綔y飛船傳回的照片,從而獲得了月球的地形圖、彩色圖及全景鑲嵌圖,為人類成功登月奠定了寶貴的基礎,不僅如此,其對推動數(shù)字圖像處理這門學科的發(fā)展也起到了積極作用。1972年,英國EMI公司工程師Hous?eld發(fā)明了一款用于頭顱疾病診斷的X射線計算機斷層攝影裝置(X-rayComputedTomography,CT);1975年EMI公司又成功研制出全身用的CT裝置,獲得了人體各個部位鮮明清晰的斷層圖像。這項無損傷診療技術為人類健康生活發(fā)展作出了不菲的貢獻。20世紀70年代中期,隨著計算機技術、信號處理技術、傳感器技術、人工智能等先進智能技術的飛快發(fā)展,數(shù)字圖像處理技術涉及的領域更高,延伸的范圍更廣,收獲了寶貴的實際經驗以及驚人的社會經濟效益。人們開始探討研究計算機解釋圖像的具體施行計劃,通過模擬人類視覺系統(tǒng)感知外部世界。眾多國家,尤其是先進發(fā)達國家為了開展這項研究投入了巨大的人力、物力,取得了顯著的研究成果。其中有代表性的成果就是70年代末MIT的Marr提出的視覺計算理論,這個理論為今天的計算機視覺領域發(fā)展奠基了基石。3.數(shù)字圖像識別系統(tǒng)數(shù)字圖像識別系統(tǒng)一般是由數(shù)字圖像獲取、數(shù)字圖像預處理、數(shù)字圖像特征提取、數(shù)字圖像識別等環(huán)節(jié)構成的,如圖2-1所示。4.數(shù)字圖像識別技術的作用隨著科技創(chuàng)新以及智能化技術、設備的不斷進步,數(shù)字圖像識別技術的應用領域逐步普及于各個行業(yè)之中,重點表現(xiàn)為以下幾個方面:(1)在人工智能領域,通過圖像識別技術可以提高圖片處理的精度與速度,在生產作業(yè)中更加準確與高效。(2)在農業(yè)領域,通過圖像識別技術可以更好地把握農作物的生長狀況。(3)在工業(yè)領域,圖像識別技術可以很好地針對不同種類產品進行分類,提高企業(yè)的生產效率,降低人力成本。(4)在公安安防領域,圖像識別技術可以通過人臉識別鎖定嫌疑人,維護社會治安。二、數(shù)字圖像識別軟件常見的具有數(shù)字圖像識別功能的軟件主要有Remove.bg、掃描全能王、PRomeAI。1.Remove.bgRemove.bg是一款先進的基于人工智能的在線服務,它只需幾秒鐘就能從圖片中精準定位背景,簡單高效地去除圖片背景。它支持的格式主要有PNG與JPG格式,并能夠處理Mpx格式的圖片,對于白色背景的圖片,通過去除自定義背景功能,可以去除任何復雜背景。此外,Remove.bg還具備5s極速摳圖的功能,可100%實現(xiàn)人像摳圖或旅游照摳圖。2.掃描全能王掃描全能王是一款手機掃描軟件,它可以將紙質文檔轉換為數(shù)字文件,方便用戶進行保存、分享和管理。該軟件支持多種格式的文件輸出,包括PDF、JPEG、PNG等,并且可以進行加密和權限控制,確保文檔的安全性。除了基本的掃描功能,掃描全能王還提供了多種附加功能,可以滿足用戶在不同場景下的需求。此外,該軟件還支持多設備同步和備份,可以輕松實現(xiàn)跨設備的工作協(xié)同。3.PRomeAI隨著人工智能技術的不斷發(fā)展,智能圖像處理已經成為了當下最熱門的技術之一。PRomeAI作為智能圖像處理領域的一款新興產品,以其強大的功能和易于使用的界面,迅速成為了大眾喜愛的工具之一。PRomeAI擁有強大的人工智能驅動設計助手和廣泛可控的AIGC(C-AIGC)模型風格庫,能夠輕松地創(chuàng)造出令人驚嘆的圖形、視頻和動畫。無論是經驗豐富的設計師還是初學者,PRomeAI可以將用戶的想象力變?yōu)楝F(xiàn)實。PRomeAI是建筑師、室內設計師、產品設計師和游戲動漫設計師的必備工具。使用Remove.bg軟件更換圖片背景,具體操作步驟如下:(1)打開瀏覽器,輸入https://www.remove.bg/zh/upload網址,進入Remove.bg主界面,如圖2-2所示。操作任務:Remove.bg軟件的使用(2)進入Remove.bg主界面后,單擊“Uploadimage”按鈕,進入上傳圖片的頁面,如圖2-3所示。(3)單擊“上傳圖片”按鈕,進入圖片選擇頁面,選擇需要去除背景的圖片。傳圖片后自動生成摳圖效果,如圖2-5所示。(4)單擊“下載”按鈕,下載常規(guī)圖片。如果要下載高清圖片,則單擊“下載高清版”按鈕。(5)在右邊的“背景”選項卡中單擊選擇需要的背景,導入背景,就可出現(xiàn)背景選取畫面,如圖2-6所示。(6)如果對更換的背景不滿意,則可以單擊“擦除”按鈕,根據(jù)設計需求調整最終的圖片效果?;顒佣?/p>

初探智能數(shù)字圖像識別技術的應用隨著人類社會的發(fā)展和智能技術的不斷革新,智能數(shù)字圖像識別技術已經在眾多領域展現(xiàn)出強大的實力和廣泛的應用前景,每天有成千上萬的企業(yè)與數(shù)百萬的消費者都在使用這項技術。一、電商購物應用網購時,消費者通過對圖像的識別對所需商品進行搜索。當消費者將鼠標點擊某個感興趣的商品上時,就可以查找到與其相似的款式;同時通過調整算法,還能猜測消費者的需求。當然,搜索結果并不是萬能的,特定條件下存在著不能提供完全匹配商品的可能性。盡管如此,搜索仍然會為消費者推薦最為接近的商品,盡可能滿足消費者的購物需求。這對于商家來說也是一種特定的引流方式,對于增加移動端用戶黏度起到極為重要的作用。二、農業(yè)應用在農業(yè)領域,農業(yè)的生產模式已經從傳統(tǒng)農耕方式轉化為了精細化的農業(yè)作業(yè)模式,利用動態(tài)圖像處理技術可以進行農藥噴灑與變量化施肥。在農藥噴灑與施肥的實施過程中,需要對農作預備知識:智能數(shù)字圖像識別技術應用概述物及雜草圖像進行分析和處理,通過對種植區(qū)域的圖像進行分析和處理,可以得出土壤濕度、養(yǎng)分分布等信息,幫助農民制訂更加科學的種植計劃,提高種植效率和產量。這也符合國家提出的使用農藥和化肥的高效無污染要求。三、金融應用在金融領域,圖像處理技術可以幫助金融機構更準確地識別和驗證用戶的身份信息。如今,通過人臉識別技術,對客戶的照片和視頻資料進行圖像識別和處理,提取出客戶的特征和行為信息,并利用這些信息對客戶進行分類、分析和預測,以制訂更加精準的營銷策略和服務方案。四、醫(yī)療應用在醫(yī)療健康被極度重視的當下,越來越多的醫(yī)療設備結合圖像處理技術,如醫(yī)學影像分析,可以對醫(yī)學影像進行各種處理和分析,幫助醫(yī)生更好地診斷疾病和制訂治療方案。不僅如此,圖像處理技術可以用于病理分析,幫助醫(yī)生對病理切片進行數(shù)字化處理和分析,提高病理診斷的準確性和效率。五、娛樂監(jiān)管應用以視頻直播為例,直播內容的審查鑒定可以從以下幾個方面展開:(1)識別圖像中是否存在人物體征,并統(tǒng)計人數(shù);識別圖像中人物的性別、年齡區(qū)間。(2)識別人物的膚色、肢體器官暴露程度,以及人物的肢體輪廓,分析動作行為。除圖像識別之外,還可以從音頻信息中提取關鍵特征,判斷是否存在敏感信息;通過實時分析彈幕文本內容,可判斷當前視頻是否存在違規(guī)行為,并動態(tài)調節(jié)圖像采集頻率。查詢圖像識別在工業(yè)領域的應用后,完成一篇小論文,具體步驟如下:(1)打開任意瀏覽器,輸入百度網址,進入百度搜索引擎主界面。(2)在搜索框中輸入“圖像識別在工業(yè)領域的應用”,單擊“百度一下”按鈕或按“Enter”按鍵。(3)單擊搜索框下面的“視頻”選項,關于圖像識別在工業(yè)領域的應用的視頻出現(xiàn)在頁面中,如圖2-10所示。點擊觀看3~5個視頻。操作任務:圖像識別在工業(yè)領域的應用(4)截取相應的片段圖片,根據(jù)自己的理解完成一篇800~1000字的小論文。(5)尋找1~2款圖像識別軟件,并進行應用描述。任務二

探究語音識別技術本任務的兩個活動分別介紹了語音識別技術及其應用,并在了解語音識別軟件的基礎上,安排了體驗手機語音識別系統(tǒng)和平臺兩個操作任務。本任務旨在使學生了解語音識別技術在語音智能教育、語音機器翻譯、智能家居和無人駕駛技術等領域的應用,以及掌握語音識別系統(tǒng)和語音識別平臺的簡單操作。學習導圖活動一

初探語音識別技術一、語音識別技術概述1.語音識別技術語音識別技術是一種讓機器通過分析和理解語音信號來識別、轉換或輸出人類口述語言的技術。它涉及多個學科領域,包括信號處理、人工智能、自然語言處理等,旨在實現(xiàn)語音到文本的轉換或文本到語音的合成,從而幫助機器理解人類的語言并實現(xiàn)人機交互。其主要任務是在處理語音信號的基礎上,通過模式識別技術對語音特征進行提取,進而識別出人類口述的語言,實現(xiàn)文字的轉換。語音識別的方法包括基于聲道模型和語音知識、模板匹配、利用人工神經網絡。預備知識:語音識別技術及軟件2.語音識別技術的起源發(fā)展20世紀50年代,語音識別技術的研究工作主要是基于模板匹配的方法,即將語音信號與預先錄制的模板進行匹配。然而,這種方法受限于存儲和模板匹配的準確性,無法適應復雜的語音場景。從20世紀60年代開始,基于統(tǒng)計建模的方法開始在語音識別中得到廣泛應用。其中,隱馬爾可夫模型(HMM)成為主流方法。該模型通過建立聲學模型和語言模型,實現(xiàn)對連續(xù)語音的識別。統(tǒng)計建模方法可顯著提高語音識別的準確性和魯棒性。從20世紀70年代到90年代,基于聲道模型和語音知識的方法也得到了發(fā)展。這種方法利用語音學和聲學知識建立聲道模型和語音知識庫,通過分析語音信號的頻譜特征、時域特征等,識別出語音信號中所包含的音素或單詞。目前,語音識別技術已經得到了廣泛應用,如智能手機、智能家居、自動駕駛等。隨著科學技術的不斷進步和應用場景的不斷擴展,語音識別技術將繼續(xù)發(fā)揮重要作用,為人們的生活帶來更多的便利和智能化。3.語音識別系統(tǒng)在語音識別系統(tǒng)中,我們需要經歷四個主要的階段:預處理、特征提取、聲學模型訓練和后處理。(1)預處理是語音識別的第一步,它的主要目以去除背景噪聲,使音量正?;⑦^濾掉無關的聲音,以提高語音識別系統(tǒng)的準確性。通過這些處理,可以減少背景噪聲、確定語音的起始點和結束點,以便更準確地提取語音信號的特征。(2)特征提取是指從語音信號中提取出具有代表性的特征,通過特征提取音頻輸入被轉換為一組代表語音信號的特征,這些特征通常被稱為聲學特征。特征提取的主要方法包括線性預測編碼(LPC)、梅爾頻率倒譜系數(shù)(MFCCS)等。(3)聲學模型訓練是指使用特征提取出來的特征向量來訓練聲學模型。聲學模型是語音識別的核心,它用于預測輸入的聲學特征對應的文字,將輸入特征映射到語音單位,如音素或子音素單位。聲學模型是在大量標記過的語音數(shù)據(jù)上訓練的,這些數(shù)據(jù)包括音頻輸入和其相應的轉錄。聲學模型可以學習到從聲音到文字的映射關系,從而實現(xiàn)語音識別。(4)解碼也被稱為后處理。聲學模型和語言模型的綜合輸出被用來為輸入的語音生成一個可能的單詞序列或假設的列表。語音識別是一種復雜的人工智能技術,通過不斷地研究和改進,我們可以提高語音識別的準確性和效率,從而為人們帶來更加智能化的語音交互體驗。4.語音識別技術的作用隨著科技創(chuàng)新以及智能化技術、設備的不斷進步,語音識別技術的應用領域逐步普及于各個行業(yè)之中,重點表現(xiàn)為以下幾個方面:(1)提高工作效率。通過語音識別技術,用戶可以無須動手輸入文字信息,可快速地將語音轉化為文字,大大提高了工作效率。(2)方便快捷的輸入方式。對于那些視覺或運動功能受限的人來說,語音識別技術提供了更為方便快捷的輸入方式,增強了他們使用電子設備的能力。(3)實現(xiàn)多語言翻譯。語音識別技術可以應用于翻譯領域,將一種語言的語音轉化為另一種語言的語音,為跨語言交流提供了便利。(4)智能家居控制。通過語音識別技術,用戶可以在不接觸家居設備的情況下,通過語音指令控制家居設備的開關、溫度、濕度等,方便了生活。(5)智能客服。在電商、服務等行業(yè)中,通過語音識別技術,用戶可以與智能客服進行語音對話,獲取信息并解決問題等,提高了服務效率和質量。二、語音識別軟件具有語音識別功能的軟件有蘋果公司的Siri、小米的小愛、百度的百度語音助手等。1.SiriSiri是蘋果公司開發(fā)的語音助手,利用Siri用戶可以通過手機查找信息、撥打電話、發(fā)送信息、獲取路線、播放音樂、查找蘋果設備等。Siri使用自然語言處理技術,使其可以支持自然語言輸入,甚至可以回答用戶的提問,并且可以執(zhí)行一些基于文本的任務。Siri可以幫助用戶發(fā)送短信、管理日程、進行語音備忘等。Siri也可以與其他蘋果設備無縫集成,如iPad、Mac等設備。Siri語音助手不僅可以在iPhone手機上使用,也可以在iPad、iPodTouch、Mac等蘋果設備上使用。Siri語音助手是蘋果設備中比較受歡迎的輔助功能之一,可以幫助用戶更方便地使用設備,同時也可以提高用戶的工作效率和生活質量。2.小愛同學小愛同學是小米旗下的人工智能語音交互引擎、智聯(lián)萬物的AI虛擬助理,作用就是通過簡單的語音指令控制手機系統(tǒng)上的功能。它利用云計算,通過互聯(lián)網提供隨時隨地的人工智能服務,包括但不限于語言翻譯、文字識別、語音識別、圖像識別、信息推薦等。用戶可以通過語音與小愛同學進行交流,如查詢天氣、播放音樂、發(fā)送短信等。同時,小愛同學還具備連續(xù)對話、全局對話、多模態(tài)交互等能力,可與智能家居設備進行連接,實現(xiàn)智能家居控制等功能??偟膩碚f,小愛同學的出現(xiàn)極大地便利了人們的生活,使人們能夠更方便地獲取信息、控制設備等。3.百度語音助手百度語音助手是一款基于百度強大的語音識別技術和人工智能技術的智能語音助手軟件。它可以幫助用戶通過語音指令快速發(fā)起搜索,查詢信息、發(fā)送短信、播放音樂、查詢天氣等,讓用戶的生活更加便捷、高效。此外,它還具有連續(xù)對話、全局對話、多模態(tài)交互等能力,可與智能家居設備進行連接,實現(xiàn)智能家居控制等功能。同時,它還支持多種語言輸入和翻譯功能,讓用戶可以更加方便地進行跨語言交流。百度語音助手采用了業(yè)界領先的語音識別技術,具有高準確率、低誤識率、高遠場喚醒率等特點,讓用戶可以更加自然、流暢地使用各種功能。同時,它還結合了百度強大的搜索引擎技術,可以為用戶提供更加精準、全面的搜索結果。在手機應用商店中搜索“訊飛聽見”,找到“訊飛聽見”APP,下載并安裝后,按照以下步驟體驗手機語音識別。(1)打開手機,在手機頁面點擊“訊飛聽見”圖標,進入主頁面。(2)在主頁面點擊“登錄”選項,進入“登錄”頁面,如圖2-13所示。(3)上述操作完成后會出現(xiàn)如圖2-14所示的界面,輸入賬號和密碼即可進入APP。(4)在APP內部界面中,點擊右下方的“話筒”按鈕,如圖2-15所示。(5)使用語音表達讀取一段文字,感受語音識別的準確性,并作簡要記錄,如圖2-16所示。操作任務:體驗“訊飛聽見”語音識別系統(tǒng)活動二

初探語音識別技術的應用語音識別技術發(fā)展到今天,已經取得了顯著的進步,并且識別率高達98%以上,對特定人語音識別系統(tǒng)的識別精度則更高。通過本任務的學習,學生能明確語音識別技術的相關應用領域,為將來的就業(yè)打下堅實的基礎。一、語音智能交互語音智能交互是指基于語音識別、語音合成、自然語言理解等技術,實現(xiàn)機器對人類語音指令的理解與執(zhí)行,從而完成特定任務的人機交互方式。它賦予了機器“能聽、會說、懂你”式的智能人機交互體驗,讓用戶可以更自然、便捷地與機器進行交互,也可以幫助用戶通過語音指令完成各種操作,如查詢信息、發(fā)送信息、控制智能家居設備等,從而提高使用效率和生活品質。二、語音機器翻譯語音機器翻譯(VoiceMachineTranslation,VMT)是利用語音識別技術和機器翻譯技術實現(xiàn)語音翻譯的智能系統(tǒng)。它可以將人類語音轉換為文本,然后通過機器翻譯技術將文本轉換為目標語言,預備知識:語音識別技術應用概述最終輸出目標語言的翻譯結果。目前,語音機器翻譯已經在眾多領域得到應用,如旅游、商務會議、文化交流等。在旅游中,用戶可以通過語音機器翻譯實現(xiàn)不同語言之間的溝通交流;在商務會議中,用戶可以通過語音機器翻譯實時獲取同聲傳譯的翻譯結果;在文化交流中,用戶可以通過語音機器翻譯了解不同國家的文化習俗和風土人情。三、智能家居和無人駕駛技術智能家居和無人駕駛技術是當前科技領域中備受關注的兩個領域,它們的發(fā)展將帶來人類生活方式的巨大改變,同時也將對社會和經濟產生深遠的影響。智能家居技術主要通過智能設備、傳感器、控制器等實現(xiàn)家居設備的自動化控制,提高家居的安全性、舒適性和便利性。智能家居技術包括智能照明、智能安防、智能家電、智能窗簾、智能音響等,用戶可以通過手機、平板電腦、遙控器等設備對家居進行遠程控制、定時控制、場景設置等操作。無人駕駛技術則主要通過傳感器、控制器、執(zhí)行器等實現(xiàn)車輛的自動化駕駛,提高車輛的安全性、舒適性和效率。無人駕駛技術包括車輛定位、路徑規(guī)劃、決策控制等,用戶可以通過遠程控制、車載控制系統(tǒng)等對車輛進行控制和監(jiān)控。訊飛智能翻譯平臺的語音翻譯操作步驟如下:(1)輸入網址/,進入訊飛開放平臺主界面,如圖2-17所示。操作任務:體驗訊飛智能翻譯平臺(2)進入訊飛開放平臺網站之后,點擊“登錄/注冊”,輸入登錄信息,進入“訊飛星火認知大模型”。(3)通過瀏覽當前頁面,熟悉“能力星云”的用途及優(yōu)點,如圖2-19所示。(4)通過下拉當前頁面,學習“能力星云”的具體應用領域及相關產品,如圖2-20所示。(5)將界面下拉至底部,出現(xiàn)“智能翻譯”選擇欄,進入“智能翻譯”體驗語音識別模塊,如圖2-21所示。(6)按住中間語音按鈕,敘述一段話,感受語音翻譯的效果,如圖2-22所示。任務三

探究深度學習技術本任務的兩個活動分別介紹了深度學習技術及其應用,并安排了體驗百度飛槳深度學

習平臺和淘寶物體識別應用兩個操作任務。本任務旨在使學生了解深度學習技術、深度學

習系統(tǒng)和深度學習平臺,以及深度學習技術在目標檢測、虛擬游戲和機器人中的應用,掌

握百度飛槳和淘寶物體識別的簡單操作。學習導圖活動一

初探深度學習技術一、深度學習技術深度學習(DeepLearning,DL)是一種機器學習技術,起源于人工神經網絡的研究,通過構建多層次的神經網絡模型,自動學習數(shù)據(jù)中的內在規(guī)律和表示層次,從而實現(xiàn)對復

雜數(shù)據(jù)的理解和分析。這類似于自然界中生物神經大腦的運行機理,多層組織相互連接在

一起,進行精準復雜的處理。1.深度學習的內容深度學習的內容包括卷積神經網絡、循環(huán)神經網絡、長短期記憶網絡、生成對抗網絡、強化學習。(1)卷積神經網絡:一種專門用來處理具有類似網格結構的數(shù)據(jù)的神經網絡,如圖像和語音信號等。卷積神經網絡具有表征學習能力,能夠按其階層結構對輸入信息進行平移

不變分類,因此也被稱為“平移不變人工神經網絡”。卷積神經網絡由輸入層、卷積層、

池化層和全連接層組成。預備知識:深度學習技術及平臺輸入層用于接收原始數(shù)據(jù),卷積層通過卷積運算捕捉局部特征,

池化層對特征進行降維,全連接層則用于最終的分類或回歸任務。卷積神經網絡在諸多應

用領域都表現(xiàn)優(yōu)異,尤其在計算機視覺和自然語言處理領域。(2)循環(huán)神經網絡(RNN):一種以序列數(shù)據(jù)為輸入,在序列的演進方向進行遞歸且所

有節(jié)點按鏈式連接的遞歸神經網絡。RNN具有記憶性,其不僅考慮前一時刻的輸入,而

且賦予了網絡對前面內容的一種記憶功能。因此,RNN在當前時刻的輸出與前面的輸出

有關。在處理序列數(shù)據(jù)時,RNN可以捕捉序列中的時間依賴關系,適用于自然語言處理、

語音識別、時間序列預報等任務。RNN是一種特殊類型的神經網絡結構,它根據(jù)人的認

知是基于過往的經驗和記憶這一觀點提出。(3)長短期記憶網絡(LSTM):一種特殊類型的循環(huán)神經網絡,專門用于解決傳統(tǒng)RNN存在的長期依賴問題。LSTM通過引入記憶單元來解決RNN的梯度消失問題,能夠在處理長序列數(shù)據(jù)時有效地捕捉長期依賴關系。LSTM網絡結構中包含一個或多個記憶單元,這些單元負責存儲和更新網絡的狀態(tài)信息。LSTM的核心思想是將當前時刻的輸入與過去的記憶結合起來,從而更好地捕捉序列中的長期依賴關系。它通過引入三個門(遺忘門、輸入門和輸出門)來控制信息的流動和記憶的更新。(4)生成對抗網絡(GAN):一種深度學習模型,由一個生成器和一個判別器組成。生成器負責學習真實數(shù)據(jù)的分布并生成新的數(shù)據(jù),而判別器則負責判斷輸入數(shù)據(jù)是否來自真實數(shù)據(jù)分布。在訓練過程中,生成器和判別器會進行對抗性訓練,直到生成器能夠生成足以“欺騙”判別器的數(shù)據(jù)。GAN在許多領域都取得了突破性進展,尤其在計算機視覺領域,如圖像生成、圖像分割、風格遷移等。GAN的工作原理可以視作一個二人零和博弈問題,隨著時間的推移,生成器和判別器不斷地進行對抗,最終達到一個動態(tài)平衡:生成器生成的圖像接近于真實圖像分布,而判別器則無法區(qū)分真實圖像和生成圖像。(5)強化學習:強化學習主要是關注如何基于環(huán)境的反饋來選擇或優(yōu)化行為的問題,以在多步決策的情況下達到最終的目標。在強化學習中,智能體不斷地與環(huán)境進行交互,通過在環(huán)境中采取行動,并從環(huán)境中獲得狀態(tài)和獎勵的反饋,不斷更新其策略,從而最大化長期累積獎勵。其中,策略定義了在給定狀態(tài)下應采取的行動。2.深度學習技術的起源與發(fā)展20世紀40年代,心理學家麥卡洛克和數(shù)學邏輯學家皮茲發(fā)表了論文《神經活動中內在思想的邏輯演算》,提出了MP模型。這是第一個基于模擬神經元的結構和工作原理的數(shù)學模型,標志著人工神經網絡的誕生。20世紀80年代,感知機算法和BP算法等經典算法被提出。這些算法可以自動提取特征,降低了人工神經網絡的復雜度和難度。21世紀初,深度神經網絡(DNN)的出現(xiàn)使得深度學習得到了更廣泛的應用。DNN可以自動提取輸入數(shù)據(jù)的特征,使得分類和識別的準確率大大提高。近10年來,深度學習技術得到了飛速發(fā)展,尤其是卷積神經網絡(CNN)和循環(huán)神經網絡(RNN)被廣泛應用。CNN在圖像處理和計算機視覺領域取得了突破性進展,而RNN則廣泛應用于自然語言處理和語音識別等領域。目前,深度學習已成為人工智能領域的重要支柱,廣泛應用于圖像識別、語音識別、自然語言處理、推薦系統(tǒng)等領域。同時,深度學習技術也面臨著一些挑戰(zhàn),如數(shù)據(jù)質量和數(shù)量不足、模型復雜度較高和計算資源有限等問題。未來的研究將不斷探索新的深度學習技術和應用領域,以推動人工智能技術向前發(fā)展。二、深度學習系統(tǒng)深度學習系統(tǒng)包括數(shù)據(jù)收集和預處理、模型構建、模型訓練、模型評估、模型優(yōu)化、模型應用。1.數(shù)據(jù)收集和預處理數(shù)據(jù)收集和預處理是深度學習流程中的第一步,也是非常重要的一步。數(shù)據(jù)收集主要是通過各種方式獲取相關數(shù)據(jù),而數(shù)據(jù)預處理則是對收集到的數(shù)據(jù)進行清洗、集成、變換和規(guī)約等操作,便于后續(xù)進行模型訓練和應用。在數(shù)據(jù)收集方面,常見的方式包括從公開數(shù)據(jù)庫或數(shù)據(jù)集網站上下載數(shù)據(jù)、通過爬蟲程序從互聯(lián)網上抓取數(shù)據(jù)、從現(xiàn)有應用程序或傳感器中導出數(shù)據(jù)等。根據(jù)具體需要,可以選擇不同的方式來收集數(shù)據(jù)。2.模型構建模型構建可以通俗地理解為使用數(shù)學模型或計算機模型來模擬現(xiàn)實世界中的某種現(xiàn)象或過程。在這個過程中,人們需要選擇合適的模型類型和參數(shù),并建立模型方程來描述數(shù)據(jù)之間的關系。模型構建可以幫助人們更好地理解現(xiàn)實世界中的問題,預測未來的趨勢,并制定更好的決策。3.模型訓練模型訓練指的是利用特定的算法和數(shù)據(jù),使計算機學習并生成一個可以解決特定問題的模型。4.模型評估模型評估就是對模型的性能進行評估,也就是評估我們的模型在解決實際問題時的表現(xiàn)。我們可以利用具體的性能評價標準來評估模型,例如在分類任務中使用準確率,在回歸任務中使用均方根誤差等指標。除此之外,我們還要考慮模型的泛化能力,即模型是否能處理未見過的數(shù)據(jù)。5.模型優(yōu)化模型優(yōu)化通常包括兩個方面的內容:模型本身參數(shù)的優(yōu)化和模型結構的優(yōu)化。參數(shù)優(yōu)化通常是指通過梯度下降等優(yōu)化算法來調整模型中的參數(shù),以最小化損失函數(shù)。結構優(yōu)化通常是指通過添加或減少網絡層、改變網絡結構等方式來調整模型,以提高模型的泛化能力和性能。6.模型應用模型應用可以理解為將訓練好的模型應用到實際的問題中,以解決實際問題。三、深度學習平臺深度學習平臺有TensorFlow、PyTorch、百度飛槳等。1.TensorFlowTensorFlow是一個開源的深度學習框架,由Google開發(fā)并維護。它支持多種語言,包括Python和JavaScript,并可用于構建和訓練各種類型的神經網絡模型,包括卷積神經網絡、循環(huán)神經網絡等。TensorFlow擁有多層級結構,可部署于各類服務器、PC終端和網頁并支持GPU和TPU高性能數(shù)值計算,被廣泛應用于谷歌內部的產品開發(fā)和各領域的科學研究。2.PyTorchPyTorch是一個由Facebook開源的Python機器學習庫,專門針對GPU加速的深度神經網絡(DNN)編程。它既可以看作是加入了GPU支持的數(shù)據(jù)庫Numpy,也可以看作是一個擁有自動求導功能的強大的深度神經網絡。與TensorFlow的靜態(tài)計算圖不同,PyTorch的計算圖是動態(tài)的,可以根據(jù)計算需要實時改變計算圖。它被廣泛應用于自然語言處理、計算機視覺等領域。PyTorch的設計追求最少的封裝,盡量避免重復勞動。3.百度飛槳百度飛槳(PaddlePaddle)是百度自主研發(fā)的產業(yè)級深度學習平臺,集深度學習核心訓練和推理框架、基礎模型庫、端到端開發(fā)套件及豐富的工具組件于一體。百度飛槳作為中國首個自主研發(fā)、功能完備、開源開放的產業(yè)級深度學習平臺,覆蓋了自然語言處理、計算機視覺、推薦和語音等熱門領域,提供了豐富的模型庫及開發(fā)套件百度飛槳具有四大領先技術,包括開發(fā)便捷的深度學習框架、超大規(guī)模深度學習模型訓練技術、多端多平臺部署的高性能推理引擎以及產業(yè)級開源模型庫。使用百度飛槳平臺進行波士頓房價預測的步驟如下:(1)輸入百度飛槳網址/,進入百度飛槳平臺主界面,如圖2-23所示。操作任務:體驗百度飛槳深度學習平臺(2)點擊“AIStudio”進入相應界面,并點擊“登錄”按鈕完成賬號登錄。(3)點擊上方工具欄中的“課程”按鈕,進入課程學習界面,如圖2-25所示。(4)點擊“我的課程”按鈕,進入我的課程學習界面,查看“我參加的課程”,如圖2-26所示。(5)點擊右側“AI學習地圖”按鈕,進入AI學習地圖界面,如圖2-27所示。(6)選擇“快速入門”模塊中的“快速上手深度學習”,學習“深度學習”內容,如圖2-28所示。(7)進入深度學習界面后,點擊“項目PaddlePaddle快速入門”,如圖2-29所示。(8)進入“項目PaddlePaddle快速入門”之后,選擇運行環(huán)境,點擊“啟動環(huán)境”,選擇“基礎版”運行,點擊“確定”按鈕,如圖2-30所示。(9)“啟動環(huán)境”成功之后,彈出成功提示,點擊“進入”,進入“PaddlePaddle模塊”入門學習,如圖2-31所示。(10)點擊代碼左側的“三角形”符號,嘗試運行環(huán)境,如圖2-32所示。(11)同上所述,按照指令點擊后續(xù)代碼左側的“三角形”符號,運行至最后一步,便可生成項目波士頓房價預測模型,如圖2-33所示。活動二

初探深度學習技術的應用深度學習技術能夠進行圖像識別、語音識別、自然語言處理、數(shù)據(jù)挖掘、機器翻譯,在處理復雜數(shù)據(jù)和提取特征方面具有強大的能力。下面主要介紹深度學習技術在目標檢測、虛擬游戲和機器人三個領域的應用。一、目標檢測目標檢測就是通過深度學習網絡的訓練和學習來實現(xiàn)對圖像中目標位置和類別的檢測。目標檢測算法通常采用類似卷積神經網絡(CNN)的深度學習模型,通過對大量標注數(shù)據(jù)進行訓練和學習,使得模型能夠自動提取圖像中的特征(見圖2-34)并分類出圖像中的不同目標。目標檢測算法的關鍵點包括目標區(qū)域的選擇、特征提取、分類和位置精度的調整等。在訓練過程中,目標檢測算法需要大量的標注數(shù)據(jù),包括正樣本(含有目標的圖像)和負樣本(不含有目標的圖像)。通過對比正樣本和負樣本的特征差異,算法可以學習到如何區(qū)分目標和背景。此外,為了減少過擬合現(xiàn)象、提高模型的泛化能力,通常還需要對模型進行正則化處理。在應用過程中,目標檢測算法可以對任意圖像進預備知識:深度學習技術的應用行目標檢測,包括但不限于人臉、車輛、物體等。通過對不同類別的目標進行分類和定位,目標檢測算法可以廣泛應用于安全監(jiān)控、智能駕駛、人機交互等領域。二、虛擬游戲在虛擬游戲中,機器可以通過自我模擬、自我訓練、自我測試,讓其在一定游戲規(guī)則下學習到好的戰(zhàn)勝策略。在虛擬游戲中,機器可以模擬游戲場景,并通過自我訓練來學習如何進行決策和行動。機器會根據(jù)游戲規(guī)則和獎勵機制進行試錯,不斷調整自己的策略,以期獲得更好的結果。通過自我測試,機器可以評估自己的策略的有效性,并根據(jù)測試結果進行進一步的學習和優(yōu)化。三、機器人借助深度學習的力量,機器人可以在真實復雜的環(huán)境中工作,深度學習技術可以幫助機器人感知周圍環(huán)境,理解任務并做出相應的決策。通過訓練深度神經網絡,機器人可以識別和理解周圍的物體和場景,例如識別行人、車輛和障礙物等。這種視覺感知能力可以幫助機器人在復雜的環(huán)境中安全地導航和操作。此外,深度學習技術還可以用于機器人的決策和行為預測。通過分析大量的數(shù)據(jù)和案例,深度學習模型可以學習到不同情境下的最佳決策和行為模式。在淘寶APP中進行物品識別的步驟如下:(1)打開淘寶APP,進入淘寶主頁面(2)點擊搜索欄中的“拍照”按鈕進入拍照功能,隨機選擇一個物品進行拍照識別。本例中對空調遙控器進行拍照,此時淘寶APP會對物品進行特征識別,如圖2-37所示。(3)識別成功后,淘寶界面會出現(xiàn)與識別物品相同或相似類型的商品,如圖2-38所示。在結果中選擇符合要求的商品即可進行后續(xù)的購買操作。操作任務:體驗淘寶物體識別應用任務四

探究自然語言處理技術本任務的兩個活動分別介紹了自然語言處理(NaturalLanguageProcessing,NLP)技術及其應用,并安排了體驗阿里云NLP自然語言處理和體驗火山智能寫作兩個操作任務。本任務旨在使學生了解自然語言處理技術、自然語言處理系統(tǒng)、自然語言處理軟件,以及自然語言處理在機器翻譯、情感分析、信息檢索、語音識別、問答系統(tǒng)的應用,掌握阿里云NPL和火山智能寫作的簡單操作。學習導圖活動一

初探自然語言處理技術一、自然語言處理技術自然語言處理(NLP)是一門融語言學、計算機科學、數(shù)學于一體的交叉科學,旨在讓計算機理解和處理人類語言。自然語言處理的研究和應用領域涵蓋了多個方面,包括文本分析、文本生成、信息抽取、機器翻譯、問答系統(tǒng)等。自然語言處理的研究方法包括基于規(guī)則的方法、基于統(tǒng)計學習的方法和基于深度學習的方法等。1.自然語言處理的內容自然語言處理包含的內容有分詞、詞性標注、句法分析、命名實體識別、語言生成。(1)分詞。分詞是自然語言處理中的基礎任務,是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程。在英文的行文中,單詞之間是以空格作為自然分界符的,而中文只是字、句和段能通過明顯的分界符來簡單劃界,唯獨詞沒有一個形式上的分界符,雖然英文也同樣存在短語的劃分問題,不過在詞這一層上,中文比之英文要復雜得多、困難得多。因此,在進行中文自然語言處理預備知識:自然語言處理技術及系統(tǒng)時,我們需要先進行分詞。分詞的準確度會直接影響到后面的詞性標注、句法分析、詞向量以及文本分析的質量。(2)詞性標注。詞性標注是自然語言處理中的一項基礎任務,指的是為句子中的每個單詞標注其詞性。詞性標注的目的是提供詞語的抽象表示,以便更好地理解和分析文本。在詞性標注過程中,需要將文本中的每個單詞根據(jù)其語法和上下文信息標注為相應的詞性,如動詞、名詞、形容詞等。詞性標注可以幫助人們更好地理解文本,同時也可以用于后續(xù)的文本挖掘、信息提取等任務。(3)句法分析。自然語言處理中的句法分析是理解自然語言文本的關鍵步驟之一。它是對句子結構進行分析和理解的過程,能幫助我們理解句子中的詞語是如何組成短語和句子的。句法分析的目的是識別句子的語法結構,理解詞語之間的關系,以及它們如何組成短語和句子。這有助于我們理解句子的意義和上下文,以及進行后續(xù)的語言處理任務,如情感分析、機器翻譯等。(4)命名實體識別。命名實體識別(NER)是自然語言處理中的一項基礎任務,旨在從文本中識別出具有特定意義或指代性強的實體。這些實體通常包括人名、地名、組織機構名、日期時間、專有名詞等。NER系統(tǒng)需要從非結構化的輸入文本中抽取這些實體,并按照業(yè)務需求識別出更多類別的實體。(5)語言生成。自然語言處理中的語言生成是利用自然語言生成技術生成符合語法規(guī)則、表達特定語義的文本。語言生成是自然語言處理中的一個重要方向,它可以幫助人們更快速、更準確地理解和處理自然語言文本。語言生成的方法通常包括基于規(guī)則的方法、基于模板的方法和基于深度學習的方法?;谝?guī)則的方法利用語言學家制定的語法規(guī)則來生成文本,而基于模板的方法則通過使用預先定義的模板來生成文本。近年來,隨著深度學習技術的不斷發(fā)展,基于深度學習的方法逐漸成為主流,它們通過訓練大量的語料庫來自動學習文本生成規(guī)則。2.自然語言處理技術的起源發(fā)展(1)初創(chuàng)期(1947—1970年):在這個階段,NLP技術主要是基于規(guī)則和模式匹配的方法,用于解決一些簡單的自然語言處理任務,如文本分類、詞性標注和句法分析等。早期的機器翻譯系統(tǒng)也在這個時期出現(xiàn),但由于技術限制和數(shù)據(jù)不足等問題,翻譯質量普遍較低。(2)復蘇期(1970—1976年):在這個階段,盡管機器翻譯的研究遇到了一些困難,但一些研究者仍然堅持研究并取得了一定的進展,推出了一些基于統(tǒng)計方法的機器翻譯系統(tǒng),如IBM的SystemT,這些系統(tǒng)利用概率模型對自然語言進行處理,提高了翻譯的準確性。(3)繁榮期(1976年至今):在這個階段,隨著計算機技術和大數(shù)據(jù)的不斷發(fā)展,NLP技術得到了廣泛應用和推廣。研究者們提出了許多新的技術和方法,如神經網絡、深度學習等,用于解決復雜的自然語言處理任務,如情感分析、問答系統(tǒng)、語義理解和信息抽取等。這些技術的發(fā)展使得NLP技術在各個領域得到了廣泛應用。3.自然語言處理技術的作用(1)在情感分析方面,自然語言處理技術可以幫助人們分析文本的情感傾向和情感表達,從而更好地了解人們的意見和態(tài)度。(2)在信息檢索方面,自然語言處理技術可以幫助人們更準確地搜索和查找所需的信息,從而提高信息檢索的效率和準確性。(3)在數(shù)據(jù)挖掘方面,自然語言處理技術可以幫助人們從大量的文本數(shù)據(jù)中提取有用的信息,從而更好地利用這些數(shù)據(jù)。二、自然語言處理系統(tǒng)自然語言處理系統(tǒng)是一種能夠處理自然語言的技術,包括數(shù)據(jù)收集、數(shù)據(jù)預處理、特征提取、模型訓練、模型評估和模型應用等。(1)數(shù)據(jù)收集:從各種來源(如文本數(shù)據(jù)庫、互聯(lián)網等)收集大量的自然語言文本數(shù)據(jù)。(2)數(shù)據(jù)預處理:對收集到的數(shù)據(jù)進行清洗、分詞、詞性標注、命名實體識別等預處理操作,以便后續(xù)的處理和分析。(3)特征提?。簭念A處理后的數(shù)據(jù)中提取特征,這些特征可以包括詞頻、詞義、語法結構、上下文信息等。(4)模型訓練:使用提取的特征訓練自然語言處理模型,如分類模型、聚類模型、回歸模型等。(5)模型評估:對訓練好的模型進行評估,以了解模型的性能和效果。(6)模型應用:將訓練好的模型應用于具體的自然語言處理任務中,如文本分類、情感分析、機器翻譯等。三、自然語言處理軟件1.阿里云NLP阿里云NLP(自然語言處理)是一種人工智能服務,可以幫助用戶進行文本分析、情感分析、智能問答等多項任務。它支持多種語言,并提供了豐富的API和工具,使得用戶可以輕松地使用自然語言處理技術來解決實際問題。阿里云NLP的技術體系非常完備,包括分詞、詞性標注、命名實體識別、情感分析、關系抽取等多個模塊。同時,它還支持文本分類、短文本匹配、文本相似度比較等多項功能。這些功能都經過大量訓練,能夠提供準確的結果。此外,阿里云NLP還支持增量訓練,用戶可以通過上傳自己的數(shù)據(jù)來進行模型訓練,以適應不同的應用場景。阿里云NLP還提供了豐富的數(shù)據(jù)集和案例,幫助用戶更好地了解和使用自然語言處理技術。2.百度NLP百度NLP(自然語言處理)是百度歷史最悠久的基礎技術部門之一,以“理解語言,擁有智能,改變世界”為使命,開展包括自然語言處理、機器學習、數(shù)據(jù)挖掘在內的技術研究和產品應用工作,引領著人工智能技術的發(fā)展。3.NLTKNLTK(NaturalLanguageToolkit)是一個開源的Python庫,它提供了全面的自然語言處理工具,包括分詞、詞性標注、命名實體識別、情感分析等。NLTK還支持多種語言,并提供了豐富的語料庫和數(shù)據(jù)集。NLTK的功能非常強大,可以滿足許多自然語言處理任務的需求。除了提供多種功能,NLTK還支持自定義模型和擴展插件,用戶可以通過上傳自己的數(shù)據(jù)來進行模型訓練,以適應不同的應用場景。此外,NLTK還提供了豐富的文檔和案例,幫助用戶更好地了解和使用自然語言處理技術。使用阿里云NPL進行自然語言處理的步驟如下:(1)搜索阿里云NLP主頁網址/nlp/nlpautoml,進入阿里云NLP主界面,如圖2-39所示。操作任務:體驗阿里云NPL自然語言處理(2)點擊右上角“登錄”按鈕,進入圖2-40所示的創(chuàng)建項目界面,項目包含基礎算法、行業(yè)場景算法、應用算法等多個模塊,管理員擁有這個項目下的所有權限(項目、數(shù)據(jù)、模型等),可根據(jù)自身需求選擇項目類型。(3)點擊“文本實體抽取”后,可以在“數(shù)據(jù)中心”界面中管理數(shù)據(jù),有兩種方式可以創(chuàng)建數(shù)據(jù),即創(chuàng)建標注任務和上傳數(shù)據(jù)集,如圖2-41所示。(4)將所需的待標注文檔進行上傳,隨后添加標注人員信息,如圖2-42所示。(5)完成上述步驟后,進入實體設置界面,開始設置待標注任務的題目,如圖2-43所示。(6)設置完成待標注任務的題目之后,再對文本分類項目中的題目的所屬行業(yè)類別進行分類,如圖2-44所示。(7)完成標注任務的創(chuàng)建后,可以在“數(shù)據(jù)中心”界面中點擊“標注”進入“標注中心”界面,進行文檔的標注,每篇文檔僅會被標注一次,如圖2-45和圖2-46所示。(8)點擊“數(shù)據(jù)中心”項目列表操作欄中的質檢按鈕,進入質檢頁面,可以通過篩選和搜索,對已經標注好的文檔進行質檢,以確保良好的標注質量,如圖2-47所示。(9)除了創(chuàng)建標注任務,也可以上傳本地已標注好的訓練數(shù)據(jù),將其按示例文件的格式進行規(guī)整后直接上傳。點擊數(shù)據(jù)中心的“上傳已標注數(shù)據(jù)”按鈕,打開“上傳數(shù)據(jù)集”窗口,如圖2-48所示。(10)在“模型中心”界面中一鍵訓練模型,查看模型評估指標,并進行在線可交互測試,測試完畢后可通過API方式調用接口,如圖2-49所示。(11)點擊模型中心的“創(chuàng)建模型”,進入“創(chuàng)建模型”頁面,輸入模型基本信息,選擇已標注完的數(shù)據(jù),一鍵訓練模型,模型訓練需0.5~1小時,如圖2-50所示。(12)查看模型的相關評估指標,主要有精確率、召回率和F1值;也

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論