版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
《人工智能導(dǎo)論》教案第7次課機器學(xué)習本次授課內(nèi)容第4章AI理論與應(yīng)用:從原理到實踐4.1機器學(xué)習的三種“學(xué)習秘籍”4.1.1監(jiān)督學(xué)習:用“智能習題冊”訓(xùn)練AI 4.1.2無監(jiān)督學(xué)習:讓數(shù)據(jù)自己講故事 4.1.3強化學(xué)習:試錯中成長的“電子寵物” 4.1.4案例:基于手寫數(shù)字數(shù)據(jù)集的聚類分析實戰(zhàn) 本次課的教學(xué)目的掌握機器學(xué)習三大范式(監(jiān)督學(xué)習、無監(jiān)督學(xué)習、強化學(xué)習)的核心原理及典型應(yīng)用場景。能辨析不同AI技術(shù)的適用邊界(如監(jiān)督學(xué)習需標注數(shù)據(jù)、強化學(xué)習訓(xùn)練成本高)。本次課教學(xué)重點與難點機器學(xué)習三大范式的核心原理與應(yīng)用:如何根據(jù)數(shù)據(jù)是否標注(監(jiān)督/無監(jiān)督)、任務(wù)是否動態(tài)(強化學(xué)習)選擇合適范式,例如:監(jiān)督學(xué)習需大量標注數(shù)據(jù),無監(jiān)督學(xué)習適用于探索未知模式教學(xué)方法教學(xué)手段PPT、討論、案例實操。課堂教學(xué)時間分配教學(xué)內(nèi)容時間分配(分)內(nèi)容講解60案例實操、討論、提問與互動30課堂教學(xué)設(shè)計導(dǎo)入任務(wù)-核心內(nèi)容講解-討論-總結(jié)-案例實操實驗基于希冀平臺進行手寫數(shù)字數(shù)據(jù)集的聚類分析實戰(zhàn)本實驗將使用希冀平臺的智能體進行機器學(xué)習聚類實驗,通過智能化的實驗環(huán)境自動執(zhí)行多種聚類算法對手寫數(shù)字數(shù)據(jù)集(load_digits(sklearn):是Scikit-learn庫內(nèi)置的小型數(shù)據(jù)集,包含1797張圖像)進行聚類分析。智能體將自動運行K-means、K-means++等經(jīng)典聚類算法,用戶可以通過與智能體交互來掌握聚類分析的核心概念和實際應(yīng)用。思考題及作業(yè)題習題1-5課程思政元素科技倫理與社會責任:AI發(fā)展的價值導(dǎo)向結(jié)合強化學(xué)習面臨“獎勵機制難設(shè)計”“決策不透明”等挑戰(zhàn),如AI可能為追求獎勵“鉆空子”或做出人類難以理解的“神之一手”決策,啟示:技術(shù)發(fā)展必須以倫理為邊界。在教學(xué)中可結(jié)合醫(yī)療AI、自動駕駛等場景,引導(dǎo)學(xué)生思考“算法公平性”(如避免訓(xùn)練數(shù)據(jù)中的偏見導(dǎo)致歧視)、“責任歸屬”(如手術(shù)機器人失誤時的責任劃分),培養(yǎng)“科技向善”的價值觀,強調(diào)AI研發(fā)需兼顧效率與人文關(guān)懷,避免技術(shù)異化。教學(xué)后記第一節(jié)課課堂重點內(nèi)容詳解4.1機器學(xué)習的三種“學(xué)習秘籍”4.1.1監(jiān)督學(xué)習:用“智能習題冊”訓(xùn)練AI監(jiān)督學(xué)習的運作機制類似于一位學(xué)生掌握解題方法的過程:通過反復(fù)練習(訓(xùn)練迭代)“帶標準答案的習題”(標注數(shù)據(jù)),不斷比對預(yù)測結(jié)果與標準答案的差距,最終掌握解題規(guī)律;當學(xué)生拿到全新的試卷(測試數(shù)據(jù))時,也能舉一反三地解出同類題目(泛化能力),就像突然掌握了這類題目的內(nèi)在規(guī)律(模型收斂)。以貓狗分類為例來理解監(jiān)督學(xué)習的基本原理:1.準備學(xué)習資料:制作“動物圖卡”收集動物照片:為AI收集專屬“習題集”,挑選10,000張?zhí)卣黪r明的貓狗照片作“題庫”,包含常見與特殊品種,涵蓋不同角度和光線,注意收集易混淆案例。標注正確答案:請動物專家為每張照片標注“貓”或“狗”,有爭議的照片多人確認。統(tǒng)一卡片格式:調(diào)整所有圖片至相同尺寸,統(tǒng)一顏色和亮度,避免AI因格式不同受干擾。2.制定學(xué)習規(guī)則:設(shè)定標準答案格式,明確評判標準。一是設(shè)置簡單編碼,用[1,0]表示“貓”,[0,1]表示“狗”,專家意見不一致時用概率表示;二是設(shè)定計分規(guī)則,AI判斷錯誤率越高扣分越多。3.學(xué)習與優(yōu)化:AI學(xué)習類似學(xué)生練習糾錯,但有更系統(tǒng)優(yōu)化機制。初始訓(xùn)練階段,AI易混淆相似貓狗,錯誤率達20%-30%。之后采用“錯題本”機制,定位模型對關(guān)鍵特征識別薄弱點進行強化訓(xùn)練,早期每輪迭代準確率提升超5%。約50輪迭代后進入精調(diào)階段,最終達98%左右識別精度。有趣的是,機器學(xué)習與生物學(xué)習有本質(zhì)差異,人類少量樣本就能建立“貓狗”概念,而AI需要數(shù)萬張標注圖片,但突破閾值后,其識別穩(wěn)定性和速度遠超生物大腦。前沿遷移學(xué)習技術(shù)能將優(yōu)化過程縮短至10輪以內(nèi),這或許是AI在特定領(lǐng)域超越人類專家的關(guān)鍵。4.1.2無監(jiān)督學(xué)習:讓數(shù)據(jù)自己講故事無監(jiān)督學(xué)習核心是從未標記數(shù)據(jù)中自主發(fā)現(xiàn)內(nèi)在結(jié)構(gòu)和模式,類似消費者在超市通過商品擺放識別歸類模式定位商品。它是不依賴預(yù)設(shè)標簽或目標變量的機器學(xué)習方法,通過分析數(shù)據(jù)樣本相似性、距離或分布特征找相關(guān)性和模式,組織或分組數(shù)據(jù)獲新見解。以奶茶店顧客數(shù)據(jù)分析為例,聚類分析可自動發(fā)現(xiàn)消費群體特征,算法分析顧客甜度偏好、消費時段和購買頻率等,將顧客分群,用數(shù)據(jù)散點圖表示。自動分群結(jié)果讓經(jīng)營者看清不同顧客群體特征,但聚類前可能不知每類特點,需結(jié)合人的經(jīng)驗分析,如高甜度+下午茶+高頻為甜品愛好者、核心客戶群;低糖+早晨+低頻為健康飲食追求者、潛在高價值客戶;全糖+深夜+單次高消費為夜間沖動消費者、可提升客單價潛力客戶。這種“讓數(shù)據(jù)自己講故事”的能力適用于多個領(lǐng)域。優(yōu)化分群效果可引入新特征維度。不過,無監(jiān)督學(xué)習存在評估困難、結(jié)果誤讀、過擬合和需專家知識等缺點。案例實操:基于希冀平臺使用智能體應(yīng)用進行機器學(xué)習分類實驗,通過智能化的實驗環(huán)境自動執(zhí)行多種分類算法對不同類型的開源數(shù)據(jù)集進行分類分析。智能體將自動運行有監(jiān)督的分類算法KNN,SVM,決策樹等經(jīng)典分類算法,對三種經(jīng)典數(shù)據(jù)集進行有監(jiān)督分類學(xué)習,用戶可以通過與智能體交互來掌握分類器的核心概念和實際應(yīng)用1.使用經(jīng)典的Iris鳶尾花數(shù)據(jù)集來學(xué)習KNN分類算法2.使用糖尿病數(shù)據(jù)集來學(xué)習SVM算法3.使用BreastCancerWisconsin數(shù)據(jù)集來學(xué)習決策樹算法課堂重點內(nèi)容詳解第二節(jié)課4.1.3強化學(xué)習:試錯中成長的“電子寵物”強化學(xué)習(ReinforcementLearning,RL)是一種讓智能體通過不斷試錯來優(yōu)化決策的機器學(xué)習方法,其運作機制類似于訓(xùn)練一只電子寵物——智能體在環(huán)境中采取行動,接收獎勵或懲罰,并逐步調(diào)整策略以獲得更高的長期回報。與監(jiān)督學(xué)習不同,強化學(xué)習不依賴預(yù)先標注的數(shù)據(jù),而是通過與環(huán)境的交互自主學(xué)習,這使得它在動態(tài)、不確定的場景中(如機器人控制、游戲AI、金融交易等)表現(xiàn)出色。強化學(xué)習是一種在時間序列上進行決策的方法,強化學(xué)習的核心——智能體(Agent)執(zhí)行指定的動作(Action),同時與所處的環(huán)境(Environment)進行交互,收集當前所處環(huán)境的狀態(tài)(State)及交互得到的反饋獎賞(Reward),獲得的獎賞越高,說明執(zhí)行的動作越好,而一系列動作執(zhí)行完后獲得的獎賞總和則反映了策略整體的優(yōu)劣。智能體通過不斷的交互、試錯、學(xué)習,盡可能地最大化最終獲得的總獎賞,從而優(yōu)化決策能力。強化學(xué)習的簡單流程如圖所示。掃地機器人的技術(shù)進步是強化學(xué)習應(yīng)用圖譜中的一個代表性案例。案例實操:基于希冀平臺體驗零代碼強化學(xué)習本實驗基于一個預(yù)置的Web應(yīng)用,該應(yīng)用實現(xiàn)了一個經(jīng)典的“乒乓”(Pong)游戲,并內(nèi)嵌了一個可通過強化學(xué)習(ReinforcementLearning,RL)進行訓(xùn)練的人工智能(AI)對手。實驗的核心并非從零編寫代碼,而是通過與該系統(tǒng)進行交互,深入理解并觀察AI從一個“新手”成長為“高手”的全過程。可以通過切換不同模式、調(diào)整參數(shù)、觀察數(shù)據(jù)面板,直觀地感受強化學(xué)習中狀態(tài)、動作、獎勵等核心概念,并驗證AI的學(xué)習成果。
第8次課深度學(xué)習本次授課內(nèi)容4.2深度學(xué)習的奇妙能力:為什么AI能看懂世界4.2.1舉一反三的智慧:AI泛化能力的生動體現(xiàn) 4.2.2神經(jīng)網(wǎng)絡(luò)的奧秘:智能學(xué)習的核心引擎4.2.3遷移學(xué)習:AI的“知識復(fù)用”藝術(shù)4.2.4注意力機制:AI的“聚焦透鏡” 4.2.5模型優(yōu)化:讓AI學(xué)習更高效 4.2.6案例:基于手機相冊的AI實戰(zhàn) 本次課的教學(xué)目的理解深度學(xué)習的關(guān)鍵技術(shù)(神經(jīng)網(wǎng)絡(luò)、遷移學(xué)習、注意力機制)及AI泛化能力的實現(xiàn)邏輯。能通過案例分析(如手機相冊分類、WPS智能文檔)理解AI技術(shù)在實際場景中的落地邏輯。本次課教學(xué)重點與難點神經(jīng)網(wǎng)絡(luò)的“分層處理”機制難以直觀理解,需結(jié)合案例(如手寫數(shù)字識別)拆解層級功能。深度學(xué)習核心機制與泛化能力:預(yù)訓(xùn)練模型如何將通用特征(如邊緣檢測)遷移至特定任務(wù)(如醫(yī)學(xué)影像識別),避免從零訓(xùn)練的低效性教學(xué)方法教學(xué)手段PPT、討論、案例實操。課堂教學(xué)時間分配教學(xué)內(nèi)容時間分配(分)內(nèi)容講解60練習、討論、提問與互動30課堂教學(xué)設(shè)計導(dǎo)入任務(wù)-核心內(nèi)容講解-討論-總結(jié)-案例實操實驗基于希冀平臺通過智能化的實驗環(huán)境自動執(zhí)行CNN卷積訓(xùn)練,對Fashion-MNIST經(jīng)典數(shù)據(jù)集進行CNN分類模型構(gòu)建。基于此模型,對測試集的數(shù)據(jù)進行預(yù)測,給出準確率,并展示一張圖像以及其預(yù)測結(jié)果和實際結(jié)果。思考題及作業(yè)題習題5-10課程思政元素結(jié)合華為5G研發(fā)團隊的事跡,通過講述團隊從零探索、突破封鎖的奮斗歷程,傳承自主創(chuàng)新、科技報國、集體奉獻的精神,將價值觀塑造融入通信技術(shù)、網(wǎng)絡(luò)架構(gòu)等專業(yè)知識教學(xué)中。課堂引入事例:華為5G團隊的“十年磨一劍”——從零探索到全球領(lǐng)跑2009年,當5G還處于概念階段時,華為組建跨領(lǐng)域研發(fā)團隊(通信、計算機、電子等頂尖人才),在無成熟技術(shù)路線可參考的情況下,團隊成員日夜扎根實驗室,通過數(shù)萬次理論推導(dǎo)、仿真驗證,突破了通信理論、芯片設(shè)計、網(wǎng)絡(luò)架構(gòu)三大核心難題。例如,在芯片研發(fā)中,面對國外技術(shù)封鎖,團隊自主設(shè)計出“天罡”5G芯片,性能達到國際領(lǐng)先水平。最終,華為成為全球5G專利數(shù)量最多的企業(yè)(超3萬項),技術(shù)覆蓋170多個國家和地區(qū)。思政引導(dǎo):理解“自主創(chuàng)新是科技發(fā)展的核心動力”,培養(yǎng)學(xué)生“敢啃硬骨頭”的科研勇氣;體會“十年磨一劍”的堅守精神,認識到個人奮斗與國家科技崛起的緊密聯(lián)系。教學(xué)后記第一節(jié)課課堂重點內(nèi)容詳解4.2.1舉一反三的智慧:AI泛化能力的生動體現(xiàn)AI的泛化能力,是指AI系統(tǒng)能夠從有限的訓(xùn)練經(jīng)驗中提取出通用規(guī)律,并將這些規(guī)律成功應(yīng)用到全新場景中的能力。例如:圖像識別:經(jīng)過多品種貓圖訓(xùn)練的AI模型,可以識別戴墨鏡的貓、被P上胡須的貓,或是蜷縮成毛球的貓,通過耳朵形狀、面部比例等核心特征保持判斷準確性。醫(yī)療突破:某些皮膚檢測AI通過數(shù)萬張病例照片的學(xué)習,能識別不同人種、不同手機拍攝的早期病灶,準確率甚至超過部分醫(yī)生。然而,AI的泛化能力并非完美無缺。一方面,訓(xùn)練數(shù)據(jù)的局限性會導(dǎo)致過擬合問題。模型過度依賴訓(xùn)練數(shù)據(jù)細節(jié)(如只認特定角度的貓),導(dǎo)致新數(shù)據(jù)識別失?。ㄎ臋n中“過擬合本質(zhì)”知識點)。4.2.2神經(jīng)網(wǎng)絡(luò)的奧秘:智能學(xué)習的核心引擎神經(jīng)網(wǎng)絡(luò)是現(xiàn)代人工智能系統(tǒng)的核心架構(gòu),就像人類大腦的神經(jīng)連接網(wǎng)絡(luò)一樣,它賦予了AI系統(tǒng)強大的學(xué)習能力和舉一反三的智慧。這種由多層人工神經(jīng)元組成的網(wǎng)絡(luò)結(jié)構(gòu),正是實現(xiàn)AI泛化能力的核心基礎(chǔ)。其分層處理機制:用“傳話游戲”(輸入層→隱藏層→輸出層)類比,解釋“線條偵探組→形狀分析組→綜合判斷”的特征抽象過程,如圖所示:基于希冀平臺演示多層感知機可視化訓(xùn)練系統(tǒng),通過調(diào)整輸入層、隱藏層、訓(xùn)練超參數(shù)等內(nèi)容,得到不同情況下模型的可視化訓(xùn)練情況4.2.3遷移學(xué)習:AI的“知識復(fù)用”藝術(shù)遷移學(xué)習就像是給AI裝上了“經(jīng)驗復(fù)用”的超能力,讓AI系統(tǒng)也能“觸類旁通”:神經(jīng)網(wǎng)絡(luò)能夠?qū)⒁蚜暤玫奶卣髯R別能力靈活地遷移到新的應(yīng)用場景中,巧妙運用到新領(lǐng)域。這種“知識嫁接”的能力,使得AI不必每次都像新生兒般從零學(xué)起,而是像經(jīng)驗豐富的專家一樣快速適應(yīng)新任務(wù)。課堂重點內(nèi)容詳解第二節(jié)課4.2.4注意力機制:AI的“聚焦透鏡”AI的注意力機制能讓計算模型在處理海量數(shù)據(jù)時,自主識別并聚焦于最相關(guān)的信息特征,同時有效抑制無關(guān)干擾。以“海灘金毛犬照片”為例,講解AI如何聚焦主體(狗的毛發(fā)、姿態(tài))、過濾干擾(遠處船只)4.2.5模型優(yōu)化:讓AI學(xué)習更高效在深度學(xué)習領(lǐng)域,模型優(yōu)化是讓AI學(xué)習更高效的關(guān)鍵:數(shù)據(jù)優(yōu)化:清洗雜亂數(shù)據(jù)(如模糊圖像)、數(shù)據(jù)增強(如旋轉(zhuǎn)圖像)。訓(xùn)練優(yōu)化:調(diào)整學(xué)習率(初期快、后期慢)、正則化避免過擬合。評估反饋優(yōu)化:多次測試的模型,持續(xù)優(yōu)化模型案例實操:基于希冀平臺智能化的實驗環(huán)境自動執(zhí)行MLP模型訓(xùn)練1.使用Keras框架構(gòu)建MLP網(wǎng)絡(luò)對mnist_train_100.csv數(shù)據(jù)集文件進行分類模型構(gòu)建,該數(shù)據(jù)集文件包含100張圖片,每行數(shù)據(jù)為一張圖片,其中第一列值為該行數(shù)據(jù)對應(yīng)的標簽(圖片顯示的數(shù)值),后面為28*28個圖片的灰度值,圖像為單通道?;诖四P停瑢y試集的數(shù)據(jù)進行預(yù)測,給出準確率,并展示一張圖像以及其預(yù)測結(jié)果和實際結(jié)果2.使用Keras構(gòu)建MLP網(wǎng)絡(luò)對fashion-mnist_test.csv數(shù)據(jù)集進行分類模型構(gòu)建,該數(shù)據(jù)集是Zalando的商品圖像數(shù)據(jù)集,包含一個包含60,000個示例的訓(xùn)練集和一個包含10,000個示例的測試集。每個樣本是一張28*28的灰度圖像,與10個類別中的一個標簽相關(guān)聯(lián)。Zalando旨在讓Fashion-MNIST作為原始MNIST數(shù)據(jù)集的直接替代品,用于評估機器學(xué)習算法。它與原始MNIST數(shù)據(jù)集具有相同的圖像大小和訓(xùn)練集與測試集的劃分結(jié)構(gòu)。每行數(shù)據(jù)為一張圖片,其中第一列值為該行數(shù)據(jù)對應(yīng)的標簽(圖片顯示的數(shù)值)。后面為28*28個圖片的灰度值,圖像為單通道?;诖四P?,對測試集的數(shù)據(jù)進行預(yù)測,給出準確率,并展示一張圖像以及其預(yù)測結(jié)果和實際結(jié)果
第9次課自然語言處理本次授課內(nèi)容4.3自然語言處理:讓AI“讀懂”人類語言4.3.1自然語言處理入門:與語言的親密接觸 4.3.2自然語言處理的基礎(chǔ):分詞、詞性標注與句法分析 4.3.3深度學(xué)習的語言革命:讓AI從“識字”到“懂心” 4.3.3案例:WPS自然語言處理——智能文檔實戰(zhàn)本次課的教學(xué)目的掌握NLP基礎(chǔ)流程(分詞→詞性標注→句法分析)理解NLP在AI“讀懂語言”中的作用認識深度學(xué)習如何推動NLP革命(詞向量、注意力機制、預(yù)訓(xùn)練模型)本次課教學(xué)重點與難點自然語言處理(NLP)基礎(chǔ)與技術(shù)突破深度學(xué)習在NLP中的革新WPSAI實戰(zhàn)應(yīng)用教學(xué)方法教學(xué)手段PPT、討論、練習、案例實操。課堂教學(xué)時間分配教學(xué)內(nèi)容時間分配(分)內(nèi)容講解60練習、討論、提問與互動30課堂教學(xué)設(shè)計導(dǎo)入任務(wù)-核心內(nèi)容講解-討論-總結(jié)-案例實操實驗基于希冀平臺的可視化理解GPT本實驗使用可視化理解GPT系統(tǒng),該系統(tǒng)支持展示transformer的encode和decode過程,最后展示字符的概率值內(nèi)容,體現(xiàn)GPT2模型完整運算的過程。在輸入框輸入自己的提示詞內(nèi)容,并點擊Generate至少4次查看生成的語句是否合理,并通過調(diào)整采樣參數(shù)和查看推理界面的計算過程,學(xué)習transformer網(wǎng)絡(luò)結(jié)構(gòu),并進行記錄思考題及作業(yè)題習題15-20課程思政元素結(jié)合華為5G研發(fā)團隊“從零開始探索技術(shù)路線”“突破國外芯片技術(shù)封鎖”的事跡,強調(diào)核心技術(shù)自主可控的重要性。在NLP教學(xué)中,對比國內(nèi)外技術(shù)發(fā)展差距(如早期中文分詞依賴規(guī)則方法,而基于統(tǒng)計的模型需大量語料積累),引導(dǎo)學(xué)生認識到“卡脖子”技術(shù)攻關(guān)的緊迫性,培養(yǎng)“科技強國”使命感。通過分詞歧義處理(如“南京市長江大橋”的多切分可能性)、詞性標注的上下文依賴(如“打”在“打人”和“打醬油”中的不同詞性)等案例,說明NLP技術(shù)需兼顧規(guī)則邏輯與數(shù)據(jù)實證,培養(yǎng)學(xué)生“嚴謹驗證、迭代優(yōu)化”的科研思維以“華為手機評測”分詞錯誤導(dǎo)致搜索偏差為例,強調(diào)技術(shù)細節(jié)對應(yīng)用效果的影響,樹立“細節(jié)決定成敗”的責任意識通過智能語音助手幫助視障人士便捷生活、遠程醫(yī)療中NLP技術(shù)輔助病歷分析等案例,展現(xiàn)AI技術(shù)“以人為本”的價值導(dǎo)向教學(xué)后記第一節(jié)課課堂重點內(nèi)容詳解4.3自然語言處理:讓AI“讀懂”人類語言自然語言處理(NaturalLanguageProcessing,NLP)是人工智能領(lǐng)域中一個極富魅力且實用性強的分支,它致力于讓計算機能夠像人類一樣理解、處理和生成自然語言,從而實現(xiàn)人與計算機之間自然流暢的交互。1.NLP基礎(chǔ)三步驟:分詞、詞性標注與句法分析分詞:以“南京市長江大橋”為例,對比基于規(guī)則(正向最大匹配)與基于統(tǒng)計的方法,強調(diào)“歧義處理”的重要性詞性標注:用“美麗的花朵綻放”說明“形容詞→名詞→動詞”的標簽邏輯,解釋其對語義理解的作用。目前,實現(xiàn)詞性標注的方法主要分為基于規(guī)則的方法和基于機器學(xué)習的方法。句法分析:以“小明吃蘋果”為例,解析“主語-謂語-賓語”結(jié)構(gòu),對比基于規(guī)則與基于統(tǒng)計的方法局限性2.深度學(xué)習與NLP革命詞向量:用“指紋”類比,深度學(xué)習模型(如Word2Vec)通過分析大量文本,發(fā)現(xiàn)經(jīng)常一起出現(xiàn)的詞(如“醫(yī)生”和“護士”、“教師”和“學(xué)生”),“指紋”會很相似。神經(jīng)網(wǎng)絡(luò)是學(xué)習這些“指紋”的核心工具。注意力機制:聚焦關(guān)鍵詞,對比RNN+注意力和CNN+注意力兩種基礎(chǔ)架構(gòu)。預(yù)訓(xùn)練模型:它通過一些特別的訓(xùn)練任務(wù)(比如遮住句子中的某個詞,讓它猜出來),學(xué)會了理解詞語在具體上下文中的真實含義。以BERT為例,解釋“飽讀詩書的學(xué)霸”如何通過“填空游戲”學(xué)習上下文(如區(qū)分“銀行”的兩種含義)。第二節(jié)課3.案例實操:WPS自然語言處理——智能文檔實戰(zhàn)拆解流程:語音轉(zhuǎn)文字→全文概覽(關(guān)鍵詞云、發(fā)言人分欄)→會議紀要整理→文檔分析。重點分析:“智能關(guān)鍵詞云雙向跳轉(zhuǎn)”“注意力機制定位發(fā)言片段”等功能如何提升信息檢索效率。
第10次課AI感知技術(shù)本次授課內(nèi)容4.4AI感知技術(shù):讓機器像人一樣感知世界4.4.1計算機視覺:AI的“眼睛” 4.4.2語音識別:AI的“耳朵” 4.4.3生物識別:AI的“觸覺”本次課的教學(xué)目的理解計算機視覺(人臉識別)、語音識別、生物識別的核心流程與技術(shù)挑戰(zhàn);掌握人臉識別的“數(shù)據(jù)預(yù)處理→特征提取→決策推理”三步法本次課教學(xué)重點與難點計算機視覺的特征提取邏輯語音識別的噪聲魯棒性生物識別的安全與倫理權(quán)衡多技術(shù)融合的跨學(xué)科性教學(xué)方法教學(xué)手段PPT、討論、練習、案例實操。課堂教學(xué)時間分配教學(xué)內(nèi)容時間分配(分)內(nèi)容講解60練習、討論、提問與互動30課堂教學(xué)設(shè)計導(dǎo)入任務(wù)-核心內(nèi)容講解-討論-總結(jié)-案例實操實驗基于希冀平臺的圖像理解與應(yīng)用本實驗基于希冀平臺的Qwen2.5-VL-7B-Instruct聊天機器人Web應(yīng)用,用戶需要上傳圖片素材與大模型交流(點擊上傳按鈕上傳圖片),為大模型提供基礎(chǔ)的圖片內(nèi)容。上傳好圖片后,在輸入框輸入提示詞內(nèi)容,回車或者點擊發(fā)送向大模型發(fā)送圖片和提示詞內(nèi)容。評估模型Qwen2.5-VL-7B-Instruct的圖像理解能力思考題及作業(yè)題習題20-25課程思政元素結(jié)合華為5G研發(fā)團隊的事跡,引導(dǎo)學(xué)生在理解5G技術(shù)原理的同時,樹立“科技強國”的信念,厚植愛國情懷與民族自豪感。課堂引入事例:5G賦能千行百業(yè)——科技報國的生動實踐華為5G技術(shù)不僅實現(xiàn)了通信領(lǐng)域的突破,更深度融入工業(yè)、醫(yī)療、交通等民生領(lǐng)域:工業(yè)制造:某汽車廠通過5G+工業(yè)互聯(lián)網(wǎng),生產(chǎn)線自動化率提升30%,產(chǎn)品不良率下降50%;疫情防控:2020年,華為5G遠程醫(yī)療系統(tǒng)為湖北偏遠地區(qū)提供超10萬次遠程會診,讓優(yōu)質(zhì)醫(yī)療資源觸達基層;智慧城市:深圳通過5G網(wǎng)絡(luò)實現(xiàn)交通信號智能調(diào)控,高峰期擁堵時長減少25%。思政引導(dǎo):感受“科技為民”的初心,理解5G技術(shù)對國家數(shù)字化轉(zhuǎn)型的戰(zhàn)略意義;增強民族認同感:中國5G技術(shù)已從“跟跑”到“領(lǐng)跑”,成為國家名片,激發(fā)學(xué)生“為國奮斗”的使命感。思政元素核心目標愛國情懷與報國精神:通過團隊突破封鎖、服務(wù)國家需求的事跡,引導(dǎo)學(xué)生將個人職業(yè)理想與國家戰(zhàn)略結(jié)合;集體主義與奉獻精神:以“小李堅守實驗室”等案例,傳遞“舍小家為大家”的團隊協(xié)作價值觀;民族自信與科技自信:展示5G技術(shù)的全球影響力,讓學(xué)生認識到中國科技的硬實力,增強文化自信。通過這些事例,實現(xiàn)“知識傳授+能力培養(yǎng)+價值引領(lǐng)”的三位一體,讓學(xué)生在專業(yè)學(xué)習中自然接受思政教育,成長為有理想、有擔當?shù)目萍既瞬拧=虒W(xué)后記課堂重點內(nèi)容詳解第一節(jié)課4.4AI感知技術(shù):讓機器像人一樣感知世界1.計算機視覺:AI的“眼睛”人臉識別流程:拆解“數(shù)據(jù)預(yù)處理(像素分析、光照調(diào)整)→多尺度特征提?。ㄑ劬?、鼻子等關(guān)鍵點)→決策推理(特征匹配)”。技術(shù)挑戰(zhàn):分析“圖像模糊、光線不足”對識別的影響,介紹深度學(xué)習如何通過“增強特征提取”提升魯棒性。案例實操:基于希冀平臺零代碼手勢分類使用零代碼手勢識別模型訓(xùn)練系統(tǒng),通過上傳或拍照合適的數(shù)據(jù)集進行處理,構(gòu)建自定義的手勢識別模型,并進行實時推理。第二節(jié)課2.語音識別:AI的“耳朵”工作原理:聲波→數(shù)字信號→聲學(xué)特征提取→語言模型匹配。局限性:對比人類聽覺(聚焦對話、適應(yīng)口音)與AI的不足(噪聲干擾、難以理解諷刺)。3.生物識別:AI的“觸覺”技術(shù)分類:生理特征(指紋、面部、虹膜)與行為特征(筆跡、步態(tài)),對比其應(yīng)用場景。案例解析:掌靜脈識別(紅外線掃描靜脈分布)在企業(yè)門禁的應(yīng)用,虹膜識別在軍事基地的高安全性。4.案例實操:基于希冀平臺零代碼音頻分類使用零代碼音頻分類模型訓(xùn)練系統(tǒng),通過上傳實時麥克風路徑進行特征提取和處理,構(gòu)建自定義的音頻分類模型,并進行實時推理
第11次課數(shù)據(jù)分析與數(shù)據(jù)采集本次授課內(nèi)容第5章玩轉(zhuǎn)數(shù)據(jù)智能5.1數(shù)據(jù)分析基本概念 5.2數(shù)據(jù)采集從何入手本次課的教學(xué)目的掌握數(shù)據(jù)分析全流程(采集→預(yù)處理→分析→可視化)的核心概念、方法及工具,理解AI對各環(huán)節(jié)的賦能價值(如DeepSeek輔助數(shù)據(jù)處理與圖表生成)樹立數(shù)據(jù)合規(guī)意識與隱私保護觀念,培養(yǎng)嚴謹?shù)臄?shù)據(jù)分析思維與創(chuàng)新應(yīng)用能力。本次課教學(xué)重點與難點數(shù)據(jù)分析基礎(chǔ):四類分析類型(描述性、診斷性、預(yù)測性、規(guī)范性)的定義與應(yīng)用邊界,常見工具(Excel、Python、Tableau)的功能對比。采集原則(合法性、最小化)與方法(網(wǎng)絡(luò)爬蟲、用戶行為追蹤)AI賦能的“智采”變革。教學(xué)方法教學(xué)手段PPT、討論、練習。課堂教學(xué)時間分配教學(xué)內(nèi)容時間分配(分)內(nèi)容講解60討論、提問、答疑、練習30課堂教學(xué)設(shè)計導(dǎo)入任務(wù)-核心內(nèi)容講解-討論-總結(jié)實驗基于希冀平臺數(shù)據(jù)分析1.對銷售數(shù)據(jù)集進行分析,并讓智能體輸出可視化結(jié)果。使用提示詞“基于sales_data_sample.csv數(shù)據(jù)集文件,進行數(shù)據(jù)分析,給出可視化結(jié)果”2.實驗數(shù)據(jù)自動分析:驗證胡克定律的線性關(guān)系(F=?kx),通過測量不同質(zhì)量下彈簧的形變量,計算勁度系數(shù)k,并評估實驗數(shù)據(jù)與理論值的偏差。思考題及作業(yè)題習題1-10課程思政元素結(jié)合王選院士與漢字激光照排的突破之路講述自主創(chuàng)新打破技術(shù)壟斷的科研實踐案例王選院士(1937-2006),江蘇無錫人,計算機文字信息處理專家,漢字激光照排技術(shù)創(chuàng)始人,被譽為“漢字激光照排系統(tǒng)之父”“有市場眼光的科學(xué)家”。他憑借卓越智慧與勇氣,推動中國印刷業(yè)從“鉛與火”邁入“光與電”時代,是自主創(chuàng)新、科技報國的典范。核心突破:自主創(chuàng)新與技術(shù)跨越技術(shù)路線創(chuàng)新面對國外技術(shù)封鎖,王選大膽提出“跳過二代、三代機,直接研制第四代激光照排系統(tǒng)”的設(shè)想,雖遭質(zhì)疑,但憑借對技術(shù)趨勢的洞察力堅持推進。關(guān)鍵技術(shù)攻克漢字字形存儲難題:帶領(lǐng)團隊創(chuàng)造性提出高分辨率字形壓縮技術(shù),通過分析漢字筆畫結(jié)構(gòu),將字形信息壓縮至原大小的1/500,解決存儲效率問題。激光掃描精度:攻克高精度掃描技術(shù),確保印刷清晰度與準確性。精神遺產(chǎn)與科研理念:“頂天立地”理念:既要追求技術(shù)“頂天”(世界領(lǐng)先),又要實現(xiàn)成果“立地”(轉(zhuǎn)化為生產(chǎn)力),強調(diào)科研需兼顧理論高度與應(yīng)用價值。榜樣力量:證明中國人能在高科技領(lǐng)域打破壟斷,激勵科研工作者以堅定信念、創(chuàng)新思維與恒心攻克技術(shù)難關(guān)。教學(xué)后記課堂重點內(nèi)容詳解第一節(jié)課5.1數(shù)據(jù)分析基本概念一、數(shù)據(jù)分析概述核心定義數(shù)據(jù)分析是通過統(tǒng)計與邏輯技術(shù),對數(shù)據(jù)進行清洗、轉(zhuǎn)換、建模,以提取價值、發(fā)現(xiàn)規(guī)律并支持決策的過程。其本質(zhì)是將原始數(shù)據(jù)轉(zhuǎn)化為業(yè)務(wù)洞察,需結(jié)合具體場景解讀數(shù)據(jù)意義。四類分析類型(層層遞進)描述性分析:回答“過去發(fā)生了什么”,通過基礎(chǔ)統(tǒng)計(平均值、占比)和可視化(柱狀圖、折線圖)呈現(xiàn)現(xiàn)狀,如“上月銷售額100萬”。診斷性分析:回答“為什么發(fā)生”,通過下鉆、關(guān)聯(lián)分析挖掘原因,如“銷售額下降是因為核心產(chǎn)品在華東缺貨”。預(yù)測性分析:回答“未來可能發(fā)生什么”,利用機器學(xué)習模型預(yù)測趨勢(如銷量預(yù)測、客戶流失風險),輸出概率而非確定結(jié)果。規(guī)范性分析:回答“應(yīng)該怎么做”,模擬多決策方案的結(jié)果并推薦最優(yōu)路徑,如“基于庫存數(shù)據(jù),建議優(yōu)先補貨A產(chǎn)品”。全流程六步驟目標定義→數(shù)據(jù)收集→清洗處理→探索性分析與建?!Y(jié)果可視化→部署與決策支持。其中,數(shù)據(jù)清洗與處理是最耗時但關(guān)鍵的環(huán)節(jié)(占比約80%),直接決定分析結(jié)果的可靠性。二、常見數(shù)據(jù)分析工具電子表格(Excel/WPS)特點:靈活易用、適合中小規(guī)模數(shù)據(jù),支持公式計算、數(shù)據(jù)透視表(快速分類匯總)和基礎(chǔ)可視化。適用場景:日常事務(wù)(預(yù)算管理、問卷統(tǒng)計)、簡單描述性分析。BI工具(Tableau/PowerBI)特點:拖拽式操作、交互式儀表盤,支持多數(shù)據(jù)源連接與復(fù)雜可視化。適用場景:商業(yè)匯報、畢業(yè)設(shè)計展示、跨部門數(shù)據(jù)整合分析。編程工具(Python/R/SQL)Python:通過Pandas(數(shù)據(jù)處理)、Matplotlib(可視化)、Scikit-learn(機器學(xué)習)處理海量數(shù)據(jù),適合自動化與復(fù)雜建模。R語言:專注統(tǒng)計分析與繪圖(ggplot2),適合學(xué)術(shù)研究與高級統(tǒng)計建模。SQL:用于數(shù)據(jù)庫查詢與ETL(數(shù)據(jù)提取、轉(zhuǎn)換、加載),是數(shù)據(jù)分析師必備技能。三、AI賦能數(shù)據(jù)分析的核心價值效率提升自動化數(shù)據(jù)清洗(識別異常值、合并多源數(shù)據(jù)),減少人工操作;自然語言交互(用日常語言提問,如“顯示上月銷量Top10產(chǎn)品”)降低技術(shù)門檻。深度與準確性發(fā)現(xiàn)非線性數(shù)據(jù)關(guān)系(如用戶行為與購買決策的隱藏關(guān)聯(lián));高精度預(yù)測(金融風控中毫秒級欺詐識別)。應(yīng)用場景擴展處理非結(jié)構(gòu)化數(shù)據(jù)(文本情感分析、圖像品牌識別);個性化推薦(視頻/商品推薦)。四、關(guān)鍵總結(jié)數(shù)據(jù)分析的本質(zhì)是“數(shù)據(jù)→信息→洞察→決策”的轉(zhuǎn)化過程。工具選擇需結(jié)合數(shù)據(jù)規(guī)模、分析復(fù)雜度與業(yè)務(wù)需求(如中小數(shù)據(jù)用Excel,海量數(shù)據(jù)用Python)。AI并非替代人工,而是通過自動化與智能化提升分析效率與深度,讓分析師聚焦高價值的業(yè)務(wù)解讀。第二節(jié)課5.2數(shù)據(jù)采集從何入手一、數(shù)據(jù)采集的核心原則合法性原則必須遵循《網(wǎng)絡(luò)安全法》《個人信息保護法》等法規(guī),明確用戶授權(quán)(如隱私政策同意),禁止采集敏感信息(如未授權(quán)的用戶身份證號)。最小化原則只采集實現(xiàn)目標必需的最少數(shù)據(jù),避免過度采集(如分析用戶購買偏好時,無需采集用戶婚姻狀況)。準確性與系統(tǒng)性原則確保數(shù)據(jù)真實可靠,建立持續(xù)、穩(wěn)定的采集流程(如每日定時抓取電商價格數(shù)據(jù)),避免零散采集導(dǎo)致的數(shù)據(jù)不一致。二、常見數(shù)據(jù)采集方法網(wǎng)絡(luò)爬蟲通過Python工具(Requests、BeautifulSoup、Scrapy)自動抓取網(wǎng)頁數(shù)據(jù)(如電商商品價格、新聞標題),需注意反爬策略(設(shè)置請求間隔、使用代理IP)。傳感器與物聯(lián)網(wǎng)采集利用溫度、GPS等傳感器實時獲取物理數(shù)據(jù)(如智能家居環(huán)境監(jiān)測、車聯(lián)網(wǎng)定位),數(shù)據(jù)特點是實時性強、連續(xù)生成。用戶行為追蹤在網(wǎng)站/App中嵌入監(jiān)測代碼,記錄用戶點擊、瀏覽時長等行為(如電商平臺分析用戶購買路徑),需嚴格遵守隱私合規(guī)要求。自動化文檔處理通過OCR(光學(xué)字符識別)解析圖片/掃描件,NLP(自然語言處理)提取文本關(guān)鍵信息(如合同條款、發(fā)票金額)。三、數(shù)據(jù)采集的標準化流程明確目標:定義需采集的數(shù)據(jù)字段(如“XX品牌手機在三大電商平臺的每日價格、評論數(shù)”)。識別數(shù)據(jù)源:確定數(shù)據(jù)所在位置(如電商平臺的商品列表頁、詳情頁)。選擇方法與工具:根據(jù)數(shù)據(jù)類型選擇工具(如大規(guī)模數(shù)據(jù)用Python爬蟲,實時數(shù)據(jù)用傳感器)。執(zhí)行與存儲:運行采集程序,將數(shù)據(jù)存儲為CSV、Excel或數(shù)據(jù)庫格式(如按日期命名文件:手機價格_20231027.csv)。質(zhì)量檢查:驗證數(shù)據(jù)完整性(如是否缺失價格字段)、格式正確性(如價格無亂碼)。四、AI賦能數(shù)據(jù)采集的“智采”變革全流程自動化通過RPA(機器人流程自動化)模擬人類操作(登錄系統(tǒng)、填寫表單),實現(xiàn)數(shù)據(jù)抓取與預(yù)處理一體化。多模態(tài)數(shù)據(jù)處理能“看懂”圖片(提取商品信息)、“聽懂”語音(轉(zhuǎn)寫客服錄音)、“理解”文本(分析評論情感),突破傳統(tǒng)采集僅處理結(jié)構(gòu)化數(shù)據(jù)的局限。智能解析與自適應(yīng)從非結(jié)構(gòu)化數(shù)據(jù)中提取關(guān)鍵信息(如新聞中的實體識別),爬蟲能自適應(yīng)網(wǎng)站結(jié)構(gòu)變化(如頁面布局更新時自動調(diào)整抓取規(guī)則)。4.人工智能大模型賦能數(shù)據(jù)采集的應(yīng)用案例?!景咐?】利用DeepSeek生成電子商務(wù)模擬數(shù)據(jù)。(1)生成測試數(shù)據(jù)在DeepSeek中,輸入提示詞(Prompt):DeepSeek經(jīng)過思考,得到如圖所示的10條產(chǎn)品測試數(shù)據(jù)和驗證說明。產(chǎn)品信息表數(shù)據(jù)說明(2)生成異常和邊界場景的測試數(shù)據(jù)。在DeepSeek中,輸入提示詞(Prompt):DeepSeek經(jīng)過思考,得到如圖所示的測試數(shù)據(jù)。(3)編寫生成數(shù)據(jù)的Python程序DeepSeek還可以編寫用來生成測試數(shù)據(jù)的Python程序。在DeepSeek中,輸入提示詞(Prompt):DeepSeek經(jīng)過思考,得到如圖所示的結(jié)果?!景咐?】利用DeepSeek抓取數(shù)據(jù)在DeepSeek中,輸入提示詞(Prompt):DeepSeek經(jīng)過思考,生成新浪體育新聞爬蟲程序
第12次課數(shù)據(jù)預(yù)處理與AI賦能數(shù)據(jù)分析本次授課內(nèi)容5.3數(shù)據(jù)預(yù)處理的小技巧5.4AI賦能,數(shù)據(jù)分析輕松上手5.5數(shù)據(jù)可視化太驚艷本次課的教學(xué)目的熟悉數(shù)據(jù)智能的應(yīng)用場景(非結(jié)構(gòu)化數(shù)據(jù)處理、個性化推薦等),建立數(shù)據(jù)驅(qū)動決策的認知框架。能獨立完成中小規(guī)模數(shù)據(jù)分析項目(從數(shù)據(jù)采集到可視化報告),初步使用AI工具提升分析效率。能識別數(shù)據(jù)質(zhì)量問題并應(yīng)用預(yù)處理技巧,選擇合適分析方法(描述性統(tǒng)計、相關(guān)性分析等)解決實際問題。。本次課教學(xué)重點與難點預(yù)處理核心操作:數(shù)據(jù)清洗(缺失值/異常值處理)、轉(zhuǎn)換(非結(jié)構(gòu)化→結(jié)構(gòu)化)、集成(消除數(shù)據(jù)孤島)。AI賦能分析與可視化:描述性統(tǒng)計、相關(guān)性分析、假設(shè)檢驗、回歸分析的基本方法及AI工具應(yīng)用。常見圖表類型(柱狀圖、折線圖等)的選擇與Python實現(xiàn),通過可視化傳遞數(shù)據(jù)洞察。教學(xué)方法教學(xué)手段PPT、討論、練習、案例實操。課堂教學(xué)時間分配教學(xué)內(nèi)容時間分配(分)內(nèi)容講解60討論、提問、答疑、練習30課堂教學(xué)設(shè)計導(dǎo)入任務(wù)-核心內(nèi)容講解-討論-總結(jié)實驗基于希冀平臺數(shù)據(jù)分析根據(jù)你所在的學(xué)科領(lǐng)域,尋找或由希冀平臺提供的與本專業(yè)相關(guān)的數(shù)據(jù)集(如銷售數(shù)據(jù)集、學(xué)生成績數(shù)據(jù)集、財務(wù)數(shù)據(jù)、材料性能數(shù)據(jù)、作物生長數(shù)據(jù)、交通流量數(shù)據(jù)等),使用AI大模型輔助完成一次完整的數(shù)據(jù)分析與可視化探索,并撰寫一份簡短的報告,闡述你從數(shù)據(jù)中發(fā)現(xiàn)的規(guī)律或見解。思考題及作業(yè)題習題10-20課程思政元素1.集合數(shù)據(jù)采集需遵循“合法合規(guī)”原則,如《通用數(shù)據(jù)保護條例》(GDPR)對個人數(shù)據(jù)準確性的要求,以及數(shù)據(jù)清洗中“降低合規(guī)與風險成本”的必要性,引導(dǎo)學(xué)生樹立數(shù)據(jù)倫理意識,在技術(shù)應(yīng)用中堅守法律底線,保護用戶隱私,避免因數(shù)據(jù)濫用導(dǎo)致的社會風險。2.教學(xué)后記課堂重點內(nèi)容詳解第一節(jié)課5.3數(shù)據(jù)預(yù)處理的小技巧一、數(shù)據(jù)清洗:數(shù)據(jù)分析的“基石”數(shù)據(jù)清洗的必要性解決“垃圾進,垃圾出”問題:原始數(shù)據(jù)常存在缺失值、異常值、重復(fù)數(shù)據(jù)等質(zhì)量問題,直接影響分析結(jié)果的準確性(如錯誤的用戶行為數(shù)據(jù)會導(dǎo)致推薦算法失效)。提升模型性能:機器學(xué)習模型對數(shù)據(jù)質(zhì)量敏感,清洗后的數(shù)據(jù)能減少“噪音”干擾,提高預(yù)測精度。合規(guī)與風險控制:金融、醫(yī)療等行業(yè)需保證數(shù)據(jù)準確性以滿足法規(guī)要求(如GDPR對個人數(shù)據(jù)的準確性要求)。常見數(shù)據(jù)質(zhì)量問題及處理缺失值:通過均值/中位數(shù)填充(數(shù)值型)、眾數(shù)填充(分類數(shù)據(jù))或刪除缺失嚴重的記錄。異常值:使用箱線圖識別,通過刪除或替換(如用中位數(shù)替代)處理。重復(fù)數(shù)據(jù):通過主鍵(如用戶ID)去重,避免重復(fù)計算。格式不一致:統(tǒng)一日期格式(如“YYYY-MM-DD”)、單位(如將“kg”和“l(fā)b”轉(zhuǎn)換為統(tǒng)一單位)。AI賦能數(shù)據(jù)清洗自動識別并修復(fù)數(shù)據(jù)錯誤(如DeepSeek生成Python代碼批量處理缺失值),減少人工操作?!景咐?】使用DeepSeek進行數(shù)據(jù)清洗(1)在DeepSeek中,輸入的提示詞(Prompt):(2)進一步處理,在DeepSeek中,輸入提示詞(Prompt):刪除上述數(shù)據(jù)表中數(shù)量為0的行,處理后的數(shù)據(jù)以表格形式給出。DeepSeek處理后,刪除了訂單ID號為D1007的數(shù)據(jù)行。(3)使用DeepSeek編寫清洗數(shù)據(jù)的代碼。在DeepSeek中,輸入提示詞(Prompt):DeepSeek經(jīng)過思考,給出python程序代碼及程序說明。二、數(shù)據(jù)轉(zhuǎn)換:從“原始”到“可用”非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換文本數(shù)據(jù):通過NLP技術(shù)(分詞、TF-IDF、詞嵌入)轉(zhuǎn)換為數(shù)值向量,用于情感分析、主題建模。圖像/視頻數(shù)據(jù):使用CNN提取特征向量,用于圖像分類、目標檢測。音頻數(shù)據(jù):轉(zhuǎn)換為MFCC(梅爾頻率倒譜系數(shù))或頻譜圖,用于語音識別、情感分析。數(shù)據(jù)格式與類型轉(zhuǎn)換格式轉(zhuǎn)換:JSON→CSV、Excel→數(shù)據(jù)庫,確保數(shù)據(jù)在不同工具間兼容(如將API返回的JSON數(shù)據(jù)轉(zhuǎn)換為Excel便于分析)。類型轉(zhuǎn)換:字符串→數(shù)值(如“123”→123)、字符串→日期(如“2023/10/25”→“2023-10-25”),需處理轉(zhuǎn)換失敗的異常情況(如“abc”無法轉(zhuǎn)為數(shù)值)?!景咐?】使用DeepSeek實現(xiàn)JSON格式文件與Excel文件相互轉(zhuǎn)換。JSON文件作為一種輕量級的文本格式,用于表示結(jié)構(gòu)化數(shù)據(jù)。在DeepSeek中,輸入提示詞(Prompt):DeepSeek經(jīng)過思考,給出轉(zhuǎn)換程序和轉(zhuǎn)換結(jié)果?!景咐?】電商訂單數(shù)據(jù)分析。假設(shè)你是一家電商公司的數(shù)據(jù)分析師。技術(shù)團隊給你推送了一個名為orders_raw.csv的原始訂單數(shù)據(jù)文件。orders_raw.csv文件內(nèi)容如表所示。原始訂單數(shù)據(jù)文件orders_raw.csvorder_idproduct_categoryprice_strquantity_strorder_date_strcustomer_idA1001Electronics599.9922023-10-2514:30:05CUST-001A1002Books25.5012023/10/2609:15:37CUST-002A1003Home&Kitchen89.9932023-10-26CUST-003A1004Electronics1299.00127/10/202316:45:00CUST-001A1005Books19.99two2023-10-28CUST-004A1006Apparel45.7522023-10-2811:59:01CUST-005原始數(shù)據(jù)中的數(shù)字和日期都是以文本(字符串)格式存儲的,無法直接進行數(shù)學(xué)運算(如求和、求平均)或時間序列分析,并且quantity_str列包含一個非數(shù)字字符"two"(這是一個需要處理的臟數(shù)據(jù))。現(xiàn)在利用DeepSeek進行正確的數(shù)據(jù)類型轉(zhuǎn)換。在DeepSeek中,輸入提示詞(Prompt):DeepSeek經(jīng)過思考,給出轉(zhuǎn)換后的數(shù)據(jù)結(jié)果及轉(zhuǎn)換說明。數(shù)據(jù)規(guī)范化Min-Max規(guī)范化:將數(shù)據(jù)映射到[0,1]區(qū)間,適用于無異常值的場景(如用戶評分)。Z-Score標準化:處理后數(shù)據(jù)均值為0、標準差為1,適用于存在異常值的場景(如銷售額預(yù)測)?!景咐?】客戶價值評估。假設(shè)你是一家零售公司的數(shù)據(jù)分析師。你有一個客戶數(shù)據(jù)集,包含客戶最近一年的購買行為信息,如表5.3所示。你的任務(wù)是建立一個簡單的客戶價值評分模型,用于識別高價值客戶。表5.3客戶數(shù)據(jù)集customers_raw.csvcustomer_idtotal_spentpurchase_countdays_since_last_purchaseC00115000530C002800155C0034500860C004300252C00512001215核心問題:原始數(shù)據(jù)中的三個特征(總消費金額、購買次數(shù)、最近購買距今天數(shù))具有不同的量綱和單位。其中:總消費金額:范圍在幾百到上萬(單位:元)購買次數(shù):范圍在幾次到上百次(單位:次)最近購買距今天數(shù):范圍在幾天到幾百天(單位:天)如果直接將這三個數(shù)值相加來評分,總消費金額因為數(shù)值巨大,將完全主導(dǎo)評分結(jié)果,而購買次數(shù)的作用會被淹沒。數(shù)據(jù)規(guī)范化的目的就是消除量綱的影響,使所有特征處于同一數(shù)值尺度上,從而公平地參與模型計算。現(xiàn)在利用DeepSeek進行Min-Max規(guī)范化和Z-Score標準化。在DeepSeek中,輸入提示詞(Prompt):DeepSeek經(jīng)過思考,給出轉(zhuǎn)換程序和轉(zhuǎn)換結(jié)果三、數(shù)據(jù)集成:消除“數(shù)據(jù)孤島”數(shù)據(jù)集成的核心目標將分散在多個系統(tǒng)(如訂單系統(tǒng)、CRM系統(tǒng))的數(shù)據(jù)整合為統(tǒng)一視圖(如用戶畫像寬表),支持跨部門分析(如精準營銷)。數(shù)據(jù)集成的關(guān)鍵步驟提?。簭臄?shù)據(jù)庫(MySQL)、日志文件(JSON)、API等多源獲取數(shù)據(jù)。轉(zhuǎn)換:清洗數(shù)據(jù)、統(tǒng)一編碼(如將“Male”和“M”轉(zhuǎn)換為“男”)、聚合計算(如按用戶ID匯總訂單金額)。加載:將轉(zhuǎn)換后的數(shù)據(jù)加載到數(shù)據(jù)倉庫(如Snowflake)或數(shù)據(jù)湖,支持后續(xù)分析。數(shù)據(jù)集成的挑戰(zhàn)與解決多源異構(gòu)性:通過ETL工具(如ApacheNiFi)統(tǒng)一數(shù)據(jù)格式,解決半結(jié)構(gòu)化日志與結(jié)構(gòu)化數(shù)據(jù)庫的整合問題。數(shù)據(jù)匹配與去重:使用實體識別技術(shù)(如判斷“張三”和“張老三”是否為同一用戶),避免重復(fù)記錄?!景咐?】電商用戶360度視圖分析案例背景:某電商公司擁有多個數(shù)據(jù)源系統(tǒng),包括:訂單系統(tǒng)(MySQL數(shù)據(jù)庫):記錄用戶的交易數(shù)據(jù)。用戶行為日志系統(tǒng)(JSON日志文件):記錄用戶在網(wǎng)站上的點擊、瀏覽、搜索等行為。CRM系統(tǒng)(RESTAPI):存儲用戶的個人信息和客戶服務(wù)交互記錄。數(shù)據(jù)分析團隊希望將這些分散的數(shù)據(jù)整合起來,構(gòu)建一個統(tǒng)一的用戶標簽寬表,用于分析不同用戶群體的特征、行為模式和價值,從而支持精準營銷和個性化推薦。第一步:定義目標與數(shù)據(jù)源分析目標數(shù)據(jù)集:user_profile_wide_table(用戶畫像寬表)目標字段:用戶ID、人口統(tǒng)計信息、購買能力指標、行為偏好指標、服務(wù)互動指標。數(shù)據(jù)源如表5.4所示:表5.4數(shù)據(jù)源分析數(shù)據(jù)源存儲格式示例關(guān)鍵字段挑戰(zhàn)訂單系統(tǒng)(orders)MySQL表user_id,order_amount,order_date,product_category數(shù)據(jù)規(guī)范,但一個用戶有多條記錄,需要聚合行為日志(user_click_log)JSON日志文件user_id,timestamp,event_type(e.g.,‘click’,‘search’),page半結(jié)構(gòu)化,數(shù)據(jù)量巨大,需要解析和聚合CRM系統(tǒng)(customer_info)RESTAPIuser_id,name,registration_date,membership_level需要通過網(wǎng)絡(luò)接口獲取,速率可能受限第二步:提取具體數(shù)據(jù)(1)訂單數(shù)據(jù)(orders_table),如表5.5所示。表5.5訂單數(shù)據(jù)表order_iduser_idorder_amountorder_dateproduct_category1001101299.002023-10-25Electronics1002102150.502023-10-26Clothing100310149.992023-10-27Books1004103999.002023-10-28Electronics100510275.002023-10-29Clothing(2)用戶行為日志(user_click_log.json)(3)CRM用戶數(shù)據(jù){"data":{"user_id":101,"name":"張三","registration_date":"2022-05-15","membership_level":"Gold"}第三步:數(shù)據(jù)集成ETL流程設(shè)計我們將使用一個經(jīng)典的ETL(提取、轉(zhuǎn)換、加載)流程來集成這些數(shù)據(jù)。(1)提取使用JDBC連接器從MySQL中讀取orders_table。使用Spark的json數(shù)據(jù)源讀取user_click_log.json文件。編寫一個Python函數(shù),通過requests庫調(diào)用CRMAPI獲取用戶數(shù)據(jù),并并行化處理。(2)轉(zhuǎn)換這是最核心的一步,需要對每個數(shù)據(jù)源進行清洗和聚合,使其匹配目標寬表的格式。訂單數(shù)據(jù)轉(zhuǎn)換:按user_id分組。計算每個用戶的:總訂單數(shù)(total_orders)、總消費金額(total_amount)、最常購買的商品類別(fav_category)。行為日志數(shù)據(jù)轉(zhuǎn)換:過濾出關(guān)鍵事件(如查看、搜索、購買)。按user_id分組。計算每個用戶的總瀏覽次數(shù)(total_views)、總搜索次數(shù)(total_searches)、最后活動時間(last_active_date)。CRM數(shù)據(jù)轉(zhuǎn)換:直接映射即可,但可能需要將membership_level這樣的分類變量轉(zhuǎn)換為數(shù)值分數(shù)(例如,Bronze=1,Silver=2,Gold=3)以供模型使用。(3)連接將三個轉(zhuǎn)換后的數(shù)據(jù)集通過user_id進行左外連接(以用戶列表為基準),合并所有特征。第四步:集成后的目標數(shù)據(jù)最終生成的集成寬表user_profile_wide_table如表5.6所示。表5.6用戶畫像寬表user_idnamemembership_levelregistration_datetotal_orderstotal_amountfav_categorytotal_viewstotal_searcheslast_active_date101張三Gold2022-05-152348.99Electronics102023-10-26102李四Silver2022-08-202225.50Clothing012023-10-28103王五Bronze2023-01-101999.00Electronics102023-10-27四、關(guān)鍵總結(jié)數(shù)據(jù)預(yù)處理是數(shù)據(jù)分析的“隱形工程”,直接決定后續(xù)分析的深度與可靠性。清洗、轉(zhuǎn)換、集成是預(yù)處理的核心環(huán)節(jié),需結(jié)合業(yè)務(wù)目標選擇合適方法(如非結(jié)構(gòu)化數(shù)據(jù)需先轉(zhuǎn)換為結(jié)構(gòu)化)。AI技術(shù)(如NLP、OCR)極大擴展了預(yù)處理的邊界,使非結(jié)構(gòu)化數(shù)據(jù)的分析成為可能。第二節(jié)課5.4AI賦能,數(shù)據(jù)分析輕松上手一、AI賦能數(shù)據(jù)分析的核心價值效率與門檻降低自然語言交互:業(yè)務(wù)人員無需編程,通過日常語言提問(如“顯示上月銷量Top10產(chǎn)品”)即可生成圖表和分析結(jié)果,打破技術(shù)壁壘。自動化流程:AI自動完成數(shù)據(jù)清洗、建模等重復(fù)性工作(如DeepSeek生成Python代碼批量處理數(shù)據(jù)),釋放分析師精力聚焦業(yè)務(wù)解讀。深度與準確性提升復(fù)雜模式識別:AI能發(fā)現(xiàn)人類難以察覺的非線性關(guān)系(如用戶行為與購買決策的隱藏關(guān)聯(lián)),提升分析深度。高精度預(yù)測:基于機器學(xué)習模型(如隨機森林、神經(jīng)網(wǎng)絡(luò))進行銷量預(yù)測、風險評估,預(yù)測準確率顯著高于傳統(tǒng)統(tǒng)計方法。非結(jié)構(gòu)化數(shù)據(jù)處理通過NLP(自然語言處理)分析文本情感、提取關(guān)鍵信息(如客戶評論中的負面反饋);通過計算機視覺識別圖像/視頻中的內(nèi)容(如從社交媒體圖片中統(tǒng)計品牌曝光量),擴展數(shù)據(jù)分析邊界。二、四大基礎(chǔ)分析方法與AI應(yīng)用描述性統(tǒng)計核心指標:集中趨勢(平均值、中位數(shù)、眾數(shù))、離散程度(標準差、極差),用于快速理解數(shù)據(jù)全貌(如分析學(xué)生考試成績的平均分、分數(shù)分布)。AI賦能:DeepSeek可自動計算統(tǒng)計指標并生成可視化圖表(如直方圖、箱線圖),直觀展示數(shù)據(jù)特征?!景咐?】利用DeepSeek進行描述性統(tǒng)計分析。案例背景:分析一家咖啡店過去30天的每日銷售數(shù)據(jù)。數(shù)據(jù)保存在文件coffee_sales.csv中,其數(shù)據(jù)字段說明如下:date:日期。daily_customers:每日顧客數(shù)。sales_volume_(cups):總銷售杯數(shù)。avg_order_value:平均訂單價值(元)。operating_hours:當日營業(yè)時長(小時)。weekday:星期幾。利用DeepSeek進行分析的步驟如下:第一步:提出分析請求并提供數(shù)據(jù)在DeepSeek中,輸入提示詞(Prompt):第二步:DeepSeek的分析輸出相關(guān)性分析核心方法:皮爾遜相關(guān)系數(shù)(衡量連續(xù)變量線性關(guān)系)、斯皮爾曼等級相關(guān)系數(shù)(衡量順序變量單調(diào)關(guān)系),用于探究變量間關(guān)聯(lián)(如廣告投入與銷售額的相關(guān)性)。AI賦能:DeepSeek生成相關(guān)系數(shù)矩陣,自動解讀強相關(guān)/弱相關(guān)關(guān)系,并結(jié)合業(yè)務(wù)場景分析內(nèi)在邏輯(如“廣告投入與網(wǎng)站訪問量呈強正相關(guān)”)。【案例9】利用DeepSeek探究影響電商平臺銷售額的關(guān)鍵因素。案例背景:假設(shè)您是一家電商公司的運營人員。公司最近在多個渠道進行了廣告投放,并一直在做促銷活動。您想了解:廣告投入和銷售額之間的關(guān)系有多強?促銷活動對銷售額的提升作用明顯嗎?網(wǎng)站訪問用戶數(shù)是影響銷售額的最直接因素嗎?這些因素之間是否存在內(nèi)在聯(lián)系?(例如,廣告投入是否也帶來了更多的網(wǎng)站訪問用戶?)為了回答這些問題,可以對公司每日的運營數(shù)據(jù)進行相關(guān)性分析。第一步:提出分析請求、提供數(shù)據(jù)并明確要求在DeepSeek中,輸入提示詞(Prompt):第二步:DeepSeek的分析輸出假設(shè)檢驗核心邏輯:通過樣本數(shù)據(jù)推斷總體差異(如A/B測試中新版UI是否顯著提升留存率),步驟包括提出假設(shè)(原假設(shè)H0:無差異;備擇假設(shè)H1:有差異)、計算p值、判斷顯著性(p<0.05則拒絕H0)。AI賦能:DeepSeek自動選擇檢驗方法(如卡方檢驗、t檢驗),輸出檢驗結(jié)果并解釋業(yè)務(wù)意義(如“新版UI的留存率顯著高于舊版,p值=0.02<0.05”)?!景咐?0】利用DeepSeek進行假設(shè)檢驗。案例背景:假設(shè)您是一家互聯(lián)網(wǎng)公司的產(chǎn)品經(jīng)理。為了提升用戶活躍度,您的團隊設(shè)計了一個新的用戶界面(UI)改版方案(我們稱之為版本B)。當前版本是版本A。核心問題:這個新設(shè)計的版本B,是否真的比當前版本A顯著地提高了用戶次日留存率?為了回答這個問題,您進行了一次A/B測試:將用戶隨機分為兩組:對照組使用版本A,試驗組使用版本B。經(jīng)過一周的測試,分別統(tǒng)計了兩組用戶的次日留存情況。A/B測試的結(jié)果數(shù)據(jù),如表5.7所示。表5.7新舊用戶界面用戶留存率的A/B測試結(jié)果組別用戶數(shù)(n)留存用戶數(shù)留存率(p)對照組(版本A)105042040.0%對照組(版本B)98046046.9從描述性統(tǒng)計來看,版本B的留存率(46.9%)比版本A(40.0%)高了6.9個百分點。但不能僅憑“版本B的留存率數(shù)值更高”就下結(jié)論,因為這可能只是隨機波動造成的。我們需要通過假設(shè)檢驗來確認這是否是“統(tǒng)計顯著”的提升。利用DeepSeek進行假設(shè)檢驗的步驟。第一步:提出分析請求、提供數(shù)據(jù)并明確檢驗方法。在DeepSeek中,輸入提示詞(Prompt):第二步:DeepSeek的分析輸出回歸分析核心類型:線性回歸(預(yù)測連續(xù)變量,如房價)、邏輯回歸(預(yù)測分類變量,如用戶是否購買)、多元回歸(分析多因素影響,如廣告投入、價格對銷售額的影響)。AI賦能:DeepSeek構(gòu)建回歸模型,輸出系數(shù)(變量影響程度)、R2(模型擬合度),并生成可視化結(jié)果(如散點圖+回歸線),幫助識別關(guān)鍵影響因素(如“房屋面積每增加100平方英尺,價格平均上漲5萬元”)?!景咐?1】利用DeepSeek進行回歸分析,預(yù)測房價并分析關(guān)鍵影響因素。案例背景:假設(shè)您是一家房地產(chǎn)科技公司的數(shù)據(jù)分析師。公司希望建立一個模型,來預(yù)測區(qū)域內(nèi)房屋的銷售價格,以便:為客戶提供準確的房價評估。幫助分析師理解影響房價的關(guān)鍵因素及其影響程度。識別那些被市場低估或高估的房產(chǎn)。數(shù)據(jù)集house_price_data.csv包含了最近一段時間內(nèi)200套房屋的銷售數(shù)據(jù)。每條數(shù)據(jù)都包含了以下特征(變量)。size_sqft:房屋面積(平方英尺),連續(xù)變量。bedrooms:臥室數(shù)量,離散變量。bathrooms:衛(wèi)生間數(shù)量,連續(xù)變量。floors:樓層數(shù),離散變量。year_built:建成年份,離散變量。has_garage:是否帶車庫(1=是,0=否),分類變量。distance_to_city_center_miles:距離市中心的英里數(shù),連續(xù)變量。price($1000):房屋售價(因變量y),單位為千美元。利用DeepSeek進行回歸分析的步驟。第一步:提出分析請求、提供數(shù)據(jù)并明確檢驗方法。在DeepSeek中,輸入提示詞(Prompt):第二步:DeepSeek的分析輸出(示例)5.5數(shù)據(jù)可視化太驚艷5.5.1數(shù)據(jù)可視化基本概念數(shù)據(jù)可視化工具(1)入門級/通用工具(無需編程):?MicrosoftExcel:最普及的工具,內(nèi)置豐富的圖表類型,適合快速創(chuàng)建基本的靜態(tài)圖表。?Tableau:業(yè)界領(lǐng)先的商業(yè)智能(BI)工具,以強大的交互性和直觀的拖拽式操作著稱,能輕松創(chuàng)建高級儀表板。?PowerBI:微軟推出的BI工具,與Microsoft生態(tài)系統(tǒng)無縫集成,功能強大且性價比高。(2)編程工具(靈活性極高):?Python語言-Matplotlib:最基礎(chǔ)、最廣泛使用的繪圖庫,高度可定制,但API較為繁瑣。-Seaborn:基于Matplotlib,提供了更高級的接口和更美觀的默認樣式,統(tǒng)計圖表功能強大。?R語言-ggplot2:基于“圖形語法”理念的強大繪圖系統(tǒng),是R語言中創(chuàng)建復(fù)雜、精美統(tǒng)計圖表的首選。5.5.2利用DeepSeek繪制圖表【案例12】利用DeepSeek(Python)繪制柱狀圖案例案例背景:假設(shè)我們需要可視化2023年某公司各季度產(chǎn)品銷售額數(shù)據(jù),繪制柱狀圖比較三種主要產(chǎn)品的銷售表現(xiàn)。第一步:提出分析請求、提供數(shù)據(jù)。在DeepSeek中,輸入提示詞(Prompt):第二步:DeepSeek的分析輸出(示例)DeepSeek會給出Python程序代碼,在Python環(huán)境下,運行該程序,得到2023年公司各季度產(chǎn)品銷售額柱狀圖此外,DeepSeek還給出2023年公司各季度產(chǎn)品銷售額柱狀圖圖表分析【案例13】利用DeepSeek(Python)繪制折線圖案例案例背景假設(shè)我們需要可視化某公司2023年全年各月的銷售額變化趨勢,并分析其增長模式和季節(jié)性特征。第一步:提出分析請求、提供數(shù)據(jù)。在DeepSeek中,輸入提示詞(Prompt):第二步:DeepSeek的分析輸出(示例)DeepSeek會給出Python程序代碼,用來繪制公司2023年全年各月的銷售額變化趨勢的折線圖。在Python環(huán)境下,運行該程序,得到某公司2023年全年各月銷售額及同比增長趨勢折線圖此外,針對該圖表,DeepSeek給出了相應(yīng)的圖表分析【案例14】利用DeepSeek(Python)繪制餅圖/環(huán)形圖案例。案例背景假設(shè)我們需要可視化某公司2023年各部門的預(yù)算分配比例,以便于管理層快速了解資源分布情況。第一步:提出分析請求、提供數(shù)據(jù)。在DeepSeek中,輸入提示詞(Prompt):第二步:DeepSeek的分析輸出(示例)DeepSeek會給出Python程序代碼,用來繪制2023年各部門預(yù)測分配比例的環(huán)形圖。在Python環(huán)境下,運行該程序,得到2023年各部門預(yù)測分配比例的環(huán)形圖【案例15】利用DeepSeek(Python)繪制散點圖案例案例背景假設(shè)我們需要分析某公司12個月中廣告投入與銷售額之間的關(guān)系,以評估廣告效果并確定最優(yōu)投入策略。第一步:提出分析請求、提供數(shù)據(jù)。在DeepSeek中,輸入提示詞(Prompt):第二步:DeepSeek的分析輸出(示例)DeepSeek會給出Python程序代碼,用來繪制廣告投入與銷售額之間關(guān)系的散點圖。在Python環(huán)境下,運行該程序,得到廣告投入與銷售額關(guān)系散點圖和按廣告類型分組的廣告投入與銷售額關(guān)系散點圖。此外,DeepSeek還給出了圖表說明及數(shù)據(jù)分析,請你嘗試自己利用DeepSeek進行分析,查看分析結(jié)果?!景咐?6】利用DeepSeek(Python)繪制直方圖案例案例背景假設(shè)我們需要分析某班級60名學(xué)生的期末數(shù)學(xué)考試成績分布,了解整體表現(xiàn)、分數(shù)段分布以及識別異常情況。第一步:提出分析請求、提供數(shù)據(jù)。在DeepSeek中,輸入提示詞(Prompt):第二步:DeepSeek的分析輸出(示例)DeepSeek會給出Python程序代碼,用來繪制學(xué)生期末數(shù)學(xué)考試成績分布的直方圖。在Python環(huán)境下,運行該程序,得到圖表。此外,DeepSeek還給出了圖表說明及數(shù)據(jù)分析,請你嘗試自己利用DeepSeek進行分析,查看分析結(jié)果?!景咐?7】利用DeepSeek(Python)繪制箱線圖案例案例背景假設(shè)我們需要分析四個不同班級(A班、B班、C班、D班)的期末數(shù)學(xué)考試成績分布,比較它們的集中趨勢、離散程度和異常值情況。第一步:提出分析請求、提供數(shù)據(jù)。在DeepSeek中,輸入提示詞(Prompt):第二步:DeepSeek的分析輸出(示例)DeepSeek會給出Python程序代碼,創(chuàng)建四個不同班級期末數(shù)學(xué)考試成績分布的箱線圖。在Python環(huán)境下,運行該程序,得到圖表。此外,DeepSeek還給出了圖表說明及數(shù)據(jù)分析,請你嘗試自己利用DeepSeek進行分析,查看分析結(jié)果。
第13次課智能編程1本次授課內(nèi)容第6章從編程助手到智能體構(gòu)建6.1智能編程入門6.2基于Trae的AI編程體驗:從0到1的奇妙躍遷6.2.1Trae國內(nèi)版安裝指南與界面功能介紹 6.2.2基于Trae的智能python編碼實踐:以冒泡排序為例 6.2.3基于Trae的智能網(wǎng)頁設(shè)計 本次課的教學(xué)目的理解智能編程的核心概念、原理和價值,以及智能編程與傳統(tǒng)編程的區(qū)別。熟悉國內(nèi)主流智能編程工具的特點和功能,掌握Trae等工具的基本使用方法。激發(fā)學(xué)生對人工智能技術(shù)的興趣和熱情,培養(yǎng)學(xué)生的創(chuàng)新思維和實踐能力本次課教學(xué)重點與難點理解智能編程的核心原理和技術(shù)實現(xiàn),如機器學(xué)習模型對代碼庫的分析和理解。掌握Trae等智能編程工具的高級功能,如行內(nèi)對話輔助開發(fā)、圖像生成網(wǎng)頁等。教學(xué)方法教學(xué)手段PPT講解演示智能編程及運行結(jié)果課堂提問討論案例實操等等課堂教學(xué)時間分配教學(xué)內(nèi)容時間分配(分)內(nèi)容講解50提問、練習30討論、習題等等10課堂教學(xué)設(shè)計PPT講解代碼演示:在Trae中演示智能代碼生成、行內(nèi)對話輔助開發(fā)等功能。軟件實操:讓學(xué)生親自下載、安裝Trae軟件,并進行賬號登錄,在實際操作中熟悉軟件界面和功能。問題引導(dǎo):引導(dǎo)學(xué)生思考和討論,加深對知識點的理解。實驗基于希冀平臺的零代碼軟件開發(fā)體驗在希冀平臺中,使用零代碼軟件開發(fā)系統(tǒng),通過提示詞表述軟件需求,使用DeepSeek-R1671B滿血版大模型生成Web應(yīng)用。實驗采用自然語言交互的方式,用戶無需掌握傳統(tǒng)編程語言,僅需通過精確的提示詞(Prompt)來表述具體的軟件功能需求、用戶界面設(shè)計要求以及業(yè)務(wù)邏輯規(guī)則任務(wù)1:待辦事項應(yīng)用任務(wù)2:天氣卡片任務(wù)3:小球碰撞模擬思考題及作業(yè)題習題1-5課程思政元素通過介紹阿里云·通義靈碼、騰訊云·CodeBuddy等國產(chǎn)智能編程工具的核心技術(shù)優(yōu)勢(如通義靈碼的毫秒級響應(yīng)速度、Trae的“AI原生”底層架構(gòu)),展現(xiàn)我國在人工智能領(lǐng)域的自主研發(fā)能力,增強學(xué)生對國產(chǎn)技術(shù)的認同感和自信心,引導(dǎo)學(xué)生關(guān)注本土科技生態(tài)的發(fā)展。結(jié)合Trae生成代碼時“需人工代碼審查以避免邏輯漏洞”的提示,強調(diào)技術(shù)應(yīng)用的審慎態(tài)度:AI是輔助工具,開發(fā)者需對最終代碼質(zhì)量和業(yè)務(wù)邏輯負責。培養(yǎng)學(xué)生在技術(shù)創(chuàng)新中堅守倫理底線,避免過度依賴技術(shù)導(dǎo)致的責任缺失,樹立“科技向善”的價值觀。教學(xué)后記課堂重點內(nèi)容詳解第一節(jié)課6.1智能編程入門智能編程的定義與核心價值:闡釋智能編程是通過AI技術(shù)輔助或自動化完成編程任務(wù)的技術(shù)手段,其核心在于利用AI算法理解開發(fā)者意圖,實現(xiàn)代碼自動生成、優(yōu)化、補全和錯誤調(diào)試等功能。強調(diào)智能編程并非取代開發(fā)者,而是將編程重心從語法實現(xiàn)轉(zhuǎn)向需求表達和架構(gòu)設(shè)計,推動技術(shù)民主化,讓編程從專業(yè)領(lǐng)域走向大眾化。智能編程與傳統(tǒng)編程的范式對比:從開發(fā)方式、技術(shù)門檻、開發(fā)效率、代碼質(zhì)量、調(diào)試維護、知識依賴和協(xié)作模式七個關(guān)鍵維度進行對比,突出智能編程自然語言驅(qū)動、低技術(shù)門檻、高開發(fā)效率等優(yōu)勢。國內(nèi)主流智能編程工具概覽阿里云·通義靈碼:介紹其基于通義大模型,覆蓋編碼全生命周期的核心功能,如智能代碼生成、研發(fā)輔助體系、場景化知識支持等,以及其技術(shù)優(yōu)勢和集成兼容性。騰訊云·AI代碼助手(CodeBuddy):說明其基于混元大模型與DeepSeek雙引擎,深度適配中國本土生態(tài)的特點,包括智能代碼生成、研發(fā)提效體系、企業(yè)級擴展和集成兼容性等功能。百度·文心快碼(ComateAIIDE):闡述其基于文心4.5Turbo與X1Turbo雙模型引擎,具備多行智能改寫、光標預(yù)測等復(fù)雜代碼編輯能力,以及全流程智能體協(xié)同、代碼優(yōu)化與維護、深度交互能力和集成適配良好等特性。字節(jié)跳動·Trae國內(nèi)版:講解其作為中國首個從底層設(shè)計的AI原生集成開發(fā)環(huán)境,通過深度集成AI能力重構(gòu)開發(fā)工具鏈,實現(xiàn)全流程智能化的核心功能,如動態(tài)協(xié)作開發(fā)、Builder模式、AI助手實時交互和免費生態(tài)兼容等。其他工具:簡要提及華為云·CodeArtsSnap、京東云·言犀代碼助手、360·智腦代碼助手和商湯科技·SenseCode等工具的特色和優(yōu)勢。6.2基于Trae的AI編程體驗:從0到1的奇妙躍遷6.2.1Trae國內(nèi)版安裝指南與界面功能介紹Trae國內(nèi)版安裝指南與界面功能介紹:詳細說明Trae的系統(tǒng)要求、下載安裝步驟、賬號登錄方式以及界面各區(qū)域的功能,如頂部菜單欄、左側(cè)文件資源管理器、中央代碼編輯器、右側(cè)的AI交互面板和控制臺輸出區(qū)域。下載安裝包:訪問Trae國內(nèi)版官方網(wǎng)站,如圖6.1所示,單擊頁面上的“立即獲取TraeIDE”按鈕。網(wǎng)站將自動檢測當前計算機的操作系統(tǒng)類型,并提供相應(yīng)的安裝包下載選項。運行安裝程序賬號登錄界面概覽6.2.2基于Trae的智能python編碼實踐:以冒泡排序為例基于Trae的智能python編碼實踐:以冒泡排序為例,展示如何使用Trae的側(cè)邊對話框智能生成代碼,以及行內(nèi)對話輔助開發(fā)功能,包括即時代碼解答、代碼優(yōu)化與錯誤修正、錯誤診斷與修正等。1.使用側(cè)邊對話框智能生成代碼在啟動TraeIDE后,通常側(cè)邊對話框會默認呈現(xiàn)。若此功能未被激活,可以使用快捷鍵(macOS:Command+U;Windows:Ctrl+U)進行開啟。在輸入?yún)^(qū)域中,可利用自然語言闡述其需求,例如:“請用Python實現(xiàn)冒泡排序算法,要求對列表進行升序排列,并添加逐輪排序過程的打印輸出。”,隨后在對話框的右下角選擇適當?shù)拇竽P?,并單擊“發(fā)送”圖標,具體操作如圖6.3所示:圖6.3Trae側(cè)邊對話框AI交互界面Trae的AI助手在思考后會生成完整的代碼并提供相應(yīng)的代碼解釋。在代碼框的右上角,單擊“添加到新文件”圖標,即可將代碼以文件形式展示于Trae的中央代碼編輯器。在中央代碼編輯器中,可以直接對Python代碼進行修改。修改完成后,單擊右上角的運行按鈕即可執(zhí)行代碼。首次執(zhí)行代碼時,需要配置本地已安裝的Python解釋器路徑(系統(tǒng)將會提示配置步驟),一旦配置完成,代碼便可以正常運行。2.行內(nèi)對話輔助開發(fā)TraeIDE的行內(nèi)對話功能(InlineChat)構(gòu)成了現(xiàn)代智能編程工具核心創(chuàng)新的關(guān)鍵部分,其在編程過程中發(fā)揮著至關(guān)重要的作用,例如:即時代碼解答功能:在編程實踐中,若對某段代碼產(chǎn)生疑問,例如對代碼的功能或?qū)崿F(xiàn)方式不理解,可以將該代碼段落選中。隨后,系統(tǒng)將提供即時的代碼解答服務(wù)。以圖6.6為例,當選中變量“swapped”時,界面上會出現(xiàn)一個對話框。通過單擊“編輯”按鈕或使用快捷鍵(在macOS系統(tǒng)中為Command+I,在Windows系統(tǒng)中為Ctrl+I),即可激活行內(nèi)對話功能。此時,開發(fā)者可以針對選中的代碼提出問題,例如詢問“這個變量的作用是什么?”Trae將直接在代碼旁邊提供解答和建議,從而允許開發(fā)者在不中斷編碼流程的情況下迅速解決問題,確保編碼工作的高效進行。圖6.6行內(nèi)對話即時代碼疑問解答代碼優(yōu)化與錯誤修正:在面對時間復(fù)雜度較高的循環(huán)代碼或其他需要改進的代碼結(jié)構(gòu)時,可以選中相關(guān)代碼段,并與Trae進行對話,提出優(yōu)化問題,例如詢問“如何優(yōu)化這段代碼?”或“如何將這個for循環(huán)轉(zhuǎn)換為列表推導(dǎo)?”Trae將能夠提供采用更高效的數(shù)據(jù)結(jié)構(gòu)或算法的建議,以提升程序的運行效率。錯誤診斷與修正:在代碼中出現(xiàn)錯誤而難以確定問題所在時,可以利用行內(nèi)對話功能選取錯誤代碼段,向Trae描述相關(guān)情況。Trae將自動分析相關(guān)上下文,識別問題的根源,并提供改進建議,甚至可能直接生成修正后的代碼,從而提高代碼質(zhì)量。第二節(jié)課6.2.3基于Trae的智能網(wǎng)頁設(shè)計基于Trae的智能網(wǎng)頁設(shè)計:介紹利用Trae的側(cè)邊對話框智能構(gòu)建個人網(wǎng)站、優(yōu)化現(xiàn)有網(wǎng)頁以及從圖像到網(wǎng)頁的自動化布局設(shè)計技術(shù),包括創(chuàng)建項目文件夾、輸入需求生成代碼、優(yōu)化網(wǎng)頁內(nèi)容和布局、上傳圖像生成網(wǎng)頁等步驟。利用側(cè)邊對話框智能構(gòu)建個人網(wǎng)站在著手開發(fā)網(wǎng)頁之前,首先應(yīng)創(chuàng)建一個文件夾以存放項目相關(guān)文件,例如可命名為“C:\個人網(wǎng)站”。隨后啟動TraeIDE,單擊“打開文件夾”選項,如圖6.7所示。接著選擇之前創(chuàng)建的文件夾“C:\個人網(wǎng)站”,此時TraeIDE將在其界面左側(cè)展示資源管理器窗口,如圖6.7所示。圖6.7TraeIDE文件操作入口圖6.7TraeIDE資源管理器在右側(cè)的對話框中輸入網(wǎng)頁需求,比如“生成一個個人網(wǎng)頁,網(wǎng)頁內(nèi)容包括自我介紹,學(xué)歷,興趣愛好,個人專長等”,如圖6.9所示,隨后單擊“發(fā)送”按鈕。圖6.9TraeIDE網(wǎng)頁設(shè)計需求輸入界面Trae經(jīng)過思考后,生成index.html文件。單擊網(wǎng)頁編輯器右上角的“應(yīng)用”按鈕,系統(tǒng)將自動在中央代碼編輯器區(qū)域生成網(wǎng)頁代碼,具體情形如圖所示。中央代碼編輯器生成代碼界面在單擊“接受”按鈕之后,系統(tǒng)將會在“C:\個人網(wǎng)站”目錄下自動創(chuàng)建一個index.html文件,用戶可隨時訪問該文件以預(yù)覽網(wǎng)頁效果。必須指出的是,由于基于人工智能技術(shù)的生成特性,每次產(chǎn)生的頁面內(nèi)容可能會有所差異。例如,頁面元素的布局、色彩搭配以及某些動態(tài)效果等方面,均可能出現(xiàn)不同的展現(xiàn)形式,這也為網(wǎng)頁設(shè)計引入了一定程度的靈活性與多樣性。網(wǎng)頁優(yōu)化與編輯:借助TraeAI提升現(xiàn)有項目針對已經(jīng)創(chuàng)建完成的網(wǎng)頁“index.html”,可以借助Trae工具進行優(yōu)化。啟動TraeIDE,單擊界面上的“文件”選項,在彈出的下拉菜單中選擇“打開文件夾”選項,定位至網(wǎng)頁所在的文件夾,例如,“C:\個人網(wǎng)站”文件夾。選定目標文件夾后,單擊“確定”按鈕,Trae將載入選定文件夾內(nèi)的所有文件??梢栽谧髠?cè)的“資源管理器”中查看并編輯網(wǎng)頁的HTML、CSS、JavaScript等文件。若需更新學(xué)歷背景信息,可在右側(cè)對話框中輸入相應(yīng)的新資料,具體操作可參照圖6.13:圖6.13輸入學(xué)歷更新信息的操作界面Trae經(jīng)過思考后,會提出優(yōu)化建議,如圖6.14所示:圖6.14Trae優(yōu)化建議的界面單擊右上角的“應(yīng)用”按鈕,Trae自動將優(yōu)化建議整合至index.html文件,并在編輯器中以高亮色塊的形式突出顯示修改的部分,如圖6.15所示。這種視覺化的標注方法使得代碼的變更變得清晰可見,有助于開發(fā)者迅速驗證優(yōu)化成果。圖6.15Trae整合優(yōu)化建議界面單擊“接受”按鈕后,系統(tǒng)將對index.html文件實施代碼修改,隨后打開該文件即可觀察到更新后的網(wǎng)頁效果。除了對網(wǎng)頁內(nèi)容進行調(diào)整,亦可對網(wǎng)頁的布局及互動性進行優(yōu)化。例如,在右側(cè)的對話框中輸入指令:“將整個網(wǎng)頁的布局調(diào)整為四行,每行分別設(shè)置為3、2、3、3列”,“添加一個個人照片輪播區(qū)域”等。從圖像到網(wǎng)頁:Trae的自動化布局設(shè)計技術(shù)Trae能夠依據(jù)上傳的網(wǎng)頁布局圖像進行網(wǎng)頁設(shè)計。通過采用CNN(卷積神經(jīng)網(wǎng)絡(luò))架構(gòu),Trae對上傳圖像的視覺層次結(jié)構(gòu)進行分析,自動識別出常見的用戶界面組件,例如導(dǎo)航欄、卡片容器、表單字段等,其準確率高達92%。此外,Trae還支持響應(yīng)式布局的識別,能夠區(qū)分柵格系統(tǒng)、彈性布局等現(xiàn)代設(shè)計模式。若存在網(wǎng)頁布局圖像(可以是現(xiàn)有的網(wǎng)頁圖或繪制的草圖,若標注間距則有助于制作出更為精確的頁面),無論是創(chuàng)建新的網(wǎng)頁,還是對現(xiàn)有的“index.html”網(wǎng)頁進行重新布局,均可在右側(cè)對話框中單擊“圖片”選項上傳該布局圖,隨后用文字描述修改信息,如圖6.17所示。圖6.17基于圖像內(nèi)容自動生成網(wǎng)頁布局的交互操作示意圖Trae
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026廣東汕尾市水務(wù)集團有限公司招聘5人參考考試題庫附答案解析
- 2026山東濟寧金鄉(xiāng)縣事業(yè)單位招聘初級綜合類崗位人員參考考試試題附答案解析
- 2026廣達鐵路工程集團有限公司招聘2人(江蘇)參考考試題庫附答案解析
- 生產(chǎn)技術(shù)分析制度
- 生產(chǎn)單位門衛(wèi)管理制度
- 生產(chǎn)安全保衛(wèi)管理制度
- 鄉(xiāng)村安全生產(chǎn)制度范本
- 嚴格落實生產(chǎn)管理制度
- 食品生產(chǎn)包材庫管理制度
- 家具生產(chǎn)管理制度范本
- 2025年浙江省委黨校在職研究生招生考試(社會主義市場經(jīng)濟)歷年參考題庫含答案詳解(5卷)
- DB3704∕T0052-2024 公園城市建設(shè)評價規(guī)范
- JJG 264-2025 谷物容重器檢定規(guī)程
- 采購領(lǐng)域廉潔培訓(xùn)課件
- 公司股東入股合作協(xié)議書
- 2025年中國化妝品注塑件市場調(diào)查研究報告
- 小兒藥浴治療
- 保險實務(wù)課程設(shè)計
- 物業(yè)管理公司管理目標標準
- 2023年重慶巴南區(qū)重點中學(xué)指標到校數(shù)學(xué)試卷真題(答案詳解)
- JBT 12530.3-2015 塑料焊縫無損檢測方法 第3部分:射線檢測
評論
0/150
提交評論