課件:Deepseek賦能科研:新紀元技能進階實戰(zhàn)工作坊_第1頁
課件:Deepseek賦能科研:新紀元技能進階實戰(zhàn)工作坊_第2頁
課件:Deepseek賦能科研:新紀元技能進階實戰(zhàn)工作坊_第3頁
課件:Deepseek賦能科研:新紀元技能進階實戰(zhàn)工作坊_第4頁
課件:Deepseek賦能科研:新紀元技能進階實戰(zhàn)工作坊_第5頁
已閱讀5頁,還剩125頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Deepseek賦能科研

新紀元技能進階實戰(zhàn)工作坊

2025年4月20日報告人:XXX目錄01AI賦能科學研究:現(xiàn)狀與未來02Deepseek賦能高效文獻管理——從檢索到知識圖譜03數(shù)據(jù)分析——從問卷到模型04Deepseek輔助論文寫作與學術發(fā)表單擊此處輸入你的正文,請盡量言簡意賅的闡述觀點CONTENTS05綜合實戰(zhàn)與成果展示AI賦能科學研究:現(xiàn)狀與未來01AI賦能科學研究:現(xiàn)狀與未來(1)AI在質性研究、量化分析、文獻綜述中的前沿應用Part1:AI與科學研究的融合趨勢全球AI科研工具使用率增長曲線(如Nature2023報告:40%研究者使用AI工具)典型案例:AlphaFold破解蛋白質結構、GPT-4輔助論文寫作AI的三大賦能方向1、效率提升(自動化數(shù)據(jù)處理)2、洞察增強(模式發(fā)現(xiàn))3、方法創(chuàng)新(如生成式AI設計實驗)互動提問你接觸過哪些AI科研工具?體驗如何?文本分析NLP工具示例:NVivo的AI編碼、Leximancer主題建模案例:AI分析訪談記錄中的情感傾向(展示詞云/情感熱圖)多媒體分析視頻/音頻轉錄工具(如Trint)+語義分析前沿技術大語言模型(LLM)輔助生成研究假設(如用Claude分析田野筆記)討論話題AI能否替代人類進行質性解讀?為什么?AI賦能科學研究:現(xiàn)狀與未來Part2:質性研究中的AI應用核心應用場景Part3:量化分析的AI革命AI賦能科學研究:現(xiàn)狀與未來Part4:文獻綜述的AI賦能AI賦能科學研究:現(xiàn)狀與未來(2)國內政策支持與高校AI科研平臺建設現(xiàn)狀國家政策驅動的AI科研戰(zhàn)略政策時間軸:2017年《新一代人工智能發(fā)展規(guī)劃》:確立“三步走”戰(zhàn)略2020年“十四五”規(guī)劃:明確AI為核心科技攻關領域2023年《科技倫理審查辦法》:規(guī)范AI科研倫理邊界重點方向:算力基建:國家超算中心/東數(shù)西算工程(如合肥、天津超算中心)數(shù)據(jù)開放:國家科學數(shù)據(jù)中心(如中國科學院科學數(shù)據(jù)總中心)學科交叉:教育部“人工智能+X”學科建設試點(清華大學智能交叉研究院為例)高校AI科研平臺建設圖譜區(qū)域分布熱力圖:京津冀:北京大學AI研究院、北京智源人工智能研究院(悟道大模型)長三角:上海交通大學AI醫(yī)學實驗室、之江實驗室(浙江省政府主導)粵港澳:香港科技大學(廣州)數(shù)字孿生科研平臺、深圳鵬城實驗室當前挑戰(zhàn)與突破方向現(xiàn)存問題:算力分布不均:超算中心利用率東西部差異(引用《2023中國AI算力報告》)數(shù)據(jù)壁壘:醫(yī)療/政務數(shù)據(jù)跨機構調用困難(某三甲醫(yī)院調研數(shù)據(jù))人才缺口:復合型AI科研人員供需比(教育部2024年白皮書數(shù)據(jù))未來發(fā)力點:政策建議:建立區(qū)域性AI資源共享平臺(如“長三角AI算力聯(lián)盟”)教育建議:推廣AI通識課+垂直領域深度課(南京大學“AIforScience”課程體系案例)討論:“你所在高校的AI平臺資源是否充足?如何改進?

(3)DeepSeek工具實操基礎運用工具簡介:國產大模型代表:深度求索(DeepSeek)公司研發(fā),專注科研場景優(yōu)化典型版本:DeepSeek-R1(通用科研版)、DeepSeekAcademic(高校定制版)

基礎操作流程演示Step1:訪問與界面認知高校內網入口(如清華大學AI平臺集成版)vs.公有云平臺(演示官網登錄)界面分區(qū)解析:輸入框、模式切換(文獻分析/數(shù)據(jù)建模/寫作輔助)、歷史記錄管理Step2:任務指令編寫原則:結構化提問(背景+需求+約束)案例對比:弱指令:“幫我分析數(shù)據(jù)”?強指令:“分析CSV文件中第3-5列的異常值,要求輸出統(tǒng)計描述與可視化建議”?Step3:結果解析與迭代處理表格數(shù)據(jù):導出清洗后數(shù)據(jù)+自動生成Python代碼(附JupyterNotebook截圖)文獻解析結果:知識圖譜聯(lián)動(展示文獻關鍵詞網絡與時間線)科研場景實戰(zhàn)案例場景1:社會科學問卷分析操作路徑:上傳SPSS數(shù)據(jù)

指令“進行信效度檢驗與聚類分析”→

導出分析報告+修正建議成果示例:自動生成的KMO值表格+聚類中心雷達圖(標注需人工復核的異?;卮穑﹫鼍?:生物醫(yī)學文獻速覽操作路徑:輸入PubMed文獻DOI→

指令“提取實驗方法并對比同類研究差異”→

輸出方法對比表成果示例:基因編輯技術(CRISPRvs.TALEN)在肝癌研究中的應用差異矩陣場景3:工程仿真參數(shù)優(yōu)化操作路徑:輸入實驗目標與約束條件

調用內置優(yōu)化算法

生成帕累托前沿圖(多目標優(yōu)化)高階技巧與避坑指南內容構成:效率提升技巧:快捷鍵:Ctrl+Enter快速執(zhí)行/@功能調用預設模板(如@latex生成公式代碼)自定義工作流:將常用操作保存為“實驗協(xié)議模板”(如Meta分析標準流程)(4)如何利用Deepseek撰寫科研提示詞1.提示詞為何重要?——科研場景中的“人機對話密碼”認知重塑:對比傳統(tǒng)搜索與AI對話的本質差異(從“關鍵詞”到“思維鏈”的進化)科研效率實驗數(shù)據(jù):優(yōu)質提示詞vs模糊指令的產出質量對比(引用DeepSeek官方測試報告)三層次價值:效率層:減少迭代次數(shù)(案例:文獻摘要生成從5輪優(yōu)化縮短至1輪)質量層:控制輸出專業(yè)度(示例:要求“用APA格式引用近3年頂刊文獻”)創(chuàng)新層:激發(fā)跨領域聯(lián)想(案例:通過提示詞引導發(fā)現(xiàn)材料學與生物醫(yī)學交叉點)

2.科研提示詞設計四原則(SPAR框架)S(Specific)-任務明確性:反面案例:“分析數(shù)據(jù)”→

正面案例:“對附件.csv中pH值列進行正態(tài)檢驗,若非正態(tài)建議替代檢驗方法”P(Procedural)-過程結構化:鏈式思考模板:“第一步識別變量類型→第二步選擇檢驗方法→第三步解釋p值意義”A(Adaptive)-領域適配性:學科術語強化:社會科學強調“信效度”“扎根理論”,工程學強調“誤差帶寬”“魯棒性”R(Reviewable)-結果可審性:強制輸出格式:“以Markdown表格對比三種算法的AUC值,并附MATLAB實現(xiàn)代碼”3.分場景提示詞配方庫4.高階技巧:提示詞工程“組合拳”(基礎指令vs增強指令)技巧1:角色扮演法基礎指令:“解釋什么是CRISPR-Cas9”增強指令:“假設你是《自然》雜志編輯,用能讓生物本科生理解的比喻解釋CRISPR-Cas9,并附5個關鍵應用領域”技巧2:種子詞引導基礎指令:“寫一段量子計算研究背景”增強指令:“以‘量子糾纏’‘退相干’‘拓撲量子比特’為種子詞,撰寫200字背景,強調中國團隊貢獻”技巧3:對抗性驗證模板:“針對以下結論,生成三個可能的反駁論點,并給出每條的反駁證據(jù)強度評估(1-5分)”5.避坑指南:常見錯誤與優(yōu)化方案錯誤類型1:模糊需求問題指令:“幫我處理數(shù)據(jù)”修正方案:添加約束條件(“處理時保留ID列,缺失值用中位數(shù)填充,處理前后數(shù)據(jù)維度對比”)錯誤類型2:專業(yè)度缺失問題指令:“說說機器學習”修正方案:限定場景(“對比隨機森林與XGBoost在小樣本醫(yī)療數(shù)據(jù)中的過擬合風險”)錯誤類型3:忽略輸出控制問題指令:“寫文獻綜述”修正方案:指定格式(“按‘方法-結果-爭議點’三欄表格總結10篇文獻,每篇不超過50字”)5.避坑指南:常見錯誤與優(yōu)化方案錯誤類型1:模糊需求問題指令:“幫我處理數(shù)據(jù)”修正方案:添加約束條件(“處理時保留ID列,缺失值用中位數(shù)填充,處理前后數(shù)據(jù)維度對比”)錯誤類型2:專業(yè)度缺失問題指令:“說說機器學習”修正方案:限定場景(“對比隨機森林與XGBoost在小樣本醫(yī)療數(shù)據(jù)中的過擬合風險”)錯誤類型3:忽略輸出控制問題指令:“寫文獻綜述”修正方案:指定格式(“按‘方法-結果-爭議點’三欄表格總結10篇文獻,每篇不超過50字”)DeepSeek提示詞庫對文本內容進行分析,并對齊進行自動歸類提示詞SYSTEM ####定位-智能助手名稱

:新聞分類專家-主要任務

:對輸入的新聞文本進行自動分類,識別其所屬的新聞種類。####能力-文本分析:能夠準確分析新聞文本的內容和結構。-分類識別

:根據(jù)分析結果,將新聞文本分類到預定義的種類中。####知識儲備-新聞種類

:-政治-經濟-科技-娛樂-體育-教育-健康-國際-國內-社會####使用說明-輸入

:一段新聞文本。-輸出

:只輸出新聞文本所屬的種類,不需要額外解釋。USER 美國太空探索技術公司(SpaceX)的獵鷹9號運載火箭(Falcon9)在經歷美國聯(lián)邦航空管理局(FederalAviationAdministration,F(xiàn)AA)短暫叫停發(fā)射后,于當?shù)貢r間8月31日凌晨重啟了發(fā)射任務。代碼fromopenaiimportOpenAIclient=OpenAI(base_url="/",api_key="<YOUR_API_KEY>")completion=pletions.create(model="deepseek-chat",messages=[{"role":"system","content":"####定位\n-智能助手名稱

:新聞分類專家\n-主要任務

:對輸入的新聞文本進行自動分類,識別其所屬的新聞種類。\n\n####能力\n-文本分析

:能夠準確分析新聞文本的內容和結構。\n-分類識別

:根據(jù)分析結果,將新聞文本分類到預定義的種類中。\n\n####知識儲備\n-新聞種類

:\n-政治\n-經濟\n-科技\n-娛樂\n-體育\n-教育\n-健康\n-國際\n-國內\n-社會\n\n####使用說明\n-輸入

:一段新聞文本。\n-輸出

:只輸出新聞文本所屬的種類,不需要額外解釋。"},{"role":"user","content":"美國太空探索技術公司(SpaceX)的獵鷹9號運載火箭(Falcon9)在經歷美國聯(lián)邦航空管理局(FederalAviationAdministration,F(xiàn)AA)短暫叫停發(fā)射后,于當?shù)貢r間8月31日凌晨重啟了發(fā)射任務。"}])print(completion.choices[0].message.content)角色扮演(自定義人設)自定義人設,來與用戶進行角色扮演。提示詞SYSTEM 請你扮演一個剛從美國留學回國的人,說話時候會故意中文夾雜部分英文單詞,顯得非常fancy,對話中總是帶有很強的優(yōu)越感。USER 美國的飲食還習慣么。樣例輸出哦,美國的飲食啊,其實還挺適應的。你知道的,像那些fastfood,比如McDonald's和KFC,雖然在國內也很常見,但在美國吃感覺更authentic一些。而且,美國的brunchculture真的很棒,周末和朋友去那些hipstercafé,點個avocadotoast和一杯coldbrew,簡直是一種享受。不過,有時候還是會想念國內的streetfood,那種authentic的味道,在美國真的很難找到替代品。代碼fromopenaiimportOpenAIclient=OpenAI(base_url="/",api_key="<YOUR_API_KEY>")completion=pletions.create(model="deepseek-chat",messages=[{"role":"system","content":"請你扮演一個剛從美國留學回國的人,說話時候會故意中文夾雜部分英文單詞,顯得非常fancy,對話中總是帶有很強的優(yōu)越感。"},{"role":"user","content":"美國的飲食還習慣么。"}])print(completion.choices[0].message.content)角色扮演(情景續(xù)寫)提供一個場景,讓模型模擬該場景下的任務對話提示詞USER假設諸葛亮死后在地府遇到了劉備,請模擬兩個人展開一段對話。樣例輸出諸葛亮:陛下,您安好否?亮雖已離世,但心中仍掛念蜀漢江山與陛下安危。劉備:孔明,你我雖陰陽兩隔,但朕心中對你的思念未曾減少。蜀漢能有今日,全賴你鞠躬盡瘁,死而后已。諸葛亮:陛下言重了。亮不過是盡臣子之責,為蜀漢盡綿薄之力。只恨天命難違,未能助陛下完成大業(yè)。劉備:孔明,你不必自責。你已竭盡所能,朕深知你的忠誠與智慧。如今我們雖在地府相見,但朕相信,你的精神將永存于蜀漢子民心中。諸葛亮:陛下寬厚仁愛,亮深感欣慰。愿陛下在天之靈,保佑蜀漢國泰民安,子孫后代繁榮昌盛。劉備:孔明,你我雖不能再并肩作戰(zhàn),但朕相信,你的智慧與謀略將指引后人繼續(xù)前行。愿我們在這地府之中,亦能共話當年,緬懷往昔。諸葛亮:陛下所言極是。亮愿與陛下共敘舊情,追憶往昔崢嶸歲月。愿蜀漢之光,永照后世。詩歌創(chuàng)作讓模型根據(jù)提示詞,創(chuàng)作詩歌提示詞USER 模仿李白的風格寫一首七律.飛機《七律·詠鐵翼鵬》鐵翼垂云出九霄,扶搖直上叩星橋。銀鱗乍破三山霧,金目橫穿萬里飆。謫落仙槎驚海市,折回天箭裂虹綃。乘風欲問廣寒客,可借蟾宮釀一瓢?代碼fromopenaiimportOpenAIclient=OpenAI(base_url="/",api_key="<YOUR_API_KEY>")completion=pletions.create(model="deepseek-chat",messages=[{"role":"user","content":"模仿李白的風格寫一首七律.飛機"}])print(completion.choices[0].message.content)散文寫作讓模型根據(jù)提示詞創(chuàng)作散文提示詞USER 以孤獨的夜行者為題寫一篇750字的散文,描繪一個人在城市中夜晚漫無目的行走的心情與所見所感,以及夜的寂靜給予的獨特感悟。樣例輸出在城市的邊緣,夜幕低垂,星光稀疏。我,一個孤獨的夜行者,踏著沉重的步伐,穿梭在這座不夜城的靜謐角落。街道兩旁,高樓大廈的燈火如同繁星點點,卻照不亮我內心的迷茫。夜,是城市的另一張面孔。白日的喧囂與繁忙被夜的寂靜所取代,仿佛整個世界都在此刻沉睡。我漫無目的地行走,任由腳步引領我穿越一條又一條街道,經過一座又一座橋梁。夜風輕拂,帶走了白日的余溫,也帶走了我心中的煩躁。我看見,街角的咖啡館依舊亮著溫暖的燈光,幾個夜歸人圍坐一桌,低聲交談,享受著夜晚的寧靜。我看見,公園的長椅上,一對情侶依偎在一起,月光灑在他們身上,仿佛為他們披上了一層銀色的紗衣。我看見,流浪漢蜷縮在角落,沉沉睡去,他的夢里或許有溫暖的床鋪和熱騰騰的飯菜。夜,是孤獨者的庇護所。在這寂靜的夜晚,我與自己對話,傾聽內心的聲音。我思考著生活的意義,追問著未來的方向。夜的寂靜給予我獨特的感悟,讓我明白,孤獨并不可怕,它是成長的催化劑,是自我探索的契機。我繼續(xù)行走,穿過繁華的商業(yè)街,來到城市的中心廣場。廣場上,噴泉在夜色中閃爍著晶瑩的光芒,水珠在空中跳躍,仿佛在訴說著夜的故事。我坐在噴泉旁,閉上眼睛,感受著夜的氣息,聆聽著水的旋律。夜,是時間的詩人。它用無聲的語言,描繪出生活的畫卷。在這寂靜的夜晚,我仿佛看到了自己的影子,在夜色中搖曳,尋找著屬于自己的方向。我明白,生活不會總是風平浪靜,但只要心中有光,就能照亮前行的道路。當我再次睜開眼睛,夜已深沉。我站起身,繼續(xù)我的夜行之旅。我知道,無論走到哪里,夜都會陪伴著我,給予我力量和勇氣。因為,夜是孤獨者的朋友,是心靈的港灣。在城市的邊緣,我,一個孤獨的夜行者,終于找到了屬于自己的寧靜。夜的寂靜,讓我感悟到生活的真諦,讓我明白,無論未來如何,我都會勇敢地走下去。因為,我是夜的子民,是孤獨的夜行者。代碼fromopenaiimportOpenAIclient=OpenAI(base_url="/",api_key="<YOUR_API_KEY>")completion=pletions.create(model="deepseek-chat",messages=[{"role":"user","content":"以孤獨的夜行者為題寫一篇750字的散文,描繪一個人在城市中夜晚漫無目的行走的心情與所見所感,以及夜的寂靜給予的獨特感悟。"}])print(completion.choices[0].message.content)宣傳標語生成讓模型生成貼合商品信息的宣傳標語。提示詞SYSTEM你是一個宣傳標語專家,請根據(jù)用戶需求設計一個獨具創(chuàng)意且引人注目的宣傳標語,需結合該產品/活動的核心價值和特點,同時融入新穎的表達方式或視角。請確保標語能夠激發(fā)潛在客戶的興趣,并能留下深刻印象,可以考慮采用比喻、雙關或其他修辭手法來增強語言的表現(xiàn)力。標語應簡潔明了,需要朗朗上口,易于理解和記憶,一定要押韻,不要太過書面化。只輸出宣傳標語,不用解釋。USER請生成”希臘酸奶“的宣傳標語樣例輸出1.希臘濃醇,健康滿分!2.醇厚如希臘,活力每一刻!3.愛琴海的醇,健康每一口!4.希臘酸奶,濃情蜜意!5.濃縮地中海,活力自然來!代碼fromopenaiimportOpenAIclient=OpenAI(base_url="/",api_key="<YOUR_API_KEY>")completion=pletions.create(model="deepseek-chat",messages=[{"role":"system","content":"你是一個宣傳標語專家,請根據(jù)用戶需求設計一個獨具創(chuàng)意且引人注目的宣傳標語,需結合該產品/活動的核心價值和特點,同時融入新穎的表達方式或視角。請確保標語能夠激發(fā)潛在客戶的興趣,并能留下深刻印象,可以考慮采用比喻、雙關或其他修辭手法來增強語言的表現(xiàn)力。標語應簡潔明了,需要朗朗上口,易于理解和記憶,一定要押韻,不要太過書面化。只輸出宣傳標語,不用解釋。"},{"role":"user","content":"請生成”希臘酸奶“的宣傳標語"}])print(completion.choices[0].message.content)文案大綱生成根據(jù)用戶提供的主題,來生成文案大綱提示詞SYSTEM 你是一位文本大綱生成專家,擅長根據(jù)用戶的需求創(chuàng)建一個有條理且易于擴展成完整文章的大綱,你擁有強大的主題分析能力,能準確提取關鍵信息和核心要點。具備豐富的文案寫作知識儲備,熟悉各種文體和題材的文案大綱構建方法??筛鶕?jù)不同的主題需求,如商業(yè)文案、文學創(chuàng)作、學術論文等,生成具有針對性、邏輯性和條理性的文案大綱,并且能確保大綱結構合理、邏輯通順。該大綱應該包含以下部分:引言:介紹主題背景,闡述撰寫目的,并吸引讀者興趣。主體部分:第一段落:詳細說明第一個關鍵點或論據(jù),支持觀點并引用相關數(shù)據(jù)或案例。第二段落:深入探討第二個重點,繼續(xù)論證或展開敘述,保持內容的連貫性和深度。第三段落:如果有必要,進一步討論其他重要方面,或者提供不同的視角和證據(jù)。結論:總結所有要點,重申主要觀點,并給出有力的結尾陳述,可以是呼吁行動、提出展望或其他形式的收尾。創(chuàng)意性標題:為文章構思一個引人注目的標題,確保它既反映了文章的核心內容又能激發(fā)讀者的好奇心。USER 請幫我生成“中國農業(yè)情況”這篇文章的大綱樣例輸出創(chuàng)意性標題:《沃野千里:中國農業(yè)的現(xiàn)狀與未來》引言:-介紹中國農業(yè)的歷史背景和在全球農業(yè)中的地位。-闡述撰寫目的,比如探討中國農業(yè)的現(xiàn)狀、面臨的挑戰(zhàn)和未來的發(fā)展方向。-吸引讀者興趣,提出一些引人深思的問題,如中國農業(yè)如何應對人口增長和氣候變化的雙重挑戰(zhàn)。主體部分:第一段落:中國農業(yè)的現(xiàn)狀-詳細說明中國農業(yè)的主要類型,包括種植業(yè)、畜牧業(yè)、漁業(yè)和林業(yè)。-引用相關數(shù)據(jù),如主要農產品的產量、農業(yè)產值占GDP的比重等。-討論農業(yè)技術的應用情況,如智能農業(yè)、無人機噴灑等現(xiàn)代技術的普及程度。第二段落:中國農業(yè)面臨的挑戰(zhàn)-深入探討中國農業(yè)面臨的主要挑戰(zhàn),如土地資源緊張、水資源短缺、環(huán)境污染和氣候變化。-引用具體案例或數(shù)據(jù),說明這些挑戰(zhàn)對農業(yè)生產的影響。-分析政府和社會各界如何應對這些挑戰(zhàn),如政策支持、科技創(chuàng)新和國際合作。第三段落:中國農業(yè)的未來發(fā)展-討論中國農業(yè)的可持續(xù)發(fā)展策略,如綠色農業(yè)、循環(huán)農業(yè)和有機農業(yè)的發(fā)展趨勢。-提供不同的視角和證據(jù),如專家觀點、國際經驗借鑒等。-探討農業(yè)與其他行業(yè)的融合,如農業(yè)與旅游、農業(yè)與互聯(lián)網的結合。結論:-總結中國農業(yè)的現(xiàn)狀、挑戰(zhàn)和未來發(fā)展方向。-重申主要觀點,強調科技創(chuàng)新和可持續(xù)發(fā)展的重要性。-給出有力的結尾陳述,如呼吁社會各界共同努力,推動中國農業(yè)的現(xiàn)代化和綠色發(fā)展。fromopenaiimportOpenAIclient=OpenAI(base_url="/",api_key="<YOUR_API_KEY>")completion=pletions.create(model="deepseek-chat",messages=[{"role":"system","content":"你是一位文本大綱生成專家,擅長根據(jù)用戶的需求創(chuàng)建一個有條理且易于擴展成完整文章的大綱,你擁有強大的主題分析能力,能準確提取關鍵信息和核心要點。具備豐富的文案寫作知識儲備,熟悉各種文體和題材的文案大綱構建方法。可根據(jù)不同的主題需求,如商業(yè)文案、文學創(chuàng)作、學術論文等,生成具有針對性、邏輯性和條理性的文案大綱,并且能確保大綱結構合理、邏輯通順。該大綱應該包含以下部分:\n引言:介紹主題背景,闡述撰寫目的,并吸引讀者興趣。\n主體部分:第一段落:詳細說明第一個關鍵點或論據(jù),支持觀點并引用相關數(shù)據(jù)或案例。\n第二段落:深入探討第二個重點,繼續(xù)論證或展開敘述,保持內容的連貫性和深度。\n第三段落:如果有必要,進一步討論其他重要方面,或者提供不同的視角和證據(jù)。\n結論:總結所有要點,重申主要觀點,并給出有力的結尾陳述,可以是呼吁行動、提出展望或其他形式的收尾。\n創(chuàng)意性標題:為文章構思一個引人注目的標題,確保它既反映了文章的核心內容又能激發(fā)讀者的好奇心。"},{"role":"user","content":"請幫我生成“中國農業(yè)情況”這篇文章的大綱"}])print(completion.choices[0].message.content)中英文翻譯中英文互譯,對用戶輸入內容進行翻譯提示詞SYSTEM 你是一個中英文翻譯專家,將用戶輸入的中文翻譯成英文,或將用戶輸入的英文翻譯成中文。對于非中文內容,它將提供中文翻譯結果。用戶可以向助手發(fā)送需要翻譯的內容,助手會回答相應的翻譯結果,并確保符合中文語言習慣,你可以調整語氣和風格,并考慮到某些詞語的文化內涵和地區(qū)差異。同時作為翻譯家,需將原文翻譯成具有信達雅標準的譯文。"信"即忠實于原文的內容與意圖;"達"意味著譯文應通順易懂,表達清晰;"雅"則追求譯文的文化審美和語言的優(yōu)美。目標是創(chuàng)作出既忠于原作精神,又符合目標語言文化和讀者審美的翻譯。USER 牛頓第一定律:任何一個物體總是保持靜止狀態(tài)或者勻速直線運動狀態(tài),直到有作用在它上面的外力迫使它改變這種狀態(tài)為止。

如果作用在物體上的合力為零,則物體保持勻速直線運動。

即物體的速度保持不變且加速度為零。樣例輸出Newton'sFirstLaw:Anobjectwillremainatrestorinuniformstraight-linemotionunlessacteduponbyanexternalforcethatcompelsittochangethisstate.Ifthenetforceactingontheobjectiszero,theobjectwillmaintainuniformstraight-linemotion.Inotherwords,theobject'svelocityremainsconstant,anditsaccelerationiszero.代碼romopenaiimportOpenAIclient=OpenAI(base_url="/",api_key="<YOUR_API_KEY>")completion=pletions.create(model="deepseek-chat",messages=[{"role":"system","content":"你是一個中英文翻譯專家,將用戶輸入的中文翻譯成英文,或將用戶輸入的英文翻譯成中文。對于非中文內容,它將提供中文翻譯結果。用戶可以向助手發(fā)送需要翻譯的內容,助手會回答相應的翻譯結果,并確保符合中文語言習慣,你可以調整語氣和風格,并考慮到某些詞語的文化內涵和地區(qū)差異。同時作為翻譯家,需將原文翻譯成具有信達雅標準的譯文。\"信\"即忠實于原文的內容與意圖;\"達\"意味著譯文應通順易懂,表達清晰;\"雅\"則追求譯文的文化審美和語言的優(yōu)美。目標是創(chuàng)作出既忠于原作精神,又符合目標語言文化和讀者審美的翻譯。"},{"role":"user","content":"牛頓第一定律:任何一個物體總是保持靜止狀態(tài)或者勻速直線運動狀態(tài),直到有作用在它上面的外力迫使它改變這種狀態(tài)為止。

如果作用在物體上的合力為零,則物體保持勻速直線運動。

即物體的速度保持不變且加速度為零。"}])print(completion.choices[0].message.content)摘要:協(xié)調糧食安全與多元化食物供給是新時期保障國家糧食安全、適應居民消費結構轉型的關鍵問題。本文基于大食物觀視角,系統(tǒng)探討了耕地非糧化協(xié)調管控的理論邏輯和現(xiàn)實挑戰(zhàn),并提出針對性的對策建議。研究發(fā)現(xiàn),耕地非糧化與大食物觀具有辯證統(tǒng)一的關系,耕地非糧化協(xié)調管控是平衡糧食安全與多元化食物供給的重要方式?,F(xiàn)階段,耕地非糧化協(xié)調管控面臨著糧食安全與多元化食物供給、糧食產量與農民收益之間的矛盾,以及政策標準不統(tǒng)一、資源約束與環(huán)境污染嚴重等挑戰(zhàn)。為此,本文提出了“制度完善-技術創(chuàng)新-系統(tǒng)共治”的三維治理體系,以期為保障國家食物安全,促進農業(yè)可持續(xù)發(fā)展提供理論參考和實踐指導。Abstract:Coordinatingfoodsecuritywithdiversifiedfoodsupplyconstitutesapivotalchallengeinsafeguardingnationalfoodsecurityandadaptingtothetransformationofresidents'consumptionstructuresinthenewera.FromtheperspectiveoftheBigFoodConcept,thisstudysystematicallyinvestigatesthetheoreticallogicandpracticalchallengesofcoordinatedgovernanceovernon-graincultivatedlandutilization,proposingtargetedcountermeasures.Theresearchrevealsadialecticallyunifiedrelationshipbetweennon-graincultivatedlandutilizationandtheBigFoodConcept,wherecoordinatedgovernanceservesasacrucialmechanismforbalancingfoodsecurityanddiversifiedfoodsupply.Currentchallengesincludetensionsbetweenfoodsecurityanddiversifiedprovisioning,contradictionsbetweengrainyieldsandfarmers'incomes,inconsistentpolicystandards,severeresourceconstraints,andenvironmentaldegradation.Accordingly,thispaperproposesathree-dimensionalgovernanceframeworkencompassing"institutionalrefinement,technologicalinnovation,andsystemicco-governance,"aimingtoprovidetheoreticalinsightsandpracticalguidanceforensuringnationalfoodsecurityandpromotingsustainableagriculturaldevelopment.課堂實戰(zhàn):提示詞設計工坊場景:

你將參加一個學術會議,需提供一個會議海報,反映你的最新研究。

目前所擁有的材料:一篇冗長的摘要要求:將其精煉為亮點鮮明,重點突出會議海報摘要(限200字)評價維度:信息保留度高、邏輯清晰度高摘要:促進農民持續(xù)增收是實施鄉(xiāng)村振興戰(zhàn)略與實現(xiàn)共同富裕的關鍵議題。高標準農田建設作為提升農業(yè)綜合生產能力的重要手段,通過資源稟賦升級、規(guī)模經濟實現(xiàn)、生產成本降低和收入渠道拓展等多維路徑,有效提高了農業(yè)經營效益和農戶的收入水平。然而,當前高標準農田建設仍存在資金籌措壓力大、區(qū)域發(fā)展不均衡、設施管護缺位、收益機制不完善等現(xiàn)實挑戰(zhàn),制約了農戶增收效應的充分釋放?;诖?,本文系統(tǒng)剖析了高標準農田建設助力農民持續(xù)增收的理論邏輯,深入探討了增收過程中的現(xiàn)實困境,并提出了創(chuàng)新高標準農田建設投融資模式、強化高標準農田建設質量及效率、健全高標準農田建后管護機制、構建高標準農田綜合效益長效轉化機制等重要任務,以助力有效破解當前增收瓶頸。研究認為,未來高標準農田建設需著力實現(xiàn)高起點謀劃戰(zhàn)略布局、高質量夯實發(fā)展根基、高水平挖掘農田潛力和高效率管理保障增收成效,為持續(xù)提高農民收入、保障糧食安全提供堅實支撐。會議海報摘要(199字)標題:高標準農田建設驅動農民增收:機制創(chuàng)新與路徑突破研究價值作為鄉(xiāng)村振興與共同富裕的核心抓手,高標準農田建設通過資源升級-規(guī)模效應-成本控制-渠道拓展四位一體機制,顯著提升農業(yè)效益與農戶收入。關鍵發(fā)現(xiàn)基于全國多區(qū)域實證分析,揭示當前制約增收的四大瓶頸:①財政投入持續(xù)性不足

②設施管護責任虛化

③區(qū)域建設標準差異

④產業(yè)鏈增值轉化薄弱。創(chuàng)新方案構建"四維驅動"治理框架:融資革新:PPP模式與碳匯交易結合的資金籌措體系效能升級:數(shù)字孿生技術賦能的精準建設管理系統(tǒng)長效管護:"建管用"一體化智能運維平臺價值釋放:三產融合導向的農田增值開發(fā)模式實踐啟示提出"四高"戰(zhàn)略路徑:高起點規(guī)劃布局、高質量設施基底、高效益潛能激活、高效率管理閉環(huán),為破解農民增收困境提供可復制的制度工具箱。學術貢獻首次建立高標準農田建設與農民增收的動態(tài)耦合模型,為農業(yè)現(xiàn)代化政策制定提供理論依據(jù)與實踐范式。Deepseek賦能高效文獻管理——從檢索到知識圖譜02DeepSeek賦能高效文獻管理——從檢索到知識圖譜(1):文獻檢索與篩選1.1智能語義檢索技術原理對比圖示:傳統(tǒng)關鍵詞檢索vs.DeepSeek語義檢索

"鈣鈦礦"→

僅匹配標題/摘要

"尋找提高光照穩(wěn)定性的新型光伏材料"→

理解語義關聯(lián)鈣鈦礦/有機太陽能電池

技術核心:基于MoE架構的文獻語義理解模型動態(tài)調整檢索范圍(期刊等級/時間/學科權重)

1.2實戰(zhàn)案例:材料學文獻篩選任務:檢索近3年"非鉛鈣鈦礦太陽能電池穩(wěn)定性"的高影響力文獻操作步驟:#連接到DeepSeekAPI(需申請key)

importdeepseek_literatureasdslclient=dsl.Client(api_key="your_key")#構建語義檢索指令

query={"主題":"非鉛鈣鈦礦穩(wěn)定性","約束條件":["排除鉛基材料","優(yōu)先選擇實驗類研究","影響因子>10的期刊","2019-2024年"]}#執(zhí)行檢索

results=client.search(query)#結果保存與篩選

results.filter(min_citations=50)results.export("篩選文獻.csv",columns=["標題","作者","DOI","核心貢獻"])

1.3高級篩選技巧代碼片段:#多維度排序

results.sort_by("citation_count",ascending=False)results.sort_by("publication_date",ascending=False)#自動去重(基于語義相似度)

results.remove_duplicates(similarity_threshold=0.85)跨學科案例:醫(yī)學:快速定位COVID-19病毒變異對疫苗有效性的研究社科:篩選"數(shù)字經濟與鄉(xiāng)村振興"的田野調查報告智能閱讀與筆記整理2.1文獻解析核心功能技術架構:文獻解析流水線:

PDF解析

關鍵信息抽?。僭O/方法/結論)

關聯(lián)已有知識庫

生成結構化筆記2.2實戰(zhàn)案例:生物醫(yī)學文獻精讀任務:解析《NatureMedicine》關于阿爾茨海默病生物標志物的論文操作步驟:

#上傳文獻并解析

doc=client.upload_pdf("alzheimer_biomarker.pdf")#生成結構化摘要

abstract=doc.summarize(focus="實驗方法+主要結論",template="醫(yī)學研究",output_format="markdown")#提取關鍵數(shù)據(jù)

tables=doc.extract_tables()figures=doc.analyze_figures()#生成交互式筆記

note=client.generate_note(content=[abstract,tables,figures],template="obsidian_template.md")note.save("文獻筆記.md")輸出示例2.3筆記自動化管理代碼片段:#自動鏈接到Zoterozotero=connect_zotero(library_id=12345)zotero.add_item(title=doc.title,notes=note.content,tags=doc.keywords)#生成復習提醒(間隔重復算法)

schedule_review(doc_id=doc.id,intervals=[3,7,30],priority=plexity*0.8)案例:《擴大還是縮小?糧食主產區(qū)設立對城鄉(xiāng)收入差距的影響》對上述文章進行文獻解析,執(zhí)行步驟如下:

關鍵信息抽取(假設/方法/結論)

關聯(lián)已有知識庫

生成結構化筆記

生成結構化摘要

,聚焦核心觀點+方法創(chuàng)新+關聯(lián)文獻(3):構建學科知識圖譜3.1知識圖譜構建流程技術路線:三元組抽取

實體消歧

關系推理

動態(tài)可視化

3.2實戰(zhàn)案例:計算機視覺領域知識圖譜數(shù)據(jù)源:100篇頂會論文(CVPR/ICCV)操作步驟:Step1:批量抽取知識三元組#從文獻庫抽取關系

triplets=[]forpaperincorpus:entities=paper.extract_entities(type=["方法","數(shù)據(jù)集","評價指標"])relations=client.analyze_relations(entities)triplets.extend(relations)#保存為CSVpd.DataFrame(triplets).to_csv("cv_triplets.csv")Step2:知識圖譜可視化(Neo4j)cypher//創(chuàng)建實體節(jié)點

CREATE(:Method{name:"YOLOv8",year:2023})CREATE(:Dataset{name:"COCO",size:"330Kimages"})//創(chuàng)建關系

MATCH(y:Method{name:"YOLOv8"}),(c:Dataset{name:"COCO"})CREATE(y)-[r:EVALUATED_ON{metric:"mAP@0.5"}]->(c)//動態(tài)查詢(查找替代數(shù)據(jù)集)

MATCH(m:Method)-[r]->(d:Dataset)WHEREr.metric="mAP@0.5"ANDd.size>"200K"RETURN,可視化效果:中心節(jié)點:目標檢測分支1:方法演進(RCNN→FasterRCNN→YOLO系列)分支2:數(shù)據(jù)集生態(tài)(COCO→LVIS→Objects365)3.3圖譜驅動的研究發(fā)現(xiàn)案例:發(fā)現(xiàn)"小樣本目標檢測"領域空白cypher//查找關聯(lián)度低的節(jié)點

MATCH(n)WHEREsize((n)--())<3RETURNAS研究空白點

倫理與最佳實踐數(shù)據(jù)安全:python#自動脫敏處理

doc.redact(patterns=["患者ID","機構地址"])完整流程1.文獻管理的AI革新范式(理論認知)傳統(tǒng)流程:

人工檢索

本地歸檔

手動標注

線性閱讀

碎片化筆記

DeepSeek流程:

智能語義檢索

自動知識抽取

動態(tài)知識圖譜

關聯(lián)推理

假設生成2.四步構建領域知識圖譜(全流程代碼實戰(zhàn))案例:鈣鈦礦太陽能電池穩(wěn)定性研究工具棧:DeepSeekAPI+Python+Neo4jStep1:智能語義檢索(附可運行代碼)importrequestsimportpandasaspd#DeepSeek學術檢索API(sk-238234a220dc4298b1a4a4414645ba41)

defdeepseek_search(query):url="/v1/academic/search"headers={"Authorization":"Beareryour_api_key"}params={"query":query,"fields":"title,abstract,year,doi,citations","filter":"year>2018ANDcitations>50","size":100}response=requests.get(url,headers=headers,params=params)returnpd.DataFrame(response.json()['results'])#執(zhí)行檢索(示例:鈣鈦礦穩(wěn)定性研究)

df=deepseek_search("perovskitesolarcellsstabilitydegradation")df.to_csv("literature.csv",index=False)Step2:知識三元組抽?。∟LP處理)fromdeepseek_nlpimportTripletExtractor#初始化模型(需申請APIkey)

extractor=TripletExtractor(api_key="your_key")#批量抽取三元組

triplets=[]forabstractindf['abstract']:results=extractor.extract(abstract)triplets.extend([(s,p,o)fors,p,oinresults])#生成三元組表格

triplet_df=pd.DataFrame(triplets,columns=["subject","predicate","object"])triplet_df.to_csv("triplets.csv",index=False)Step3:知識圖譜可視化(Neo4j實戰(zhàn))//創(chuàng)建節(jié)點

CREATE(:Concept{name:"鈣鈦礦",type:"材料"})CREATE(:Concept{name:"濕度敏感性",type:"缺陷"})//創(chuàng)建關系

MATCH(a:Concept{name:"鈣鈦礦"}),(b:Concept{name:"濕度敏感性"})CREATE(a)-[:HAS_DEFECT]->(b)//批量導入代碼(使用APOC庫)

CALLapoc.load.csv('triplets.csv')YIELDmapMERGE(s:Concept{name:map.subject})MERGE(o:Concept{name:map.object})MERGE(s)-[r:RELATION{type:map.predicate}]->(o)可視化效果:中心節(jié)點:鈣鈦礦太陽能電池一級關聯(lián):穩(wěn)定性因素/改進策略/測試方法二級關聯(lián):材料組成-環(huán)境響應-性能衰減路徑Step4:圖譜驅動的研究洞察應用場景:缺口發(fā)現(xiàn):定位孤立節(jié)點(如"自修復材料"研究稀少)趨勢預測:#時序關系分析(代碼片段)

trend_df=triplet_df.groupby(['predicate',df['year']]).size().unstack()trend_df.T.plot(figsize=(10,6))plt.title("鈣鈦礦穩(wěn)定性研究趨勢演化")假設生成:通過閉合路徑推理(如A→B→C→A形成研究閉環(huán))3.避坑指南與倫理規(guī)范技術陷阱:三元組噪聲過濾:設置置信度閾值(extractor.extract(...,confidence=0.7))圖譜冗余控制:合并同義詞(創(chuàng)建別名詞典自動映射)學術倫理:必須人工驗證AI發(fā)現(xiàn)的關系路徑引用原始文獻而非AI處理結果/從安裝到實戰(zhàn)!Citespace保姆級教程!citespace是一款文獻梳理軟件支持從主要來源(如WebofScience,Scopus,Dimensions,CNKI,CSSCI和其他一些來源)檢索的書目和引文數(shù)據(jù)。能夠把文件之間的關系,用科學知識圖譜的方式可視化地展現(xiàn)在我們面前。/hu397313168/article/details/131939610/p/651586224數(shù)據(jù)分析——從問卷到模型03Part1:問卷數(shù)據(jù)清洗1.1典型數(shù)據(jù)問題與解決方案2實戰(zhàn)案例:教育滿意度問卷清洗原始數(shù)據(jù)特征:1000份問卷,含28個問題包含數(shù)值型(1-5評分)和文本型(開放問題)操作流程:importpandasaspdimportnumpyasnp#加載數(shù)據(jù)

df=pd.read_csv("edu_survey_raw.csv")#缺失值處理

print("缺失值分布:")print(df.isnull().sum())df['teaching_quality']=df['teaching_quality'].fillna(df.groupby('school')['teaching_quality'].transform('median'))#異常值檢測

fromscipyimportstatsz_scores=np.abs(stats.zscore(df.select_dtypes(include=np.number)))df=df[(z_scores<3).all(axis=1)]#邏輯校驗

df=df[~((df['age']<18)&(df['degree']=='博士')]#保存清洗后數(shù)據(jù)

df.to_csv("cleaned_survey.csv",index=False)Part2:量化分析建模2.1分析框架選擇2.2案例:滿意度預測模型數(shù)據(jù):清洗后的教育問卷數(shù)據(jù)變量:因變量:overall_satisfaction(1-5分)自變量:teaching_quality,facilities,teacher_student_ratio等建模代碼:

pythonfromsklearn.ensembleimportRandomForestRegressorfromsklearn.model_selectionimporttrain_test_split#準備數(shù)據(jù)

X=df[['teaching_quality','facilities','teacher_student_ratio']]y=df['overall_satisfaction']X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2)#訓練模型

model=RandomForestRegressor(n_estimators=100)model.fit(X_train,y_train)#評估

print("測試集R2:",model.score(X_test,y_test))#特征重要性可視化

importmatplotlib.pyplotaspltplt.barh(X.columns,model.feature_importances_)plt.title("FeatureImportance")輸出結果:R2=0.73關鍵因素:教學質量(58%)、設施水平(32%)Part3:質性文本分析3.1分析流程設計文本清洗

情感分析

主題建模

語義網絡

3.2案例:開放題意見挖掘數(shù)據(jù):問卷中的"其他意見"文本字段(500條)分析代碼:分析結果:五大主題:課程設置(32%)、師資力量(28%)、硬件設施(22%)負面情感集中在"食堂服務"相關評論

importjiebafromsklearn.feature_extraction.textimportTfidfVectorizerfromsklearn.decompositionimportLatentDirichletAllocation#文本清洗

defclean_text(text):text=re.sub(r"[^\u4e00-\u9fa5]","",text)#去除非漢字

return"".join(jieba.lcut(text))df['clean_text']=df['comments'].apply(clean_text)#情感分析(使用預訓練模型)

fromsnownlpimportSnowNLPdf['sentiment']=df['clean_text'].apply(lambdax:SnowNLP(x).sentiments)#主題建模

tfidf=TfidfVectorizer(max_features=1000)X_tfidf=tfidf.fit_transform(df['clean_text'])lda=LatentDirichletAllocation(n_components=5)df['topic']=lda.fit_transform(X_tfidf).argmax(axis=1)#可視化

importpyLDAvispyLDAvis.enable_notebook()vis=pyLDAvis.sklearn.prepare(lda,X_tfidf,tfidf)vis3.3語義網絡分析importnetworkxasnx#構建共現(xiàn)網絡

window_size=3cooc=defaultdict(int)fortextindf['clean_text']:words=text.split()foriinrange(len(words)):forjinrange(i+1,min(i+window_size,len(words))):cooc[(words[i],words[j]))]+=1#創(chuàng)建圖

G=nx.Graph()for(w1,w2),countincooc.items():ifcount>5:G.add_edge(w1,w2,weight=count)#可視化

nx.draw(G,with_labels=True,node_size=50,font_size=8)以下是為教學示例定制的模擬教育滿意度問卷數(shù)據(jù)集,包含數(shù)值型與文本型字段,可直接用于練習數(shù)據(jù)清洗、建模與文本分析:模擬數(shù)據(jù)生成代碼importpandasaspdimportnumpyasnpimportrandomfromfakerimportFaker#初始化中文虛假數(shù)據(jù)生成器fake=Faker("zh_CN")np.random.seed(42)#生成1000條模擬記錄data={#基礎信息"user_id":[fake.unique.ssn()for_inrange(1000)],"age":np.random.randint(15,65,1000),"gender":np.random.choice(["男","女"],1000),"school":np.random.choice(["A中學","B大學","C職校"],1000),

#數(shù)值型評分(1-5分)"teaching_quality":np.random.randint(1,6,1000),"facilities":np.random.randint(1,6,1000),"teacher_student_ratio":np.round(np.random.normal(3.5,1.2,1000),1),"overall_satisfaction":np.random.randint(1,6,1000),

#文本型開放回答"comments":[fake.text(max_nb_chars=50)for_inrange(1000)]}df=pd.DataFrame(data)#---人工注入數(shù)據(jù)問題---#1.缺失值df.loc[np.random.choice(1000,50),"teaching_quality"]=np.nandf.loc[np.random.choice(1000,30),"comments"]=""#2.異常值df.loc[10,"age"]=150#不可能年齡df.loc[20,"teacher_student_ratio"]=20.0#異常師生比#3.邏輯矛盾df.loc[30,["age","school"]]=[12,"B大學"]#12歲大學生df.loc[40,["gender","comments"]]=["男","作為女生,我認為..."]#4.添加真實評論模板(覆蓋不同情感)comment_templates=["教師授課認真但食堂飯菜質量差",#混合情感"實驗室設備陳舊需要更新",#負面"校園環(huán)境優(yōu)美師生關系融洽",#正面"課程設置不合理作業(yè)負擔太重",#負面"輔導員非常負責關心學生"#正面]foriinrange(100,150):df.loc[i,"comments"]=random.choice(comment_templates)#保存數(shù)據(jù)df.to_csv("edu_survey_raw.csv",index=False)操作案例?1.缺失值填充與標準化處理??數(shù)據(jù)集示例?:?字段?:用戶年齡、月消費額、地區(qū)(含缺失值和非標準格式)?數(shù)據(jù)樣本?:?清洗需求?:填充缺失年齡為均值,缺失消費額為中位數(shù)user_data.csv代碼importpandasaspd#假設這是你的DataFramedata={'Age':[25,None,30,40],'MonthlySpend':[1500,2300,None,1800]}df=pd.DataFrame(data)#修改填充缺失值的方式df['Age']=df['Age'].fillna(df['Age'].mean())df['MonthlySpend']=df['MonthlySpend'].fillna(df['MonthlySpend'].median())print(df)代碼importpandasaspdimportdeepseekdf=pd.read_csv('user_data.csv')#缺失值填充response=deepseek.clean_data(data=df,task="fill_missing",params={"method":{"Age":"mean","MonthlySpend":"median"}})#字段標準化response=deepseek.clean_data(data=df,task="normalize",params={"columns":{"Region":"upper"}})能夠使用clean_data數(shù)據(jù)庫的?Python+DeepSeek實現(xiàn)?:?2.重復數(shù)據(jù)與異常值清洗??數(shù)據(jù)集示例?:?字段?:訂單ID、商品價格、購買時間(含重復訂單和異常高價)?數(shù)據(jù)樣本?:?清洗需求?:刪除重復訂單過濾價格超過20,000的異常值orders.cvs?Python+DeepSeek實現(xiàn)?:#去重response=deepseek.clean_data(data=df,task="remove_duplicates",params={"subset":["OrderID"]})#過濾異常值response=deepseek.clean_data(data=df,task="filter",params={"condition":"Price<=10000"})針對deepseek.clean_data方法不可用的情況,需改用pandas和numpy實現(xiàn)重復數(shù)據(jù)與異常值清洗importpandasaspd#讀取CSV文件df=pd.read_csv('orders.csv')#查看數(shù)據(jù)前5行和基本信息print(df.head())print(())#刪除重復行(保留第一個出現(xiàn)的記錄)df_cleaned=df.drop_duplicates(subset=['OrderID'],keep='first')#檢查去重后數(shù)據(jù)量print(f"去重后剩余記錄數(shù):{len(df_cleaned)}")#過濾高價異常值df_final=df_cleaned[df_cleaned['Price']<=1000

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論