華為杯第五屆中國研究生人工智能創(chuàng)新大賽賽題_第1頁
華為杯第五屆中國研究生人工智能創(chuàng)新大賽賽題_第2頁
華為杯第五屆中國研究生人工智能創(chuàng)新大賽賽題_第3頁
華為杯第五屆中國研究生人工智能創(chuàng)新大賽賽題_第4頁
華為杯第五屆中國研究生人工智能創(chuàng)新大賽賽題_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

“華為杯”第五屆中國研究生人工智能創(chuàng)新大賽賽題一、報名及提交作品要求

參賽隊伍在以下賽題中任選其一進行作品創(chuàng)作參賽。7月23日前,在大賽官網報名,通過培養(yǎng)單位資格審查后,7月27日前,在官網提交參賽作品。(作品提交規(guī)范及模板見附件)大賽官網

/

二、大賽賽題

(一)技術創(chuàng)新:開放題

(二)應用創(chuàng)意:開放題

(三)企業(yè)賽題:華為賽題共3個,均為華為技術有限公司從實際需求出發(fā)擬定的與智能技術密切相關的題目。屬于此種選題方式的作品還可以參與華為專項獎的評獎。1.

華為賽題一1.1題目名稱

AI交互預測決策規(guī)劃1.2題目描述

城區(qū)場景,拓撲復雜且存在車輛、非機動車、行人等復雜交互目標,期望通過AI和大數(shù)據(jù)學習的方法預測環(huán)境并給出類人安全的決策規(guī)劃解,算法層面滿足環(huán)境預測和決策規(guī)劃的自洽性和時序穩(wěn)定性?;诎缀兴惴ǖ臎Q策規(guī)劃方法,存在價值函數(shù)定義困難、調參難度大、類人性差的問題;基于AI的預測決策規(guī)劃方法存在模型黑盒可解釋性差、結果可靠性無法保障的問題。如何基于數(shù)據(jù)驅動的方法實現(xiàn)安全可靠的預測決策規(guī)劃算法存在以下挑戰(zhàn):AI模型建模拓撲和交通參與者,需要實現(xiàn)對worldmodel的有效建模;AI模型設計需要充分考慮自車和社會交通參與者的交互和自車類人安全性,模型輸出需要滿足預測決策規(guī)劃自洽性和時序穩(wěn)定性,而非僅僅是無交互的開環(huán)預測;AI模型的有效性難以從開環(huán)的平均指標得到證明,而閉環(huán)仿真器車輛存在與真實環(huán)境行為不同的問題,模型的有效安全性需要探索高效的證明方式;經過數(shù)據(jù)驅動后,需要AI模型能捕捉場景的差異特征,學習到場景異性的具體表現(xiàn)而非平均表現(xiàn);需要對AI模型的輸出設計有效應用和看護算法,使得自動駕駛更為安全智能。1.3具體要求根據(jù)可參考的開源數(shù)據(jù)集,設計和實現(xiàn)交互預測決策規(guī)劃模型,除了開環(huán)的平均指標外需要設計和給出自洽指標和時序穩(wěn)定指標或相關證明,需要實現(xiàn)閉環(huán)的評測或閉環(huán)有效性的證明,允許設計白盒算法提升AI模型輸出的有效性和安全性。可在路口或人車混行等復雜場景進行通過率驗證。指標參考:MinADE_5、MinADE_10

、MissRateTopK_2_5、MissRateTopK_2_10、MinFDE_1、OfRoadRate(/sota/trajectory-prediction-on-nuscenes)MinJointADE、MinJointFDE、MinJointMR、CrossCollisionRate、EgoCollisionRate、ConsistentMinJointMR(/leader-board)可利用外部數(shù)據(jù)進行增強算法或仿真數(shù)據(jù)進行大模型預訓練等(需給出所使用數(shù)據(jù)集的說明文檔),并最終在測試集上進行測試,證明方法的有效性。賽題總分由競賽得分(60%)和專家評分(40%)兩部分組成。專家評分使用華為內部的中國道路的復雜場景測試數(shù)據(jù)進行指標評價和驗收,考察算法的泛化性。競賽得分部分根據(jù)選手提交的方案在測試集(包括公開測試集和非公開測試集)上的運行結果給出。專家評分由評委組對選手所提交的方案的新穎性、合理性等進行打分。因此,參賽選手還需要提交模型代碼(用于非公開測試集評估)、模型說明文件(用于報告模型方案以及模型在公開測試集上的結果)。1.4咨詢專家及聯(lián)系郵箱

李洪業(yè)

-

lihongye5@

柳肖雪

-

liuxiaoxue2@1.5參考數(shù)據(jù)集/nuplan#download

/sota/trajectory-prediction-on-nuscenes

1.6參考文獻[1]Interaction-BasedTrajectoryPredictionOveraHybridTraffic

Graph(IROS2020)[2]ImplicitLatentVariableModelforScene-ConsistentMotion

Forecasting(ECCV2020)[3]SceneTransformer:Aunifiedarchitectureforpredictingmultipleagenttrajectories(ICLR2022)[4]OccupancyFlowFieldsforMotionForecastinginAutonomousDriving(RAL2022)[5]“THOMAS:TrajectoryHeatmapOutputWithLearnedMulti-AgentSampling“,(ICLR2022)華為賽題二2.1題目名稱

適用多場景的通用化時序預測算法2.2題目描述

隨著云計算的規(guī)模增大、數(shù)字化程度提高,涌現(xiàn)出大量時間序列場景和數(shù)據(jù),如資源的消耗序列、用戶的行為序列、機房傳感器的讀數(shù)序列等。在針對這些數(shù)據(jù)的分析和利用中,預測問題是用戶和企業(yè)最關心的任務之一,因為精準的時序預測往往是資源規(guī)劃、商業(yè)運營、硬件運維等領域決策的先決條件,而這些領域的決策質量又影響了云廠商的運營效率和用戶體驗,定義了云廠商的核心競爭力。

云計算中的數(shù)據(jù)有著來源豐富、規(guī)模龐大、特性迥異等特點,因此傳統(tǒng)的時序預測算法往往難以適應多種不同業(yè)務場景的需求,需要投入大量人力物力面向不同業(yè)務場景設計針對性的算法,成為了競爭力提升的一個瓶頸。將人工智能技術應用于時序預測任務是一條可行的出路,或可基于對數(shù)據(jù)特征的分析,選擇合適的算法類型;或可基于神經網絡等機器學習模型強大的表達能力,以單個模型實現(xiàn)通用化預測的目的。主要挑戰(zhàn):

1)“通用性”并沒有一個被廣泛接受的明確定義,如果依賴具體的數(shù)據(jù)集,則一方面該數(shù)據(jù)集可能對特定類型的數(shù)據(jù)有所偏向,另一方面也會導致算法的研發(fā)傾向于過擬合該數(shù)據(jù)集。因此首要的挑戰(zhàn)是提出并論證數(shù)據(jù)多樣性和平衡性的指標,并根據(jù)該指標進行數(shù)據(jù)收集。

2)面對擁有序列多樣性的數(shù)據(jù)集,設計一個通用化的時序預測算法是一個挑戰(zhàn)。算法可能需要處理不同長度、趨勢性、周期性、采樣粒度的時間序列,并且在各個序列上均給出較好的結果。2.3具體要求

1)參賽者需要定義并論證一種數(shù)據(jù)多樣性和平衡性的指標,并據(jù)此基于開源數(shù)據(jù)或生成數(shù)據(jù)構建數(shù)據(jù)集,要求其中時間序列的數(shù)量不少于1000。可以根據(jù)數(shù)據(jù)特性設計一種合理的訓練集和測試集的切分方式,這種切分既可以是在時間維度上的(至少保留20%作為測試集),也可以是在序列維度上的(至少保留50%作為測試集)。

2)參賽者需要設計一種時間序列預測算法,可以是單算法也可以是集成方案,在數(shù)據(jù)集上進行訓練和驗證,給出算法效果和證明算法通用性的案例分析。參賽隊伍最終提交構造數(shù)據(jù)集、模型代碼、方案文檔和演示視頻(可選),方案文檔需完整描述數(shù)據(jù)集的構造方法和算法的設計思路。

構造的數(shù)據(jù)集需滿足提出的數(shù)據(jù)多樣性的標準,切分訓練集和測試集時需至少保留20%的時間長度和50%的時間序列作為測試集。預測算法采用MAE(MeanAverageError)和sMAPE(SymmetricMeanAbsolutePercentageError)作為評價指標,其中sMAPE指標擁有更高的優(yōu)先級。在指標相近的情況下,算法的訓練和推理時間將作為參考評價指標。

人工評委審核成績從4個方面考核:結果復現(xiàn)評估,方案可行性分析,方案完整性評估,方案通用性評估。2.4咨詢專家及聯(lián)系郵箱

盛鎮(zhèn)醴

-

shengzhenli@

周樂夔

-zhoulekui@2.5參考數(shù)據(jù)集通用云服務:/cn/forecast/公開時序預測數(shù)據(jù)集:/datasets/yogesh94/m4-forecasting-competition-dataset/publications/the-tourism-forecasting-competition//downloads/NN5/datasets/download.htm華為賽題三3.1題目名稱

通過穿戴設備監(jiān)測高糖發(fā)生次數(shù)3.2題目描述

按照ADA標準,我國成年人中糖尿病前期患病率超過35%,在糖尿病前期進行控糖能夠有效降低II型糖尿病和心血管疾病的風險,具有重大意義。然而,由于成本體驗等原因,糖尿病前期人群中通過有創(chuàng)設備監(jiān)測控糖水平的人很少,智能穿戴技術的巨大進步為解決糖尿病前期人群的控糖水平監(jiān)測提供了前所未有的機會。

在《持續(xù)葡萄糖監(jiān)測臨床應用國際專家共識

(2017)》中,TIR、TAR、TBR被推薦作為CGM的關鍵報告參數(shù),分別反映血糖良好控制情況、高血糖和低血糖情況?!禩IR國際共識》推薦大多數(shù)糖尿病患者TIR(3.9~10.0mmol/L)控制目標為>70%、TBR(<3.9mmol/L)<4%;TIR每增加5%,1型糖尿病(T1DM)和2型糖尿?。═2DM)患者顯著臨床獲益;對于老年或高風險T1DM/T2DM患者,TIR控制目標降至>50%,TBR降至<1%,旨在進一步減少低血糖、同時預防嚴重高血糖;T1DM合并妊娠患者TIR(3.5~7.8mmol/L)目標為>70%。對于伴有合并癥及并發(fā)癥的糖尿病患者,《糖尿病管理中TIR個體化控制目標:多國專家建議(2020)》強調應根據(jù)具體情況,個體化設定TIR、TAR與TBR控制目標。

數(shù)據(jù)集由16個糖前(或者接近糖前)用戶組成,血糖監(jiān)測設備記錄用戶的葡萄糖濃度(mg/dl),穿戴記錄了血容量脈沖(BVP)信號、皮膚電活動(EDA)、皮膚溫度和三軸加速度計。以血糖監(jiān)測設備得到的血糖值是否處于正常范圍(小于7.8mmol/L),把血糖值分類為正常值和異常高值(高糖)共兩類。以兩分類作為金標,從穿戴設備記錄的數(shù)據(jù)種提取特征,訓練機器學習模型,測試人群每天的高糖發(fā)生次數(shù)。3.3具體要求

1)建議使用7.8mmol/L作為糖尿病前期人群高糖的邊界,允許在此基礎上有微調,例如根據(jù)數(shù)據(jù)情況可選擇7.5mmol/L等。注:參數(shù)設置不合理將導致訓練和測試正負樣本失衡,影響最終評分。

2)輸入:某用戶一天內從無創(chuàng)設備提供的心率(HR)、血容量脈沖(BVP)信號等數(shù)據(jù)

3)輸出:該用戶當天血糖值超過7.8mmol/L的次數(shù)。對比的金標是根據(jù)Dexcom.csv每五分鐘記錄的值統(tǒng)計此人當天實際超過7.8mmol/L的次數(shù)。

4)打分:提供多天的測試數(shù)據(jù),累計算法輸出的次數(shù)與金標差異,差異越小得分越高。

5)自由選擇機器學習方法訓練模型(總共有16人的數(shù)據(jù),建議在區(qū)分訓練集和測試集時按照訓練8人,測試8人的比例劃分,可隨機選8人,最終準確度需隨機多次取平均,評審時需考慮模型的過擬合等問題)

6)參賽團隊可以自行選擇訓練樣本的粒度,自由設置模型的分類能力(例如可選五分鐘粒度的樣本訓練二分類),最終只要給出一天血糖值超過所選閾值的次數(shù)即可。

7)最終打榜成績(計50%分數(shù))。線下提供測試集,測試參數(shù)團隊模型的準確性。通過線下腳本計算判分取Top10進行人工評委審核,若存在并列成績情況,可多取候選者。

8)最終評委組通過線下自動化腳本判分,以郵件或官網形式公布最后的打榜成績。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論