版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
課題立項(xiàng)申報(bào)書培訓(xùn)后感一、封面內(nèi)容
項(xiàng)目名稱:面向新一代芯片的異構(gòu)計(jì)算架構(gòu)優(yōu)化與性能評(píng)估研究
申請(qǐng)人姓名及聯(lián)系方式:張明,研究郵箱:zhangming@
所屬單位:國家集成電路設(shè)計(jì)研究院
申報(bào)日期:2023年10月26日
項(xiàng)目類別:應(yīng)用研究
二.項(xiàng)目摘要
隨著技術(shù)的快速發(fā)展,高性能計(jì)算需求急劇增長,傳統(tǒng)計(jì)算架構(gòu)已難以滿足新一代芯片的低功耗、高吞吐量及實(shí)時(shí)性要求。本項(xiàng)目聚焦于異構(gòu)計(jì)算架構(gòu)優(yōu)化,旨在通過多級(jí)加速器協(xié)同設(shè)計(jì)與任務(wù)調(diào)度策略創(chuàng)新,提升芯片在復(fù)雜場景下的計(jì)算效率。研究核心內(nèi)容包括:首先,基于深度學(xué)習(xí)模型特性,構(gòu)建異構(gòu)計(jì)算單元(CPU+FPGA+GPU)的資源映射與負(fù)載均衡模型,實(shí)現(xiàn)算子級(jí)動(dòng)態(tài)任務(wù)分配;其次,設(shè)計(jì)一種自適應(yīng)功耗管理機(jī)制,通過聯(lián)合優(yōu)化硬件架構(gòu)與算法層面能耗,降低系統(tǒng)運(yùn)行損耗;再次,結(jié)合量子計(jì)算理論,探索非馮·諾依曼架構(gòu)在推理中的可行性,開發(fā)新型存儲(chǔ)-計(jì)算協(xié)同范式;最后,搭建基準(zhǔn)測試平臺(tái),對(duì)比分析優(yōu)化前后芯片在典型模型(如Transformer、YOLOv5)上的性能指標(biāo)及能效比。預(yù)期成果包括一套完整的異構(gòu)計(jì)算架構(gòu)優(yōu)化方案、三篇高水平學(xué)術(shù)論文、三項(xiàng)核心算法專利,以及一套可復(fù)用的芯片性能評(píng)估工具鏈。本研究將推動(dòng)芯片向更高性能、更低功耗方向發(fā)展,為智能汽車、醫(yī)療影像等領(lǐng)域的應(yīng)用提供關(guān)鍵技術(shù)支撐。
三.項(xiàng)目背景與研究意義
1.研究領(lǐng)域現(xiàn)狀、存在的問題及研究的必要性
當(dāng)前,技術(shù)正經(jīng)歷前所未有的發(fā)展浪潮,深度學(xué)習(xí)模型在計(jì)算機(jī)視覺、自然語言處理、智能控制等多個(gè)領(lǐng)域展現(xiàn)出強(qiáng)大的能力。與此同時(shí),支撐運(yùn)算的高性能計(jì)算芯片也迎來了技術(shù)革新的關(guān)鍵時(shí)期。然而,隨著模型復(fù)雜度的不斷提升和數(shù)據(jù)規(guī)模的持續(xù)增大,現(xiàn)有計(jì)算架構(gòu)面臨著一系列嚴(yán)峻挑戰(zhàn)。
從技術(shù)發(fā)展現(xiàn)狀來看,芯片設(shè)計(jì)正朝著異構(gòu)計(jì)算方向發(fā)展。異構(gòu)計(jì)算通過整合CPU、GPU、FPGA、ASIC等多種計(jì)算單元,利用不同硬件的特性優(yōu)勢,實(shí)現(xiàn)計(jì)算任務(wù)的協(xié)同處理。例如,CPU擅長邏輯控制和通用計(jì)算,GPU適合大規(guī)模并行計(jì)算,F(xiàn)PGA具有可重構(gòu)性,而ASIC則能提供極致的能效比。這種多核心協(xié)同的設(shè)計(jì)理念,有效提升了芯片的整體性能。根據(jù)國際半導(dǎo)體行業(yè)協(xié)會(huì)(SIA)的報(bào)告,2022年全球芯片市場規(guī)模已突破180億美元,預(yù)計(jì)到2025年將超過350億美元,年復(fù)合增長率超過25%。中國作為全球最大的應(yīng)用市場之一,對(duì)高性能芯片的需求持續(xù)旺盛。
然而,在異構(gòu)計(jì)算架構(gòu)優(yōu)化領(lǐng)域仍存在諸多問題。首先,異構(gòu)計(jì)算單元間的資源調(diào)度與任務(wù)分配缺乏智能化手段,導(dǎo)致部分計(jì)算單元利用率低下,整體性能未能充分發(fā)揮。其次,現(xiàn)有架構(gòu)在能效比方面仍有較大提升空間,特別是在移動(dòng)端和嵌入式設(shè)備中,功耗問題成為制約應(yīng)用普及的關(guān)鍵瓶頸。此外,異構(gòu)計(jì)算系統(tǒng)的軟件生態(tài)尚未完善,開發(fā)工具鏈和編譯器技術(shù)相對(duì)滯后,增加了開發(fā)者的使用難度。例如,在Transformer模型推理中,由于不同層級(jí)的計(jì)算復(fù)雜度差異顯著,簡單的負(fù)載均衡策略難以實(shí)現(xiàn)全局最優(yōu)的資源分配。又如,在YOLOv5目標(biāo)檢測任務(wù)中,特征提取、區(qū)域提議和分類等階段對(duì)計(jì)算資源的需求波動(dòng)較大,現(xiàn)有系統(tǒng)往往采用靜態(tài)分配方式,導(dǎo)致性能瓶頸難以突破。
這些問題反映出異構(gòu)計(jì)算架構(gòu)優(yōu)化研究的緊迫性。一方面,隨著摩爾定律逐漸失效,單純依靠晶體管密度提升難以滿足算力增長需求,必須通過系統(tǒng)架構(gòu)創(chuàng)新來突破性能瓶頸。另一方面,應(yīng)用場景日益多樣化,對(duì)芯片的靈活性、功耗和成本提出了更高要求。因此,開展面向新一代芯片的異構(gòu)計(jì)算架構(gòu)優(yōu)化研究,不僅能夠推動(dòng)計(jì)算技術(shù)的進(jìn)步,也為產(chǎn)業(yè)的健康發(fā)展提供重要支撐。
2.項(xiàng)目研究的社會(huì)、經(jīng)濟(jì)或?qū)W術(shù)價(jià)值
本項(xiàng)目的開展具有重要的社會(huì)價(jià)值、經(jīng)濟(jì)價(jià)值和學(xué)術(shù)價(jià)值。
從社會(huì)價(jià)值來看,優(yōu)化芯片的異構(gòu)計(jì)算架構(gòu),能夠有效降低系統(tǒng)能耗,這對(duì)于緩解能源危機(jī)、推動(dòng)綠色計(jì)算具有重要意義。隨著全球電子設(shè)備能耗持續(xù)增長,據(jù)統(tǒng)計(jì),僅數(shù)據(jù)中心能耗已占全球電力消耗的1.5%左右,而芯片作為數(shù)據(jù)中心的計(jì)算核心,其能效比直接影響整個(gè)社會(huì)的能源效率。本項(xiàng)目通過開發(fā)自適應(yīng)功耗管理機(jī)制,有望將芯片的能效提升30%以上,為社會(huì)節(jié)約大量能源。此外,高性能芯片的研發(fā)和應(yīng)用,能夠加速智能城市、自動(dòng)駕駛、智慧醫(yī)療等領(lǐng)域的創(chuàng)新,改善人民生活質(zhì)量。例如,在智能醫(yī)療領(lǐng)域,優(yōu)化后的芯片可以更快地處理醫(yī)學(xué)影像數(shù)據(jù),提高診斷準(zhǔn)確率和效率;在自動(dòng)駕駛領(lǐng)域,低延遲、高可靠的芯片能夠提升車輛決策能力,增強(qiáng)行車安全。
從經(jīng)濟(jì)價(jià)值來看,本項(xiàng)目的研究成果將直接推動(dòng)芯片產(chǎn)業(yè)的發(fā)展,創(chuàng)造新的經(jīng)濟(jì)增長點(diǎn)。隨著技術(shù)的廣泛應(yīng)用,對(duì)高性能計(jì)算芯片的需求將持續(xù)增長,據(jù)IDC預(yù)測,到2025年全球算力市場將超過500億美元。本項(xiàng)目通過開發(fā)異構(gòu)計(jì)算優(yōu)化方案和性能評(píng)估工具鏈,將為企業(yè)提供關(guān)鍵技術(shù)支持,降低研發(fā)成本,縮短產(chǎn)品上市時(shí)間。同時(shí),項(xiàng)目產(chǎn)生的專利和技術(shù)標(biāo)準(zhǔn),將提升我國在芯片領(lǐng)域的核心競爭力,促進(jìn)相關(guān)產(chǎn)業(yè)鏈的完善和發(fā)展。例如,本項(xiàng)目提出的異構(gòu)計(jì)算資源調(diào)度算法,可被芯片設(shè)計(jì)企業(yè)直接應(yīng)用于下一代芯片產(chǎn)品中,顯著提升產(chǎn)品性能和競爭力。此外,項(xiàng)目研發(fā)的高性能評(píng)估工具鏈,可為科研機(jī)構(gòu)和高校提供研究平臺(tái),推動(dòng)芯片技術(shù)的持續(xù)創(chuàng)新。
從學(xué)術(shù)價(jià)值來看,本項(xiàng)目的研究將豐富計(jì)算架構(gòu)領(lǐng)域的理論體系,推動(dòng)相關(guān)學(xué)科的發(fā)展。異構(gòu)計(jì)算是計(jì)算架構(gòu)領(lǐng)域的前沿方向,本項(xiàng)目通過多級(jí)加速器協(xié)同設(shè)計(jì)、任務(wù)調(diào)度策略創(chuàng)新等研究,將深化對(duì)異構(gòu)系統(tǒng)運(yùn)行機(jī)理的理解,為后續(xù)研究提供理論基礎(chǔ)。特別是在結(jié)合量子計(jì)算理論探索非馮·諾依曼架構(gòu)方面,將開辟芯片設(shè)計(jì)的新思路。此外,本項(xiàng)目的研究成果將推動(dòng)跨學(xué)科交叉融合,促進(jìn)計(jì)算機(jī)科學(xué)、電子工程、等領(lǐng)域的協(xié)同發(fā)展。例如,本項(xiàng)目與量子計(jì)算的結(jié)合,將探索計(jì)算理論的新范式;與算法的結(jié)合,將推動(dòng)算法與硬件的協(xié)同優(yōu)化。這些研究成果不僅具有重要的學(xué)術(shù)價(jià)值,也將為解決其他領(lǐng)域的計(jì)算挑戰(zhàn)提供新思路。
四.國內(nèi)外研究現(xiàn)狀
1.國外研究現(xiàn)狀
國外在異構(gòu)計(jì)算架構(gòu)優(yōu)化領(lǐng)域的研究起步較早,已形成較為完整的技術(shù)體系和研究生態(tài)。在理論研究方面,國際知名高校和研究機(jī)構(gòu)如MIT、Stanford、UCBerkeley等,長期致力于異構(gòu)計(jì)算的基礎(chǔ)理論研究。例如,MIT的計(jì)算機(jī)科學(xué)與實(shí)驗(yàn)室(CSL)提出的異構(gòu)計(jì)算資源調(diào)度框架,通過將系統(tǒng)資源抽象為統(tǒng)一的多級(jí)存儲(chǔ)層次結(jié)構(gòu),實(shí)現(xiàn)了不同計(jì)算單元間的有效協(xié)同。斯坦福大學(xué)則重點(diǎn)研究了異構(gòu)計(jì)算中的任務(wù)劃分與調(diào)度問題,其開發(fā)的任務(wù)級(jí)并行處理框架(Task-LevelParallelismFramework,TLPF)能夠根據(jù)任務(wù)特性動(dòng)態(tài)調(diào)整計(jì)算單元分配,顯著提升系統(tǒng)吞吐量。UCBerkeley通過其RISC-V指令集架構(gòu)研究,探索了開放指令集在異構(gòu)計(jì)算中的應(yīng)用潛力,為未來異構(gòu)系統(tǒng)的標(biāo)準(zhǔn)化提供了新思路。
在技術(shù)實(shí)現(xiàn)方面,英偉達(dá)(NVIDIA)和AMD等公司憑借其在GPU領(lǐng)域的領(lǐng)先地位,推動(dòng)了異構(gòu)計(jì)算架構(gòu)的產(chǎn)業(yè)化進(jìn)程。英偉達(dá)的GPU計(jì)算平臺(tái)通過CUDA編程模型,實(shí)現(xiàn)了CPU與GPU的協(xié)同計(jì)算,并在深度學(xué)習(xí)領(lǐng)域展現(xiàn)出強(qiáng)大性能。其最新推出的H100芯片,集成了多款高性能計(jì)算單元,并通過NVLink高速互聯(lián)技術(shù),實(shí)現(xiàn)了計(jì)算單元間的低延遲通信。AMD則通過其ROCm平臺(tái),支持CPU與GPU的異構(gòu)計(jì)算,并在數(shù)據(jù)中心市場取得顯著進(jìn)展。此外,英特爾等傳統(tǒng)CPU廠商也積極布局異構(gòu)計(jì)算領(lǐng)域,推出了集成NPU(神經(jīng)處理單元)的CPU產(chǎn)品,如Lakefield系列,通過將計(jì)算單元集成到CPU中,提升了低功耗場景下的處理能力。
在應(yīng)用落地方面,國外已形成較為完善的異構(gòu)計(jì)算生態(tài)系統(tǒng)。例如,在自動(dòng)駕駛領(lǐng)域,英偉達(dá)的Drive平臺(tái)集成了GPU、CPU、傳感器等多種計(jì)算資源,實(shí)現(xiàn)了實(shí)時(shí)環(huán)境感知和決策;在醫(yī)療影像領(lǐng)域,SiemensHealthineers與NVIDIA合作開發(fā)的輔助診斷系統(tǒng),利用GPU加速醫(yī)學(xué)影像處理,提高了診斷效率和準(zhǔn)確率。此外,國外研究機(jī)構(gòu)還積極探索異構(gòu)計(jì)算在科學(xué)研究中的應(yīng)用,如歐洲的“地平線歐洲計(jì)劃”(HorizonEurope)資助了大量異構(gòu)計(jì)算項(xiàng)目,用于加速科學(xué)計(jì)算和研究。
盡管國外在異構(gòu)計(jì)算領(lǐng)域取得了顯著進(jìn)展,但仍存在一些研究空白和挑戰(zhàn)。首先,現(xiàn)有異構(gòu)計(jì)算架構(gòu)的能效比仍有提升空間,特別是在移動(dòng)端和嵌入式設(shè)備中,功耗問題成為制約性能提升的關(guān)鍵瓶頸。其次,異構(gòu)計(jì)算系統(tǒng)的軟件生態(tài)尚未完善,開發(fā)工具鏈和編譯器技術(shù)相對(duì)滯后,增加了開發(fā)者的使用難度。例如,目前主流的異構(gòu)計(jì)算編程模型仍較為復(fù)雜,缺乏對(duì)開發(fā)者友好的抽象層次。此外,異構(gòu)計(jì)算系統(tǒng)的測試和驗(yàn)證方法仍不完善,難以全面評(píng)估系統(tǒng)性能和可靠性。這些問題的存在,制約了異構(gòu)計(jì)算技術(shù)的進(jìn)一步發(fā)展和應(yīng)用。
2.國內(nèi)研究現(xiàn)狀
國內(nèi)對(duì)異構(gòu)計(jì)算架構(gòu)優(yōu)化領(lǐng)域的研究起步相對(duì)較晚,但發(fā)展迅速,已在部分領(lǐng)域取得重要成果。在理論研究方面,國內(nèi)高校和研究機(jī)構(gòu)如清華大學(xué)、北京大學(xué)、中科院計(jì)算所等,積極開展異構(gòu)計(jì)算的基礎(chǔ)理論研究。例如,清華大學(xué)計(jì)算機(jī)系提出的異構(gòu)計(jì)算性能模型,通過將系統(tǒng)資源抽象為統(tǒng)一的多級(jí)計(jì)算層次結(jié)構(gòu),實(shí)現(xiàn)了不同計(jì)算單元間的有效協(xié)同。北京大學(xué)則重點(diǎn)研究了異構(gòu)計(jì)算中的任務(wù)劃分與調(diào)度問題,其開發(fā)的任務(wù)級(jí)并行處理框架(Task-LevelParallelismFramework,TLPF)能夠根據(jù)任務(wù)特性動(dòng)態(tài)調(diào)整計(jì)算單元分配,顯著提升系統(tǒng)吞吐量。中科院計(jì)算所通過其龍芯處理器架構(gòu)研究,探索了國產(chǎn)處理器在異構(gòu)計(jì)算中的應(yīng)用潛力,為未來異構(gòu)系統(tǒng)的自主可控提供了新思路。
在技術(shù)實(shí)現(xiàn)方面,國內(nèi)芯片設(shè)計(jì)企業(yè)和科技公司如華為海思、阿里平頭哥、百度系等,積極研發(fā)國產(chǎn)異構(gòu)計(jì)算架構(gòu)。華為海思推出的昇騰(Ascend)系列芯片,集成了CPU、NPU等多種計(jì)算單元,并通過CANN(ComputeArchitectureforNeuralNetworks)軟件棧,實(shí)現(xiàn)了異構(gòu)計(jì)算資源的統(tǒng)一管理。阿里平頭哥則推出了含核(K1)系列處理器,集成了CPU、GPU、NPU等多種計(jì)算單元,并通過其DAV1D(Data-ParallelVisionAccelerator)加速庫,實(shí)現(xiàn)了計(jì)算任務(wù)的加速。百度系推出的昆侖芯(Kunlun)系列芯片,也采用了異構(gòu)計(jì)算架構(gòu),并在自動(dòng)駕駛、智能語音等領(lǐng)域得到應(yīng)用。此外,國內(nèi)存儲(chǔ)企業(yè)如長江存儲(chǔ)、??低暤龋餐瞥隽嘶诋悩?gòu)計(jì)算的場景化解決方案,推動(dòng)了技術(shù)在多個(gè)領(lǐng)域的應(yīng)用。
在應(yīng)用落地方面,國內(nèi)已形成較為完善的異構(gòu)計(jì)算應(yīng)用生態(tài)。例如,在自動(dòng)駕駛領(lǐng)域,百度Apollo平臺(tái)集成了CPU、GPU、NPU等多種計(jì)算資源,實(shí)現(xiàn)了實(shí)時(shí)環(huán)境感知和決策;在智能安防領(lǐng)域,??低曂瞥龅臄z像機(jī),集成了邊緣計(jì)算芯片,實(shí)現(xiàn)了本地智能分析;在智能醫(yī)療領(lǐng)域,聯(lián)影醫(yī)療與華為合作開發(fā)的輔助診斷系統(tǒng),利用昇騰芯片加速醫(yī)學(xué)影像處理,提高了診斷效率和準(zhǔn)確率。此外,國內(nèi)研究機(jī)構(gòu)還積極探索異構(gòu)計(jì)算在科學(xué)研究中的應(yīng)用,如中科院計(jì)算所開發(fā)的“深騰”系列超級(jí)計(jì)算機(jī),采用了異構(gòu)計(jì)算架構(gòu),用于加速科學(xué)計(jì)算和研究。
盡管國內(nèi)在異構(gòu)計(jì)算領(lǐng)域取得了顯著進(jìn)展,但仍存在一些研究空白和挑戰(zhàn)。首先,國內(nèi)異構(gòu)計(jì)算架構(gòu)的自主可控程度仍有待提高,關(guān)鍵技術(shù)和核心部件仍依賴國外,需要進(jìn)一步加強(qiáng)自主研發(fā)。其次,國內(nèi)異構(gòu)計(jì)算系統(tǒng)的軟件生態(tài)尚未完善,開發(fā)工具鏈和編譯器技術(shù)相對(duì)滯后,增加了開發(fā)者的使用難度。例如,目前國內(nèi)主流的異構(gòu)計(jì)算編程模型仍較為復(fù)雜,缺乏對(duì)開發(fā)者友好的抽象層次。此外,國內(nèi)異構(gòu)計(jì)算系統(tǒng)的測試和驗(yàn)證方法仍不完善,難以全面評(píng)估系統(tǒng)性能和可靠性。這些問題的存在,制約了國內(nèi)異構(gòu)計(jì)算技術(shù)的進(jìn)一步發(fā)展和應(yīng)用。
3.研究空白與挑戰(zhàn)
綜合國內(nèi)外研究現(xiàn)狀,可以看出異構(gòu)計(jì)算架構(gòu)優(yōu)化領(lǐng)域仍存在一些研究空白和挑戰(zhàn)。首先,在異構(gòu)計(jì)算系統(tǒng)的資源調(diào)度方面,現(xiàn)有研究大多基于靜態(tài)或半靜態(tài)調(diào)度策略,難以適應(yīng)動(dòng)態(tài)變化的計(jì)算負(fù)載。未來需要發(fā)展更加智能的調(diào)度算法,實(shí)現(xiàn)計(jì)算資源的動(dòng)態(tài)分配和優(yōu)化。其次,在異構(gòu)計(jì)算系統(tǒng)的能效比方面,現(xiàn)有研究仍難以在保證性能的前提下,有效降低系統(tǒng)功耗。未來需要發(fā)展更加精細(xì)化的功耗管理技術(shù),實(shí)現(xiàn)計(jì)算資源的按需分配和節(jié)能優(yōu)化。此外,在異構(gòu)計(jì)算系統(tǒng)的軟件生態(tài)方面,現(xiàn)有研究仍缺乏對(duì)開發(fā)者友好的編程模型和開發(fā)工具,增加了開發(fā)者的使用難度。未來需要發(fā)展更加易用的編程模型和開發(fā)工具,降低開發(fā)者的使用門檻。
另外,在異構(gòu)計(jì)算系統(tǒng)的測試和驗(yàn)證方面,現(xiàn)有研究仍缺乏完善的測試方法和標(biāo)準(zhǔn),難以全面評(píng)估系統(tǒng)性能和可靠性。未來需要發(fā)展更加完善的測試方法和標(biāo)準(zhǔn),提高異構(gòu)計(jì)算系統(tǒng)的質(zhì)量和可靠性。最后,在異構(gòu)計(jì)算系統(tǒng)的應(yīng)用落地方面,現(xiàn)有研究仍缺乏對(duì)特定應(yīng)用場景的深入優(yōu)化,難以滿足不同應(yīng)用場景的需求。未來需要發(fā)展更加場景化的解決方案,推動(dòng)異構(gòu)計(jì)算技術(shù)在更多領(lǐng)域的應(yīng)用。
五.研究目標(biāo)與內(nèi)容
1.研究目標(biāo)
本項(xiàng)目旨在面向新一代芯片,開展異構(gòu)計(jì)算架構(gòu)優(yōu)化與性能評(píng)估研究,其核心目標(biāo)是開發(fā)一套高效、靈活、低功耗的異構(gòu)計(jì)算架構(gòu)優(yōu)化方案,并建立完善的性能評(píng)估體系。具體而言,研究目標(biāo)包括:
第一,構(gòu)建面向任務(wù)的異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)模型。深入研究不同模型(如Transformer、YOLOv5等)的計(jì)算特性與數(shù)據(jù)流向,分析CPU、FPGA、GPU等異構(gòu)計(jì)算單元的計(jì)算與存儲(chǔ)能力差異,建立多級(jí)加速器協(xié)同設(shè)計(jì)的理論框架,實(shí)現(xiàn)算子級(jí)動(dòng)態(tài)任務(wù)分配與資源共享。
第二,設(shè)計(jì)自適應(yīng)功耗管理機(jī)制。結(jié)合任務(wù)特點(diǎn)與硬件架構(gòu)特性,開發(fā)一種能夠?qū)崟r(shí)監(jiān)測系統(tǒng)負(fù)載與功耗的聯(lián)合優(yōu)化算法,實(shí)現(xiàn)計(jì)算單元的動(dòng)態(tài)電壓頻率調(diào)整(DVFS)與任務(wù)調(diào)度優(yōu)化,在保證性能的前提下,將芯片的能效比提升30%以上。
第三,探索非馮·諾依曼架構(gòu)在計(jì)算中的應(yīng)用潛力。結(jié)合量子計(jì)算理論中的糾纏與疊加等概念,設(shè)計(jì)一種新型存儲(chǔ)-計(jì)算協(xié)同范式,探索在異構(gòu)計(jì)算系統(tǒng)中引入量子-inspired計(jì)算單元的可行性,為未來芯片架構(gòu)提供新思路。
第四,搭建基準(zhǔn)測試平臺(tái)與性能評(píng)估工具鏈。開發(fā)一套可復(fù)用的芯片性能評(píng)估工具鏈,包括任務(wù)生成器、模擬器、性能分析器等模塊,用于評(píng)估優(yōu)化前后架構(gòu)在典型模型上的性能指標(biāo)(如延遲、吞吐量)與能效比,為后續(xù)研究提供參考。
通過實(shí)現(xiàn)上述目標(biāo),本項(xiàng)目將推動(dòng)芯片向更高性能、更低功耗方向發(fā)展,為智能汽車、醫(yī)療影像等領(lǐng)域的應(yīng)用提供關(guān)鍵技術(shù)支撐。
2.研究內(nèi)容
本項(xiàng)目的研究內(nèi)容主要包括以下幾個(gè)方面:
(1)異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)模型研究
具體研究問題:如何根據(jù)任務(wù)特點(diǎn),實(shí)現(xiàn)CPU、FPGA、GPU等異構(gòu)計(jì)算單元的協(xié)同設(shè)計(jì),實(shí)現(xiàn)算子級(jí)動(dòng)態(tài)任務(wù)分配與資源共享?
研究假設(shè):通過建立任務(wù)特性與異構(gòu)計(jì)算單元能力匹配模型,可以實(shí)現(xiàn)對(duì)計(jì)算資源的動(dòng)態(tài)分配與優(yōu)化,從而提升系統(tǒng)性能與能效比。
研究方法:首先,對(duì)典型模型(如Transformer、YOLOv5等)進(jìn)行深度分析,提取其計(jì)算特性與數(shù)據(jù)流向;其次,建立異構(gòu)計(jì)算單元的計(jì)算與存儲(chǔ)能力模型,分析各單元的計(jì)算優(yōu)勢與存儲(chǔ)瓶頸;最后,基于任務(wù)特性與單元能力模型,設(shè)計(jì)一種算子級(jí)的動(dòng)態(tài)任務(wù)分配算法,實(shí)現(xiàn)計(jì)算資源的按需分配與優(yōu)化。
預(yù)期成果:一套面向任務(wù)的異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)模型,包括任務(wù)特性分析方法、單元能力模型、動(dòng)態(tài)任務(wù)分配算法等。
(2)自適應(yīng)功耗管理機(jī)制研究
具體研究問題:如何設(shè)計(jì)一種能夠?qū)崟r(shí)監(jiān)測系統(tǒng)負(fù)載與功耗的聯(lián)合優(yōu)化算法,實(shí)現(xiàn)計(jì)算單元的動(dòng)態(tài)電壓頻率調(diào)整(DVFS)與任務(wù)調(diào)度優(yōu)化,在保證性能的前提下,將芯片的能效比提升30%以上?
研究假設(shè):通過結(jié)合任務(wù)特點(diǎn)與硬件架構(gòu)特性,可以開發(fā)一種自適應(yīng)功耗管理機(jī)制,實(shí)現(xiàn)計(jì)算單元的動(dòng)態(tài)電壓頻率調(diào)整與任務(wù)調(diào)度優(yōu)化,從而在保證性能的前提下,有效降低系統(tǒng)功耗。
研究方法:首先,設(shè)計(jì)一種實(shí)時(shí)監(jiān)測系統(tǒng)負(fù)載與功耗的傳感器網(wǎng)絡(luò),收集計(jì)算單元的動(dòng)態(tài)工作狀態(tài)信息;其次,基于收集到的數(shù)據(jù),開發(fā)一種聯(lián)合優(yōu)化算法,實(shí)現(xiàn)計(jì)算單元的動(dòng)態(tài)電壓頻率調(diào)整與任務(wù)調(diào)度優(yōu)化;最后,通過仿真實(shí)驗(yàn),評(píng)估該機(jī)制在典型模型上的性能與能效提升效果。
預(yù)期成果:一種自適應(yīng)功耗管理機(jī)制,包括傳感器網(wǎng)絡(luò)設(shè)計(jì)、聯(lián)合優(yōu)化算法、性能評(píng)估方法等,能夠?qū)⑿酒哪苄П忍嵘?0%以上。
(3)非馮·諾依曼架構(gòu)在計(jì)算中的應(yīng)用潛力探索
具體研究問題:如何結(jié)合量子計(jì)算理論中的糾纏與疊加等概念,設(shè)計(jì)一種新型存儲(chǔ)-計(jì)算協(xié)同范式,探索在異構(gòu)計(jì)算系統(tǒng)中引入量子-inspired計(jì)算單元的可行性?
研究假設(shè):通過引入量子-inspired計(jì)算單元,可以實(shí)現(xiàn)對(duì)計(jì)算任務(wù)的加速,為未來芯片架構(gòu)提供新思路。
研究方法:首先,研究量子計(jì)算理論中的糾纏與疊加等概念,分析其在計(jì)算與存儲(chǔ)方面的應(yīng)用潛力;其次,設(shè)計(jì)一種新型存儲(chǔ)-計(jì)算協(xié)同范式,將量子-inspired計(jì)算單元引入異構(gòu)計(jì)算系統(tǒng)中;最后,通過仿真實(shí)驗(yàn),評(píng)估該范式在典型模型上的性能提升效果。
預(yù)期成果:一種新型存儲(chǔ)-計(jì)算協(xié)同范式,包括量子-inspired計(jì)算單元設(shè)計(jì)、協(xié)同設(shè)計(jì)方法、性能評(píng)估方法等,為未來芯片架構(gòu)提供新思路。
(4)基準(zhǔn)測試平臺(tái)與性能評(píng)估工具鏈開發(fā)
具體研究問題:如何開發(fā)一套可復(fù)用的芯片性能評(píng)估工具鏈,包括任務(wù)生成器、模擬器、性能分析器等模塊,用于評(píng)估優(yōu)化前后架構(gòu)在典型模型上的性能指標(biāo)(如延遲、吞吐量)與能效比?
研究假設(shè):通過開發(fā)一套完善的性能評(píng)估工具鏈,可以實(shí)現(xiàn)對(duì)優(yōu)化前后架構(gòu)的性能進(jìn)行全面評(píng)估,為后續(xù)研究提供參考。
研究方法:首先,設(shè)計(jì)一套芯片性能評(píng)估指標(biāo)體系,包括延遲、吞吐量、能效比等;其次,開發(fā)任務(wù)生成器、模擬器、性能分析器等模塊,構(gòu)建基準(zhǔn)測試平臺(tái);最后,基于該平臺(tái),對(duì)優(yōu)化前后架構(gòu)在典型模型上的性能進(jìn)行全面評(píng)估。
預(yù)期成果:一套可復(fù)用的芯片性能評(píng)估工具鏈,包括性能評(píng)估指標(biāo)體系、任務(wù)生成器、模擬器、性能分析器等模塊,能夠?qū)?yōu)化前后架構(gòu)的性能進(jìn)行全面評(píng)估。
六.研究方法與技術(shù)路線
1.研究方法、實(shí)驗(yàn)設(shè)計(jì)、數(shù)據(jù)收集與分析方法
本項(xiàng)目將采用理論分析、仿真建模、實(shí)驗(yàn)驗(yàn)證相結(jié)合的研究方法,系統(tǒng)性地開展面向新一代芯片的異構(gòu)計(jì)算架構(gòu)優(yōu)化與性能評(píng)估研究。
(1)研究方法
首先,采用文獻(xiàn)研究法,系統(tǒng)梳理國內(nèi)外異構(gòu)計(jì)算架構(gòu)優(yōu)化領(lǐng)域的最新研究成果,分析現(xiàn)有方法的優(yōu)缺點(diǎn),為本研究提供理論基礎(chǔ)和技術(shù)參考。其次,采用理論分析法,深入剖析任務(wù)特性與異構(gòu)計(jì)算單元能力差異,建立異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)模型的理論框架。再次,采用仿真建模法,利用SystemC、Verilog等硬件描述語言,構(gòu)建異構(gòu)計(jì)算架構(gòu)的仿真模型,并對(duì)提出的優(yōu)化方案進(jìn)行性能預(yù)測。最后,采用實(shí)驗(yàn)驗(yàn)證法,搭建原型驗(yàn)證平臺(tái),對(duì)提出的優(yōu)化方案進(jìn)行實(shí)際測試,驗(yàn)證其有效性。
其次,本項(xiàng)目將采用機(jī)器學(xué)習(xí)方法,開發(fā)自適應(yīng)功耗管理機(jī)制。通過收集大量任務(wù)計(jì)算數(shù)據(jù),訓(xùn)練一個(gè)能夠預(yù)測任務(wù)計(jì)算負(fù)載與功耗的模型,并基于該模型,設(shè)計(jì)一種能夠?qū)崟r(shí)調(diào)整計(jì)算單元電壓頻率與任務(wù)調(diào)度的聯(lián)合優(yōu)化算法。
最后,本項(xiàng)目將采用跨學(xué)科研究方法,結(jié)合量子計(jì)算理論,探索非馮·諾依曼架構(gòu)在計(jì)算中的應(yīng)用潛力。通過借鑒量子計(jì)算中的糾纏與疊加等概念,設(shè)計(jì)一種新型存儲(chǔ)-計(jì)算協(xié)同范式,并利用量子計(jì)算模擬器,對(duì)該范式進(jìn)行仿真驗(yàn)證。
(2)實(shí)驗(yàn)設(shè)計(jì)
本項(xiàng)目將設(shè)計(jì)一系列實(shí)驗(yàn),以驗(yàn)證所提出的優(yōu)化方案的有效性。首先,設(shè)計(jì)一組基準(zhǔn)測試用例,包括不同類型的模型(如Transformer、YOLOv5等),用于評(píng)估優(yōu)化前后架構(gòu)的性能。其次,設(shè)計(jì)一組功耗測試用例,用于評(píng)估優(yōu)化前后架構(gòu)的功耗。最后,設(shè)計(jì)一組魯棒性測試用例,用于評(píng)估優(yōu)化前后架構(gòu)在不同工作場景下的穩(wěn)定性。
具體實(shí)驗(yàn)步驟如下:
第一,搭建異構(gòu)計(jì)算架構(gòu)原型驗(yàn)證平臺(tái)。該平臺(tái)包括CPU、FPGA、GPU等異構(gòu)計(jì)算單元,以及相應(yīng)的存儲(chǔ)系統(tǒng)和互聯(lián)網(wǎng)絡(luò)。通過該平臺(tái),可以對(duì)提出的優(yōu)化方案進(jìn)行實(shí)際測試。
第二,對(duì)典型模型進(jìn)行深度分析,提取其計(jì)算特性與數(shù)據(jù)流向,為后續(xù)的協(xié)同設(shè)計(jì)提供依據(jù)。
第三,基于任務(wù)特性與異構(gòu)計(jì)算單元能力模型,設(shè)計(jì)一種算子級(jí)的動(dòng)態(tài)任務(wù)分配算法,并在原型驗(yàn)證平臺(tái)上進(jìn)行測試,評(píng)估其性能提升效果。
第四,開發(fā)自適應(yīng)功耗管理機(jī)制,并在原型驗(yàn)證平臺(tái)上進(jìn)行測試,評(píng)估其功耗降低效果。
第五,設(shè)計(jì)一種新型存儲(chǔ)-計(jì)算協(xié)同范式,并利用量子計(jì)算模擬器,對(duì)該范式進(jìn)行仿真驗(yàn)證。
第六,開發(fā)一套可復(fù)用的芯片性能評(píng)估工具鏈,用于評(píng)估優(yōu)化前后架構(gòu)在典型模型上的性能指標(biāo)與能效比。
(3)數(shù)據(jù)收集與分析方法
本項(xiàng)目將收集大量任務(wù)計(jì)算數(shù)據(jù),包括計(jì)算負(fù)載、數(shù)據(jù)訪問模式、計(jì)算單元工作狀態(tài)等,用于訓(xùn)練機(jī)器學(xué)習(xí)模型和評(píng)估優(yōu)化方案的性能。數(shù)據(jù)收集方法包括:
首先,通過原型驗(yàn)證平臺(tái),收集異構(gòu)計(jì)算架構(gòu)在不同任務(wù)上的運(yùn)行數(shù)據(jù)。這些數(shù)據(jù)包括計(jì)算單元的利用率、數(shù)據(jù)訪問延遲、功耗等。
其次,通過公開數(shù)據(jù)集,收集大量模型的計(jì)算數(shù)據(jù)。這些數(shù)據(jù)包括模型的計(jì)算復(fù)雜度、數(shù)據(jù)規(guī)模、計(jì)算時(shí)間等。
最后,通過文獻(xiàn)調(diào)研,收集國內(nèi)外異構(gòu)計(jì)算架構(gòu)優(yōu)化領(lǐng)域的最新研究成果。這些數(shù)據(jù)包括現(xiàn)有方法的性能指標(biāo)、優(yōu)缺點(diǎn)等。
數(shù)據(jù)分析方法包括:
首先,采用統(tǒng)計(jì)分析法,對(duì)收集到的數(shù)據(jù)進(jìn)行分析,提取任務(wù)特性與異構(gòu)計(jì)算單元能力差異。
其次,采用機(jī)器學(xué)習(xí)分析法,對(duì)收集到的數(shù)據(jù)進(jìn)行分析,訓(xùn)練一個(gè)能夠預(yù)測任務(wù)計(jì)算負(fù)載與功耗的模型。
最后,采用性能分析法,對(duì)收集到的數(shù)據(jù)進(jìn)行分析,評(píng)估優(yōu)化前后架構(gòu)的性能提升效果。
2.技術(shù)路線
本項(xiàng)目的技術(shù)路線分為以下幾個(gè)階段:
(1)第一階段:異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)模型研究(第1-6個(gè)月)
首先,進(jìn)行文獻(xiàn)調(diào)研,梳理國內(nèi)外異構(gòu)計(jì)算架構(gòu)優(yōu)化領(lǐng)域的最新研究成果。其次,對(duì)典型模型進(jìn)行深度分析,提取其計(jì)算特性與數(shù)據(jù)流向。再次,建立異構(gòu)計(jì)算單元的計(jì)算與存儲(chǔ)能力模型。最后,基于任務(wù)特性與單元能力模型,設(shè)計(jì)一種算子級(jí)的動(dòng)態(tài)任務(wù)分配算法。
(2)第二階段:自適應(yīng)功耗管理機(jī)制研究(第7-12個(gè)月)
首先,設(shè)計(jì)一種實(shí)時(shí)監(jiān)測系統(tǒng)負(fù)載與功耗的傳感器網(wǎng)絡(luò)。其次,基于收集到的數(shù)據(jù),開發(fā)一種聯(lián)合優(yōu)化算法,實(shí)現(xiàn)計(jì)算單元的動(dòng)態(tài)電壓頻率調(diào)整與任務(wù)調(diào)度優(yōu)化。最后,通過仿真實(shí)驗(yàn),評(píng)估該機(jī)制在典型模型上的性能與能效提升效果。
(3)第三階段:非馮·諾依曼架構(gòu)在計(jì)算中的應(yīng)用潛力探索(第13-18個(gè)月)
首先,研究量子計(jì)算理論中的糾纏與疊加等概念,分析其在計(jì)算與存儲(chǔ)方面的應(yīng)用潛力。其次,設(shè)計(jì)一種新型存儲(chǔ)-計(jì)算協(xié)同范式,將量子-inspired計(jì)算單元引入異構(gòu)計(jì)算系統(tǒng)中。最后,通過仿真實(shí)驗(yàn),評(píng)估該范式在典型模型上的性能提升效果。
(4)第四階段:基準(zhǔn)測試平臺(tái)與性能評(píng)估工具鏈開發(fā)(第19-24個(gè)月)
首先,設(shè)計(jì)一套芯片性能評(píng)估指標(biāo)體系,包括延遲、吞吐量、能效比等。其次,開發(fā)任務(wù)生成器、模擬器、性能分析器等模塊,構(gòu)建基準(zhǔn)測試平臺(tái)。最后,基于該平臺(tái),對(duì)優(yōu)化前后架構(gòu)在典型模型上的性能進(jìn)行全面評(píng)估。
(5)第五階段:項(xiàng)目總結(jié)與成果整理(第25-30個(gè)月)
總結(jié)項(xiàng)目研究成果,撰寫論文、專利等,并整理項(xiàng)目資料,為后續(xù)研究提供參考。
通過上述技術(shù)路線,本項(xiàng)目將系統(tǒng)性地開展面向新一代芯片的異構(gòu)計(jì)算架構(gòu)優(yōu)化與性能評(píng)估研究,為芯片的發(fā)展提供關(guān)鍵技術(shù)支撐。
七.創(chuàng)新點(diǎn)
本項(xiàng)目面向新一代芯片的異構(gòu)計(jì)算架構(gòu)優(yōu)化與性能評(píng)估,在理論、方法及應(yīng)用層面均體現(xiàn)了顯著的創(chuàng)新性:
1.理論創(chuàng)新:構(gòu)建面向任務(wù)的異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)模型,突破傳統(tǒng)架構(gòu)設(shè)計(jì)范式
現(xiàn)有異構(gòu)計(jì)算架構(gòu)設(shè)計(jì)多基于靜態(tài)或經(jīng)驗(yàn)性規(guī)則,缺乏對(duì)任務(wù)特性的深度理解和動(dòng)態(tài)適應(yīng)能力。本項(xiàng)目提出的異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)模型,在理論層面實(shí)現(xiàn)了三大突破:
首先,建立了任務(wù)特性與異構(gòu)計(jì)算單元能力的精準(zhǔn)匹配理論。通過深度分析Transformer、YOLOv5等典型模型的不同層級(jí)的計(jì)算復(fù)雜度、數(shù)據(jù)訪問模式、內(nèi)存帶寬需求等特性,結(jié)合CPU、FPGA、GPU等異構(gòu)計(jì)算單元在計(jì)算精度、并行能力、延遲、功耗、可重構(gòu)性等方面的能力差異,構(gòu)建了多維度、精細(xì)化的能力匹配理論框架。該框架突破了傳統(tǒng)架構(gòu)設(shè)計(jì)中“一刀切”的資源分配方式,實(shí)現(xiàn)了算子級(jí)的動(dòng)態(tài)任務(wù)分配與資源共享,為異構(gòu)計(jì)算架構(gòu)設(shè)計(jì)提供了全新的理論指導(dǎo)。
其次,提出了基于數(shù)據(jù)流驅(qū)動(dòng)的任務(wù)劃分與調(diào)度理論。不同于傳統(tǒng)基于計(jì)算復(fù)雜度的任務(wù)劃分方法,本項(xiàng)目創(chuàng)新性地提出基于數(shù)據(jù)流驅(qū)動(dòng)的任務(wù)劃分與調(diào)度理論,通過分析模型內(nèi)部的數(shù)據(jù)依賴關(guān)系與數(shù)據(jù)流向,將計(jì)算任務(wù)劃分為更細(xì)粒度的子任務(wù),并根據(jù)數(shù)據(jù)流特性動(dòng)態(tài)分配到最合適的計(jì)算單元。這種數(shù)據(jù)流驅(qū)動(dòng)的任務(wù)劃分與調(diào)度理論,能夠更有效地利用異構(gòu)計(jì)算單元的計(jì)算與存儲(chǔ)能力,提升系統(tǒng)整體性能。
最后,建立了異構(gòu)計(jì)算系統(tǒng)的性能-功耗協(xié)同優(yōu)化理論。本項(xiàng)目突破了傳統(tǒng)架構(gòu)設(shè)計(jì)中性能與功耗相互制約的固有認(rèn)知,建立了性能-功耗協(xié)同優(yōu)化理論,通過聯(lián)合優(yōu)化計(jì)算單元的電壓頻率調(diào)整與任務(wù)調(diào)度策略,實(shí)現(xiàn)了在保證性能的前提下,最大化系統(tǒng)能效比。該理論為低功耗芯片設(shè)計(jì)提供了全新的理論指導(dǎo)。
2.方法創(chuàng)新:開發(fā)自適應(yīng)功耗管理機(jī)制,實(shí)現(xiàn)芯片能效比顯著提升
現(xiàn)有芯片功耗管理技術(shù)多基于靜態(tài)或簡單的動(dòng)態(tài)調(diào)整策略,難以適應(yīng)任務(wù)計(jì)算的動(dòng)態(tài)變化,導(dǎo)致功耗控制效果有限。本項(xiàng)目開發(fā)的自適應(yīng)功耗管理機(jī)制,在方法層面實(shí)現(xiàn)了三大創(chuàng)新:
首先,提出了基于機(jī)器學(xué)習(xí)的計(jì)算負(fù)載與功耗預(yù)測方法。通過收集大量任務(wù)計(jì)算數(shù)據(jù),包括計(jì)算單元的利用率、數(shù)據(jù)訪問延遲、功耗等,訓(xùn)練一個(gè)能夠準(zhǔn)確預(yù)測任務(wù)計(jì)算負(fù)載與功耗的機(jī)器學(xué)習(xí)模型。該模型能夠?qū)崟r(shí)監(jiān)測系統(tǒng)負(fù)載與功耗,并根據(jù)預(yù)測結(jié)果,動(dòng)態(tài)調(diào)整計(jì)算單元的電壓頻率與任務(wù)調(diào)度策略,實(shí)現(xiàn)功耗的精細(xì)化管理。
其次,設(shè)計(jì)了聯(lián)合優(yōu)化算法,實(shí)現(xiàn)計(jì)算單元的動(dòng)態(tài)電壓頻率調(diào)整與任務(wù)調(diào)度優(yōu)化。本項(xiàng)目提出的聯(lián)合優(yōu)化算法,不僅能夠根據(jù)預(yù)測結(jié)果動(dòng)態(tài)調(diào)整計(jì)算單元的電壓頻率,還能夠根據(jù)計(jì)算單元的實(shí)時(shí)工作狀態(tài),動(dòng)態(tài)調(diào)整任務(wù)調(diào)度策略,實(shí)現(xiàn)計(jì)算資源的按需分配與節(jié)能優(yōu)化。該算法突破了傳統(tǒng)功耗管理技術(shù)中電壓頻率調(diào)整與任務(wù)調(diào)度相互獨(dú)立的局限,實(shí)現(xiàn)了兩者之間的協(xié)同優(yōu)化。
最后,開發(fā)了實(shí)時(shí)監(jiān)測與反饋機(jī)制。本項(xiàng)目設(shè)計(jì)的實(shí)時(shí)監(jiān)測與反饋機(jī)制,能夠?qū)崟r(shí)收集計(jì)算單元的工作狀態(tài)信息,并根據(jù)這些信息,動(dòng)態(tài)調(diào)整功耗管理策略,實(shí)現(xiàn)功耗管理的閉環(huán)控制。該機(jī)制能夠有效應(yīng)對(duì)任務(wù)計(jì)算的動(dòng)態(tài)變化,確保功耗管理效果。
3.應(yīng)用創(chuàng)新:探索非馮·諾依曼架構(gòu)在計(jì)算中的應(yīng)用潛力,引領(lǐng)芯片架構(gòu)發(fā)展方向
現(xiàn)有芯片架構(gòu)仍基于馮·諾依曼體系結(jié)構(gòu),存在計(jì)算與存儲(chǔ)分離、數(shù)據(jù)傳輸瓶頸等問題,限制了芯片性能的進(jìn)一步提升。本項(xiàng)目探索的非馮·諾依曼架構(gòu)在計(jì)算中的應(yīng)用潛力,在應(yīng)用層面實(shí)現(xiàn)了兩大創(chuàng)新:
首先,設(shè)計(jì)了一種新型存儲(chǔ)-計(jì)算協(xié)同范式。本項(xiàng)目借鑒量子計(jì)算中的糾纏與疊加等概念,設(shè)計(jì)了一種新型存儲(chǔ)-計(jì)算協(xié)同范式,將計(jì)算單元與存儲(chǔ)單元緊密耦合,實(shí)現(xiàn)數(shù)據(jù)在計(jì)算單元與存儲(chǔ)單元之間的快速傳輸與處理,突破了傳統(tǒng)架構(gòu)中數(shù)據(jù)傳輸瓶頸的限制。該范式能夠顯著提升芯片的計(jì)算效率,為未來芯片架構(gòu)發(fā)展提供了全新的方向。
其次,開發(fā)了量子-inspired計(jì)算單元原型。本項(xiàng)目基于設(shè)計(jì)的存儲(chǔ)-計(jì)算協(xié)同范式,開發(fā)了量子-inspired計(jì)算單元原型,并在原型驗(yàn)證平臺(tái)上進(jìn)行了測試。測試結(jié)果表明,該原型能夠有效加速計(jì)算任務(wù),為非馮·諾依曼架構(gòu)在計(jì)算中的應(yīng)用提供了實(shí)驗(yàn)證據(jù)。該原型為未來芯片架構(gòu)的發(fā)展提供了重要的技術(shù)儲(chǔ)備。
綜上所述,本項(xiàng)目在理論、方法及應(yīng)用層面均體現(xiàn)了顯著的創(chuàng)新性,有望推動(dòng)芯片向更高性能、更低功耗方向發(fā)展,為智能汽車、醫(yī)療影像等領(lǐng)域的應(yīng)用提供關(guān)鍵技術(shù)支撐,引領(lǐng)芯片架構(gòu)發(fā)展新方向。
八.預(yù)期成果
本項(xiàng)目預(yù)期在理論研究、技術(shù)創(chuàng)新、人才培養(yǎng)及知識(shí)產(chǎn)權(quán)等方面取得豐碩成果,具體包括:
1.理論貢獻(xiàn):構(gòu)建一套完整的異構(gòu)計(jì)算架構(gòu)優(yōu)化理論體系
本項(xiàng)目預(yù)期在以下幾個(gè)方面做出理論貢獻(xiàn):
首先,建立一套完整的面向任務(wù)的異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)理論。通過本項(xiàng)目的研究,將形成一套系統(tǒng)的理論框架,用于指導(dǎo)異構(gòu)計(jì)算單元的協(xié)同設(shè)計(jì),包括任務(wù)特性分析方法、單元能力模型、動(dòng)態(tài)任務(wù)分配算法等。這套理論框架將突破傳統(tǒng)架構(gòu)設(shè)計(jì)中靜態(tài)或經(jīng)驗(yàn)性規(guī)則的局限,為異構(gòu)計(jì)算架構(gòu)設(shè)計(jì)提供全新的理論指導(dǎo),推動(dòng)異構(gòu)計(jì)算理論的發(fā)展。
其次,發(fā)展一套自適應(yīng)功耗管理理論。本項(xiàng)目預(yù)期提出的自適應(yīng)功耗管理機(jī)制,將形成一套系統(tǒng)的理論框架,用于指導(dǎo)芯片的功耗管理,包括計(jì)算負(fù)載與功耗預(yù)測模型、聯(lián)合優(yōu)化算法、實(shí)時(shí)監(jiān)測與反饋機(jī)制等。這套理論框架將突破傳統(tǒng)功耗管理技術(shù)中靜態(tài)或簡單動(dòng)態(tài)調(diào)整的局限,為低功耗芯片設(shè)計(jì)提供全新的理論指導(dǎo),推動(dòng)芯片功耗管理理論的發(fā)展。
最后,探索并初步建立非馮·諾依曼架構(gòu)在計(jì)算中的應(yīng)用理論。本項(xiàng)目預(yù)期提出的存儲(chǔ)-計(jì)算協(xié)同范式和量子-inspired計(jì)算單元,將為非馮·諾依曼架構(gòu)在計(jì)算中的應(yīng)用提供理論基礎(chǔ),推動(dòng)芯片架構(gòu)理論的創(chuàng)新發(fā)展。這將為未來芯片的發(fā)展提供全新的方向,具有重要的理論意義。
2.技術(shù)創(chuàng)新:開發(fā)一系列具有自主知識(shí)產(chǎn)權(quán)的核心技術(shù)
本項(xiàng)目預(yù)期在以下幾個(gè)方面開發(fā)具有自主知識(shí)產(chǎn)權(quán)的核心技術(shù):
首先,開發(fā)一套面向任務(wù)的異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)工具?;诒卷?xiàng)目提出的異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)模型,開發(fā)一套實(shí)用的工具,用于輔助異構(gòu)計(jì)算架構(gòu)的設(shè)計(jì),包括任務(wù)特性分析工具、單元能力評(píng)估工具、動(dòng)態(tài)任務(wù)分配工具等。該工具將提高異構(gòu)計(jì)算架構(gòu)設(shè)計(jì)的效率和質(zhì)量,具有重要的應(yīng)用價(jià)值。
其次,開發(fā)一套自適應(yīng)功耗管理軟件?;诒卷?xiàng)目提出的自適應(yīng)功耗管理機(jī)制,開發(fā)一套軟件,用于實(shí)現(xiàn)芯片的功耗管理,包括計(jì)算負(fù)載與功耗預(yù)測模型、聯(lián)合優(yōu)化算法、實(shí)時(shí)監(jiān)測與反饋機(jī)制等。該軟件將有效降低芯片的功耗,具有重要的應(yīng)用價(jià)值。
最后,開發(fā)一套非馮·諾依曼架構(gòu)原型驗(yàn)證平臺(tái)?;诒卷?xiàng)目提出的存儲(chǔ)-計(jì)算協(xié)同范式和量子-inspired計(jì)算單元,開發(fā)一套原型驗(yàn)證平臺(tái),用于驗(yàn)證非馮·諾依曼架構(gòu)在計(jì)算中的應(yīng)用潛力。該平臺(tái)將為未來芯片的發(fā)展提供重要的技術(shù)儲(chǔ)備,具有重要的應(yīng)用價(jià)值。
3.實(shí)踐應(yīng)用價(jià)值:推動(dòng)芯片在多個(gè)領(lǐng)域的應(yīng)用
本項(xiàng)目預(yù)期開發(fā)的成果將具有廣泛的實(shí)踐應(yīng)用價(jià)值,能夠推動(dòng)芯片在多個(gè)領(lǐng)域的應(yīng)用:
首先,本項(xiàng)目開發(fā)的異構(gòu)計(jì)算架構(gòu)優(yōu)化方案,將能夠顯著提升芯片的性能和能效,降低芯片的開發(fā)成本,推動(dòng)芯片在智能汽車、智能安防、智能醫(yī)療等領(lǐng)域的應(yīng)用。例如,在智能汽車領(lǐng)域,本項(xiàng)目開發(fā)的方案將能夠提升自動(dòng)駕駛系統(tǒng)的感知和決策能力,提高自動(dòng)駕駛系統(tǒng)的安全性。
其次,本項(xiàng)目開發(fā)的自適應(yīng)功耗管理機(jī)制,將能夠有效降低芯片的功耗,延長芯片的續(xù)航時(shí)間,推動(dòng)芯片在移動(dòng)端設(shè)備、嵌入式設(shè)備等領(lǐng)域的應(yīng)用。例如,在移動(dòng)端設(shè)備領(lǐng)域,本項(xiàng)目開發(fā)的機(jī)制將能夠提升移動(dòng)端設(shè)備的電池續(xù)航時(shí)間,提高移動(dòng)端設(shè)備的用戶體驗(yàn)。
最后,本項(xiàng)目探索的非馮·諾依曼架構(gòu),將為未來芯片的發(fā)展提供全新的方向,推動(dòng)芯片在更多領(lǐng)域的應(yīng)用。例如,在量子計(jì)算領(lǐng)域,本項(xiàng)目探索的非馮·諾依曼架構(gòu),將為量子計(jì)算與的融合提供新的思路,推動(dòng)量子計(jì)算技術(shù)的發(fā)展。
4.人才培養(yǎng):培養(yǎng)一批高素質(zhì)的芯片研發(fā)人才
本項(xiàng)目預(yù)期培養(yǎng)一批高素質(zhì)的芯片研發(fā)人才,為我國芯片產(chǎn)業(yè)的發(fā)展提供人才支撐。項(xiàng)目團(tuán)隊(duì)將匯聚來自高校、科研院所和企業(yè)的優(yōu)秀人才,通過項(xiàng)目實(shí)施,培養(yǎng)一批具有國際視野和創(chuàng)新能力的芯片研發(fā)人才。項(xiàng)目團(tuán)隊(duì)將積極開展學(xué)術(shù)交流和技術(shù)培訓(xùn),提高項(xiàng)目團(tuán)隊(duì)成員的科研水平和工程能力。
5.知識(shí)產(chǎn)權(quán):形成一系列高質(zhì)量的知識(shí)產(chǎn)權(quán)成果
本項(xiàng)目預(yù)期形成一系列高質(zhì)量的知識(shí)產(chǎn)權(quán)成果,包括發(fā)明專利、實(shí)用新型專利、軟件著作權(quán)等。項(xiàng)目團(tuán)隊(duì)將積極申請(qǐng)專利,保護(hù)項(xiàng)目成果的知識(shí)產(chǎn)權(quán)。項(xiàng)目團(tuán)隊(duì)還將積極發(fā)表論文,推廣項(xiàng)目成果,提升項(xiàng)目成果的影響力。
綜上所述,本項(xiàng)目預(yù)期在理論研究、技術(shù)創(chuàng)新、人才培養(yǎng)及知識(shí)產(chǎn)權(quán)等方面取得豐碩成果,為我國芯片產(chǎn)業(yè)的發(fā)展提供重要的技術(shù)支撐和人才支撐,具有重要的理論意義和應(yīng)用價(jià)值。
九.項(xiàng)目實(shí)施計(jì)劃
1.項(xiàng)目時(shí)間規(guī)劃
本項(xiàng)目計(jì)劃總時(shí)長為30個(gè)月,分為五個(gè)階段實(shí)施,每個(gè)階段包含具體的任務(wù)分配和進(jìn)度安排,確保項(xiàng)目按計(jì)劃推進(jìn)。
(1)第一階段:異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)模型研究(第1-6個(gè)月)
任務(wù)分配:
第1-2個(gè)月:完成文獻(xiàn)調(diào)研,梳理國內(nèi)外異構(gòu)計(jì)算架構(gòu)優(yōu)化領(lǐng)域的最新研究成果,形成文獻(xiàn)綜述報(bào)告。
第3-4個(gè)月:對(duì)典型模型(Transformer、YOLOv5等)進(jìn)行深度分析,提取其計(jì)算特性與數(shù)據(jù)流向,形成模型特性分析報(bào)告。
第5-6個(gè)月:建立異構(gòu)計(jì)算單元的計(jì)算與存儲(chǔ)能力模型,分析各單元的計(jì)算優(yōu)勢與存儲(chǔ)瓶頸,形成異構(gòu)計(jì)算單元能力模型報(bào)告。同時(shí),初步設(shè)計(jì)算子級(jí)的動(dòng)態(tài)任務(wù)分配算法。
進(jìn)度安排:
第1個(gè)月:完成文獻(xiàn)調(diào)研,形成文獻(xiàn)綜述報(bào)告。
第2個(gè)月:繼續(xù)文獻(xiàn)調(diào)研,并開始模型特性分析。
第3個(gè)月:完成模型特性分析,并開始異構(gòu)計(jì)算單元能力模型研究。
第4個(gè)月:完成異構(gòu)計(jì)算單元能力模型研究,并開始算子級(jí)動(dòng)態(tài)任務(wù)分配算法設(shè)計(jì)。
第5個(gè)月:完成算子級(jí)動(dòng)態(tài)任務(wù)分配算法設(shè)計(jì)初稿。
第6個(gè)月:完成算子級(jí)動(dòng)態(tài)任務(wù)分配算法詳細(xì)設(shè)計(jì),并進(jìn)行初步仿真驗(yàn)證。
(2)第二階段:自適應(yīng)功耗管理機(jī)制研究(第7-12個(gè)月)
任務(wù)分配:
第7-8個(gè)月:設(shè)計(jì)一種實(shí)時(shí)監(jiān)測系統(tǒng)負(fù)載與功耗的傳感器網(wǎng)絡(luò),完成傳感器網(wǎng)絡(luò)設(shè)計(jì)方案。
第9-10個(gè)月:基于收集到的數(shù)據(jù),開發(fā)一種聯(lián)合優(yōu)化算法,實(shí)現(xiàn)計(jì)算單元的動(dòng)態(tài)電壓頻率調(diào)整與任務(wù)調(diào)度優(yōu)化,完成聯(lián)合優(yōu)化算法設(shè)計(jì)。
第11-12個(gè)月:通過仿真實(shí)驗(yàn),評(píng)估該機(jī)制在典型模型上的性能與能效提升效果,完成仿真實(shí)驗(yàn)報(bào)告。
進(jìn)度安排:
第7個(gè)月:完成傳感器網(wǎng)絡(luò)設(shè)計(jì)方案。
第8個(gè)月:繼續(xù)傳感器網(wǎng)絡(luò)設(shè)計(jì),并開始聯(lián)合優(yōu)化算法設(shè)計(jì)。
第9個(gè)月:完成聯(lián)合優(yōu)化算法設(shè)計(jì)初稿。
第10個(gè)月:完成聯(lián)合優(yōu)化算法詳細(xì)設(shè)計(jì),并進(jìn)行初步仿真驗(yàn)證。
第11個(gè)月:完成仿真實(shí)驗(yàn),并開始撰寫仿真實(shí)驗(yàn)報(bào)告。
第12個(gè)月:完成仿真實(shí)驗(yàn)報(bào)告,并進(jìn)行項(xiàng)目中期檢查。
(3)第三階段:非馮·諾依曼架構(gòu)在計(jì)算中的應(yīng)用潛力探索(第13-18個(gè)月)
任務(wù)分配:
第13-14個(gè)月:研究量子計(jì)算理論中的糾纏與疊加等概念,分析其在計(jì)算與存儲(chǔ)方面的應(yīng)用潛力,完成量子計(jì)算理論應(yīng)用分析報(bào)告。
第15-16個(gè)月:設(shè)計(jì)一種新型存儲(chǔ)-計(jì)算協(xié)同范式,將量子-inspired計(jì)算單元引入異構(gòu)計(jì)算系統(tǒng)中,完成新型存儲(chǔ)-計(jì)算協(xié)同范式設(shè)計(jì)方案。
第17-18個(gè)月:利用量子計(jì)算模擬器,對(duì)該范式進(jìn)行仿真驗(yàn)證,完成仿真驗(yàn)證報(bào)告。
進(jìn)度安排:
第13個(gè)月:完成量子計(jì)算理論應(yīng)用分析報(bào)告。
第14個(gè)月:繼續(xù)量子計(jì)算理論應(yīng)用分析,并開始新型存儲(chǔ)-計(jì)算協(xié)同范式設(shè)計(jì)。
第15個(gè)月:完成新型存儲(chǔ)-計(jì)算協(xié)同范式設(shè)計(jì)初稿。
第16個(gè)月:完成新型存儲(chǔ)-計(jì)算協(xié)同范式詳細(xì)設(shè)計(jì),并進(jìn)行初步仿真驗(yàn)證。
第17個(gè)月:完成仿真驗(yàn)證,并開始撰寫仿真驗(yàn)證報(bào)告。
第18個(gè)月:完成仿真驗(yàn)證報(bào)告,并進(jìn)行項(xiàng)目中期檢查。
(4)第四階段:基準(zhǔn)測試平臺(tái)與性能評(píng)估工具鏈開發(fā)(第19-24個(gè)月)
任務(wù)分配:
第19個(gè)月:設(shè)計(jì)一套芯片性能評(píng)估指標(biāo)體系,包括延遲、吞吐量、能效比等,完成性能評(píng)估指標(biāo)體系設(shè)計(jì)方案。
第20-21個(gè)月:開發(fā)任務(wù)生成器、模擬器、性能分析器等模塊,構(gòu)建基準(zhǔn)測試平臺(tái)。
第22-23個(gè)月:基于該平臺(tái),對(duì)優(yōu)化前后架構(gòu)在典型模型上的性能進(jìn)行全面評(píng)估,完成性能評(píng)估報(bào)告。
第24個(gè)月:優(yōu)化性能評(píng)估工具鏈,并進(jìn)行項(xiàng)目中期檢查。
進(jìn)度安排:
第19個(gè)月:完成性能評(píng)估指標(biāo)體系設(shè)計(jì)方案。
第20個(gè)月:開始任務(wù)生成器開發(fā)。
第21個(gè)月:繼續(xù)任務(wù)生成器開發(fā),并開始模擬器開發(fā)。
第22個(gè)月:完成模擬器開發(fā),并開始性能分析器開發(fā)。
第23個(gè)月:完成性能分析器開發(fā),并開始性能評(píng)估,撰寫性能評(píng)估報(bào)告。
第24個(gè)月:完成性能評(píng)估報(bào)告,并進(jìn)行項(xiàng)目中期檢查。
(5)第五階段:項(xiàng)目總結(jié)與成果整理(第25-30個(gè)月)
任務(wù)分配:
第25-26個(gè)月:總結(jié)項(xiàng)目研究成果,撰寫論文、專利等,并整理項(xiàng)目資料。
第27-28個(gè)月:項(xiàng)目成果展示,并與相關(guān)企業(yè)進(jìn)行技術(shù)交流。
第29-30個(gè)月:完成項(xiàng)目結(jié)題報(bào)告,并進(jìn)行項(xiàng)目總結(jié)。
進(jìn)度安排:
第25個(gè)月:開始項(xiàng)目研究成果總結(jié),并開始撰寫論文。
第26個(gè)月:繼續(xù)項(xiàng)目研究成果總結(jié),并開始撰寫專利。
第27個(gè)月:完成論文和專利撰寫,并開始項(xiàng)目資料整理。
第28個(gè)月:完成項(xiàng)目資料整理,并項(xiàng)目成果展示。
第29個(gè)月:完成項(xiàng)目結(jié)題報(bào)告初稿。
第30個(gè)月:完成項(xiàng)目結(jié)題報(bào)告終稿,并進(jìn)行項(xiàng)目總結(jié)。
2.風(fēng)險(xiǎn)管理策略
本項(xiàng)目在實(shí)施過程中可能面臨以下風(fēng)險(xiǎn):
(1)技術(shù)風(fēng)險(xiǎn):異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)模型、自適應(yīng)功耗管理機(jī)制、非馮·諾依曼架構(gòu)等技術(shù)難度較大,可能存在技術(shù)實(shí)現(xiàn)困難。
風(fēng)險(xiǎn)管理策略:
建立技術(shù)攻關(guān)小組,由經(jīng)驗(yàn)豐富的技術(shù)專家負(fù)責(zé),定期召開技術(shù)研討會(huì),及時(shí)解決技術(shù)難題。同時(shí),加強(qiáng)與高校和科研院所的合作,引入外部技術(shù)資源,共同攻克技術(shù)難關(guān)。
(2)進(jìn)度風(fēng)險(xiǎn):項(xiàng)目實(shí)施過程中可能遇到各種unforeseen情況,導(dǎo)致項(xiàng)目進(jìn)度延誤。
風(fēng)險(xiǎn)管理策略:
制定詳細(xì)的項(xiàng)目進(jìn)度計(jì)劃,并定期進(jìn)行進(jìn)度檢查,及時(shí)發(fā)現(xiàn)并解決進(jìn)度偏差。同時(shí),建立應(yīng)急預(yù)案,針對(duì)可能出現(xiàn)的意外情況,提前做好應(yīng)對(duì)準(zhǔn)備。
(3)人員風(fēng)險(xiǎn):項(xiàng)目團(tuán)隊(duì)成員可能存在人員變動(dòng),導(dǎo)致項(xiàng)目進(jìn)度受到影響。
風(fēng)險(xiǎn)管理策略:
建立人才培養(yǎng)機(jī)制,對(duì)項(xiàng)目團(tuán)隊(duì)成員進(jìn)行定期培訓(xùn),提高其專業(yè)技能和項(xiàng)目協(xié)作能力。同時(shí),與團(tuán)隊(duì)成員簽訂長期合作協(xié)議,穩(wěn)定團(tuán)隊(duì)結(jié)構(gòu)。
(4)資金風(fēng)險(xiǎn):項(xiàng)目資金可能存在短缺或無法及時(shí)到位的情況,影響項(xiàng)目實(shí)施。
風(fēng)險(xiǎn)管理策略:
積極爭取政府和企業(yè)資金支持,建立多元化的資金籌措渠道。同時(shí),加強(qiáng)項(xiàng)目成本管理,合理控制項(xiàng)目支出,確保資金使用效率。
通過上述風(fēng)險(xiǎn)管理策略,本項(xiàng)目將有效應(yīng)對(duì)各種風(fēng)險(xiǎn),確保項(xiàng)目順利實(shí)施,實(shí)現(xiàn)預(yù)期目標(biāo)。
十.項(xiàng)目團(tuán)隊(duì)
1.項(xiàng)目團(tuán)隊(duì)成員的專業(yè)背景與研究經(jīng)驗(yàn)
本項(xiàng)目團(tuán)隊(duì)由來自國內(nèi)頂尖高校和科研機(jī)構(gòu)的12名研究人員組成,涵蓋了計(jì)算機(jī)體系結(jié)構(gòu)、、電子工程、量子計(jì)算等多個(gè)領(lǐng)域的專家學(xué)者,具有豐富的理論基礎(chǔ)和工程實(shí)踐經(jīng)驗(yàn),能夠?yàn)轫?xiàng)目的順利實(shí)施提供全方位的技術(shù)支持。團(tuán)隊(duì)成員專業(yè)背景與研究經(jīng)驗(yàn)具體如下:
首先,項(xiàng)目負(fù)責(zé)人張明教授,博士畢業(yè)于清華大學(xué)計(jì)算機(jī)系,長期從事計(jì)算機(jī)體系結(jié)構(gòu)研究,在異構(gòu)計(jì)算、片上網(wǎng)絡(luò)(NoC)設(shè)計(jì)等領(lǐng)域具有深厚的學(xué)術(shù)造詣。曾主持國家自然科學(xué)基金重點(diǎn)項(xiàng)目“面向的異構(gòu)計(jì)算架構(gòu)研究”,發(fā)表高水平論文30余篇,其中SCI論文20余篇,并擁有多項(xiàng)發(fā)明專利。在項(xiàng)目實(shí)施過程中,將負(fù)責(zé)整體技術(shù)路線規(guī)劃、關(guān)鍵技術(shù)研究方案的制定以及項(xiàng)目進(jìn)度管理。
其次,項(xiàng)目核心成員李強(qiáng)博士,畢業(yè)于北京大學(xué)電子系,專注于芯片設(shè)計(jì)與應(yīng)用研究,在深度學(xué)習(xí)處理器架構(gòu)、硬件加速器設(shè)計(jì)等方面具有豐富經(jīng)驗(yàn)。曾參與華為海思昇騰芯片的設(shè)計(jì)研發(fā)工作,發(fā)表頂級(jí)會(huì)議論文10余篇,擁有多項(xiàng)軟件著作權(quán)。在項(xiàng)目中將負(fù)責(zé)異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)模型的實(shí)現(xiàn)與仿真驗(yàn)證、性能評(píng)估工具鏈的開發(fā)工作。
再次,項(xiàng)目核心成員王麗博士,畢業(yè)于浙江大學(xué)計(jì)算機(jī)系,研究方向?yàn)樗惴ㄅc硬件協(xié)同設(shè)計(jì),在神經(jīng)網(wǎng)絡(luò)模型優(yōu)化、硬件映射算法等方面具有突出貢獻(xiàn)。曾參與多項(xiàng)國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目,發(fā)表CCFA類會(huì)議論文8篇,擁有多項(xiàng)專利。在項(xiàng)目中將負(fù)責(zé)自適應(yīng)功耗管理機(jī)制的研究與實(shí)現(xiàn),包括功耗預(yù)測模型、聯(lián)合優(yōu)化算法等。
此外,項(xiàng)目核心成員劉偉教授,博士畢業(yè)于中科院計(jì)算所,研究方向?yàn)榉邱T·諾依曼架構(gòu)與量子計(jì)算,在存算一體化設(shè)計(jì)、量子-inspired計(jì)算單元等方面具有創(chuàng)新性成果。曾主持國家自然科學(xué)基金面上項(xiàng)目“基于存算一體芯片的計(jì)算加速方法研究”,發(fā)表IEEETransactions論文5篇,擁有多項(xiàng)發(fā)明專利。在項(xiàng)目中將負(fù)責(zé)非馮·諾依曼架構(gòu)在計(jì)算中的應(yīng)用潛力探索,包括新型存儲(chǔ)-計(jì)算協(xié)同范式的設(shè)計(jì)與量子-inspired計(jì)算單元的原型開發(fā)。
項(xiàng)目核心成員趙敏博士,畢業(yè)于上海交通大學(xué)微電子學(xué)院,研究方向?yàn)樾酒锢碓O(shè)計(jì),在低功耗設(shè)計(jì)、三維集成電路等方面具有豐富經(jīng)驗(yàn)。曾參與Intel下一代芯片的物理設(shè)計(jì)項(xiàng)目,發(fā)表IEEE論文10余篇,擁有多項(xiàng)實(shí)用新型專利。在項(xiàng)目中將負(fù)責(zé)基準(zhǔn)測試平臺(tái)與性能評(píng)估工具鏈的開發(fā),包括硬件仿真環(huán)境搭建、測試用例設(shè)計(jì)、性能分析工具開發(fā)等。
項(xiàng)目核心成員孫鵬博士,畢業(yè)于清華大學(xué)電子系,研究方向?yàn)樾酒瑴y試與驗(yàn)證,在硬件測試方法、故障注入模型等方面具有深厚造詣。曾參與國家集成電路產(chǎn)業(yè)發(fā)展推進(jìn)綱要相關(guān)研究項(xiàng)目,發(fā)表測試領(lǐng)域國際會(huì)議論文6篇,擁有多項(xiàng)軟件著作權(quán)。在項(xiàng)目中將負(fù)責(zé)項(xiàng)目測試方案設(shè)計(jì)、測試平臺(tái)搭建、測試結(jié)果分析等工作。
項(xiàng)目核心成員周娜博士,畢業(yè)于西安交通大學(xué)計(jì)算機(jī)系,研究方向?yàn)闄C(jī)器學(xué)習(xí)算法優(yōu)化,在模型壓縮、量化、加速等方面具有豐富經(jīng)驗(yàn)。曾參與谷歌加速器優(yōu)化項(xiàng)目,發(fā)表頂級(jí)會(huì)議論文12篇,擁有多項(xiàng)軟件專利。在項(xiàng)目中將負(fù)責(zé)模型優(yōu)化算法研究,為異構(gòu)計(jì)算單元協(xié)同設(shè)計(jì)提供算法支持,并參與性能評(píng)估體系的構(gòu)建。
項(xiàng)目核心成員吳剛博士,畢業(yè)于哈爾濱工業(yè)大學(xué)計(jì)算機(jī)系,研究方向?yàn)橛?jì)算機(jī)體系結(jié)構(gòu),在片上網(wǎng)絡(luò)設(shè)計(jì)、性能建模等方面具有突出貢獻(xiàn)。曾主持多項(xiàng)企業(yè)合作項(xiàng)目,發(fā)表IEEETransactions論文7篇,擁有多項(xiàng)發(fā)明專利。在項(xiàng)目中將負(fù)責(zé)異構(gòu)計(jì)算架構(gòu)的仿真模型搭建與性能預(yù)測,為項(xiàng)目提供技術(shù)支撐。
項(xiàng)目核心成員鄭潔博士,畢業(yè)于南京大學(xué)電子系,研究方向?yàn)樾酒O(shè)計(jì),在FPGA加速器設(shè)計(jì)、硬件-軟件協(xié)同設(shè)計(jì)等方面具有豐富經(jīng)驗(yàn)。曾參與國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目“面向計(jì)算的異構(gòu)計(jì)算架構(gòu)研究”,發(fā)表國際會(huì)議論文9篇,擁有多項(xiàng)軟件著作權(quán)。在項(xiàng)目中將負(fù)責(zé)異構(gòu)計(jì)算架構(gòu)的硬件實(shí)現(xiàn),包括FPGA原型開發(fā)、硬件加速器設(shè)計(jì)等。
項(xiàng)目核心成員陳浩博士,畢業(yè)于清華大學(xué)計(jì)算機(jī)系,研究方向?yàn)橛?jì)算機(jī)體系結(jié)構(gòu),在芯片設(shè)計(jì)自動(dòng)化方面具有創(chuàng)新性成果。曾參與華為海思芯片設(shè)計(jì)自動(dòng)化項(xiàng)目,發(fā)表頂級(jí)會(huì)議論文5篇,擁有多項(xiàng)軟件專利。在項(xiàng)目中將負(fù)責(zé)異構(gòu)計(jì)算架構(gòu)設(shè)計(jì)流程的優(yōu)化,包括設(shè)計(jì)工具
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 丙烯酸樹脂裝置操作工崗前評(píng)優(yōu)考核試卷含答案
- 鉭鈮加工材制取工崗前變更管理考核試卷含答案
- 松香浸提工崗前評(píng)審考核試卷含答案
- 土石方挖掘機(jī)司機(jī)班組考核競賽考核試卷含答案
- 貨運(yùn)調(diào)度員操作安全測試考核試卷含答案
- 煤提質(zhì)工崗前工藝規(guī)程考核試卷含答案
- 汽車美容裝潢工班組安全知識(shí)考核試卷含答案
- 玻纖織布帶工誠信模擬考核試卷含答案
- 電工合金金屬粉末處理工崗前進(jìn)階考核試卷含答案
- 平板顯示膜涂布工班組評(píng)比競賽考核試卷含答案
- 裝配式建筑可行性研究報(bào)告
- 跨境電子商務(wù)教案
- 新人教部編版一年級(jí)下冊生字表全冊描紅字帖可打印
- 中國的“愛經(jīng)”(一)-《天地陰陽交⊥歡大樂賦》
- 中學(xué)保安工作管理制度
- 廣元市利州區(qū)何家坪石材廠飾面用灰?guī)r礦礦山地質(zhì)環(huán)境保護(hù)與土地復(fù)墾方案
- 保健按摩師初級(jí)試題
- 2021年度四川省專業(yè)技術(shù)人員繼續(xù)教育公需科目(答案整合)
- 醫(yī)療廢物處理方案
- 船舶靠離泊作業(yè)風(fēng)險(xiǎn)辨識(shí)表
- DB37T 2673-2019醫(yī)療機(jī)構(gòu)能源消耗定額標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論