版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
主講:張馳0102目錄打標(biāo)簽工具常見的數(shù)據(jù)集打標(biāo)簽的工具1(1)Labelimg/Labelme這兩款工具簡便易行,前者主要用于對目標(biāo)進行大致的標(biāo)定,用于常見的框選標(biāo)定,后者主要用于較為細(xì)致的輪廓標(biāo)定,多用于maskrcnn等。安裝也是很方便的,直接在終端下用pipinstalllabelimg即可(至于labelme,需要先安裝pyqt,所以先pipinstallpython-qt5,然后再pipinstalllabelme)。其使用界面如下:(2)NLP標(biāo)注工具BRATBRAT是一個基于web的文本標(biāo)注工具,主要用于對文本的結(jié)構(gòu)化標(biāo)注,用BRAT生成的標(biāo)注結(jié)果能夠把無結(jié)構(gòu)化的原始文本結(jié)構(gòu)化,供計算機處理。利用該工具可以方便的獲得各項NLP任務(wù)需要的標(biāo)注語料。其使用教程可參考/tcx1992/article/details/80580089。標(biāo)注結(jié)果示例如下:(3)視頻標(biāo)注工具CDVA(compactdescriptorforvideoanalysis),主要是基于CDVS中的緊湊視覺描述子來做視頻分析,之前是緊湊視覺描述子主要應(yīng)用在圖像檢索領(lǐng)域。需要制作新的數(shù)據(jù)集,對視頻幀進行標(biāo)注,所以根據(jù)網(wǎng)上一個博主的標(biāo)注工具進行了一定的修改,實現(xiàn)的功能是在每一幀中將需要標(biāo)注的區(qū)域用鼠標(biāo)選取4個點,順序是順時針。因為四邊形的范圍更廣,之前的一些人直接標(biāo)注了矩形,但是在一些仿射變換中,往往矩形的定位效果不好,矩形定位應(yīng)該比較適合于人臉定位和行人定位之中。其參考教程:/louyihang-loves-baiyan/p/4457462.html。Vatic源自MIT的一個研究項目(VideoAnnotationToolfromIrvine,California)。輸入一段視頻,支持自動抽取成粒度合適的標(biāo)注任務(wù)并在流程上支持接入亞馬遜的眾包平臺MechanicalTurk。除此之外,其還有很多實用的特性:1.簡潔使用的GUI界面,支持多種快捷鍵操作2.基于opencv的tracking,這樣就可以抽樣的標(biāo)注,減少工作量具體使用時,可以設(shè)定要標(biāo)注的物體label,比如:水果,人,車,等等。然后指派任務(wù)給到眾包平臺(也可是自己的數(shù)據(jù)工程師)。現(xiàn)階段支持的標(biāo)注樣式是框(box)。一個示例,下圖標(biāo)注了NBA直播比賽中的運動員.參考鏈接:/vondrick/vatic/常見的數(shù)據(jù)集21、目標(biāo)檢測、分類、分割(1)mnist
手寫字體識別是深度學(xué)習(xí)入門級數(shù)據(jù)樣本集,總共有70000張28*28的手寫字體黑白圖片,可在/exdb/mnist/獲?。?)PASCALVOCPASCALVOC挑戰(zhàn)賽是視覺對象的分類識別和檢測的一個基準(zhǔn)測試,提供了檢測算法和學(xué)習(xí)性能的標(biāo)準(zhǔn)圖像注釋數(shù)據(jù)集和標(biāo)準(zhǔn)的評估系統(tǒng)。PASCALVOC圖片集常見的有voc2005、voc2007、voc2012等,其包括20個目錄:人類;動物(鳥、貓、牛、狗、馬、羊);交通工具(飛機、自行車、船、公共汽車、小轎車、摩托車、火車);室內(nèi)(瓶子、椅子、餐桌、盆栽植物、沙發(fā)、電視)。PASCALVOC挑戰(zhàn)賽在2012年后便不再舉辦,但其數(shù)據(jù)集圖像質(zhì)量好,標(biāo)注完備,非常適合用來測試算法性能。數(shù)據(jù)集大小為2GB左右下載地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html1、目標(biāo)檢測、分類、分割(3)COCO數(shù)據(jù)集
COCO數(shù)據(jù)集由微軟贊助,其對于圖像的標(biāo)注信息不僅有類別、位置信息,還有對圖像的語義文本描述,COCO數(shù)據(jù)集的開源使得近兩三年來圖像分割語義理解取得了巨大的進展,也幾乎成為了圖像語義理解算法性能評價的“標(biāo)準(zhǔn)”數(shù)據(jù)集。Google開源的開源了圖說生成模型showandtell就是在此數(shù)據(jù)集上測試的,想玩的可以下下來試試哈。數(shù)據(jù)集大小約為40GB
下載地址:/,COCO(CommonObjectsinContext)是一個新的圖像識別、分割和圖像語義數(shù)據(jù)集,它有如下特點:ObjectsegmentationRecognitioninContextMultipleobjectsperimageMorethan300,000imagesMorethan2Millioninstances80objectcategories5captionsperimageKeypointson100,000people(4)
Imagenet數(shù)據(jù)集
業(yè)界標(biāo)桿Imagenet數(shù)據(jù)集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類別標(biāo)注和圖像中物體位置的標(biāo)注,具體信息如下:Totalnumberofnon-emptysynsets:21841Totalnumberofimages:14,197,122Numberofimageswithboundingboxannotations:1,034,908NumberofsynsetswithSIFTfeatures:1000NumberofimageswithSIFTfeatures:1.2million
Imagenet數(shù)據(jù)集是目前深度學(xué)習(xí)圖像領(lǐng)域應(yīng)用得非常多的一個領(lǐng)域,關(guān)于圖像分類、定位、檢測等研究工作大多基于此數(shù)據(jù)集展開。Imagenet數(shù)據(jù)集文檔詳細(xì),有專門的團隊維護,使用非常方便,在計算機視覺領(lǐng)域研究論文中應(yīng)用非常廣,幾乎成為了目前深度學(xué)習(xí)圖像領(lǐng)域算法性能檢驗的“標(biāo)準(zhǔn)”數(shù)據(jù)集。由李飛飛教授及其團隊創(chuàng)立,數(shù)據(jù)集大?。簙1TB(ILSVRC2016比賽全部數(shù)據(jù)),下載地址:/about-stats.2、行人檢測、人臉檢測識別(1)Caltech行人
數(shù)據(jù)庫:/Image_Datasets/CaltechPedestrians/該數(shù)據(jù)庫是目前規(guī)模較大的行人數(shù)據(jù)庫,采用車載攝像頭拍攝,約10個小時左右,視頻的分辨率為640×480,30幀/秒。標(biāo)注了約250,000幀(約137分鐘),350000個矩形框,2300個行人,另外還對矩形框之間的時間對應(yīng)關(guān)系及其遮擋的情況進行標(biāo)注。數(shù)據(jù)集分為set00~set10,其中set00~set05為訓(xùn)練集,set06~set10為測試集(標(biāo)注信息尚未公開)。其他數(shù)據(jù)集可參考:行人檢測:/17004.html(2)人臉檢測:UMDFaces(http://www.umdfaces.io/
)不僅有人臉的目標(biāo)檢測數(shù)據(jù),還有關(guān)鍵點的數(shù)據(jù),非常適合做訓(xùn)練。
就是比較大,總共有三個文件,一共8000+個類別,總共36W張人臉圖片,全都是經(jīng)過標(biāo)注的樣本,標(biāo)注信息保存在csv文件中,除了人臉的box,還有人臉特征點的方位信息,強力推薦?。?)人臉識別數(shù)據(jù)庫
2010年非約束環(huán)境人臉檢測數(shù)據(jù)庫FDDB,總共2845張圖像,5171張,人臉非約束環(huán)境,人臉的難度較大,有面部表情,雙下巴,光照變化,穿戴,夸張發(fā)型,遮擋等難點,是目標(biāo)最常用的數(shù)據(jù)庫。2016年提出的,目前難度最大的WIDERFACE,共32203圖像,393703標(biāo)注人臉,目前難度最大,各種難點比較全面:尺度,姿態(tài),遮擋,表情,化妝,光照等。李子青組的CASIA-WebFace(50萬,1萬個人).需申請.CenterforBiometricsandSecurityResearch
華盛頓大學(xué)百萬人臉MegaFace數(shù)據(jù)集.郵件申請,是一個60G的壓縮文件.MegaFace
南洋理工WLFDB.(70萬+,6,025).需申請.WLFDB:WeaklyLabeledFacesDatabase
微軟的MSRA-CFW(202792張,1583人).可以直接通過OneDrive下載.MSRA-CFW:DataSetofCelebrityFacesontheWeb
湯曉歐實驗室的CelebA(20萬+),標(biāo)注信息豐富.FaceScrub.提供圖片下載鏈接(100,100張,530人).vintage–resources(4)人體姿態(tài)識別(/qq_38522972/article/details/82953477)2D數(shù)據(jù):LSP
FLIC
MPII
MSCOCO
AIChallenge3D數(shù)據(jù):Human3.6M數(shù)據(jù)集
CMUPanopticdataset
MPI-INF-3DHP3、自動駕駛(/p/61023298(1)H3D-HRI-US
-本田研究所于2019年3月發(fā)布其無人駕駛方向數(shù)據(jù)集,使用3DLiDAR掃描儀收集的大型全環(huán)繞3D多目標(biāo)檢測和跟蹤數(shù)據(jù)集。其包含160個擁擠且高度互動的交通場景,在27,721幀中共有100萬個標(biāo)記實例。憑借獨特的數(shù)據(jù)集大小,豐富的注釋和復(fù)雜的場景,H3D聚集在一起,以激發(fā)對全環(huán)繞3D多目標(biāo)檢測和跟蹤的研究。(2)nuScenes
-安波福于2019年3月正式公開了其數(shù)據(jù)集,擁有從波士頓和新加坡收集的1000個“場景”的信息,包含每個城市環(huán)境中都有的最復(fù)雜的一些駕駛場景。該數(shù)據(jù)集由140萬張圖像、39萬次激光雷達(dá)掃描和140萬個3D人工注釋邊界框組成,是迄今為止公布的最大的多模態(tài)3D無人駕駛數(shù)據(jù)集。(3)ApolloCar3D-該數(shù)據(jù)集包含5,277個駕駛圖像和超過60K的汽車實例,其中每輛汽車都配備了具有絕對模型尺寸和語義標(biāo)記關(guān)鍵點的行業(yè)級3DCAD模型。該數(shù)據(jù)集比PASCA
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 巴中2025年四川巴中恩陽區(qū)選聘城區(qū)中小學(xué)教師25人筆試歷年參考題庫附帶答案詳解
- 安慶2025年安徽安慶市慈善總會招聘工作人員(勞務(wù)派遣制)筆試歷年參考題庫附帶答案詳解
- 嘉興浙江嘉興市發(fā)展和改革委員會招聘崗位合同工筆試歷年參考題庫附帶答案詳解
- 南京2025年江蘇南京農(nóng)業(yè)大學(xué)科研助理招聘6人(八)筆試歷年參考題庫附帶答案詳解
- 蘭州2025年甘肅蘭州市招聘中小學(xué)聘用制教師668人筆試歷年參考題庫附帶答案詳解
- 中國5G+智能電網(wǎng)行業(yè)市場運行態(tài)勢及發(fā)展趨勢預(yù)測報告-智研咨詢發(fā)布
- 企業(yè)品牌建設(shè)相關(guān)制度
- 倉庫進品查驗制度
- 小學(xué)生衛(wèi)生獎懲管理制度
- 中小學(xué)教學(xué)衛(wèi)生制度
- 2019-2020學(xué)年貴州省貴陽市八年級下學(xué)期期末考試物理試卷及答案解析
- 培訓(xùn)機構(gòu)轉(zhuǎn)課協(xié)議
- 河道治理、拓寬工程 投標(biāo)方案(技術(shù)方案)
- 創(chuàng)客教室建設(shè)方案
- 政治審查表(模板)
- (完整版)南京市房屋租賃合同
- 《最奇妙的蛋》完整版
- SEMI S1-1107原版完整文檔
- 內(nèi)蒙古衛(wèi)生健康委員會綜合保障中心公開招聘8人模擬預(yù)測(共1000題)筆試備考題庫及答案解析
- 2023年中級財務(wù)會計各章作業(yè)練習(xí)題
- 金屬罐三片罐成型方法與罐型
評論
0/150
提交評論