計(jì)算機(jī)視覺是人工智能的一個(gè)子集,專注于教機(jī)器如何正確解釋來自圖片、視頻幀和其他來源的數(shù)據(jù)。我們通常需要使用帶注釋的數(shù)據(jù)來監(jiān)控深度學(xué)習(xí)模型,以利用當(dāng)代計(jì)算機(jī)視覺技術(shù)。為了使用對象檢測和識別等計(jì)算機(jī)視覺技術(shù),需要使用這些對象的特定圖像實(shí)例訓(xùn)練 ML 模型并標(biāo)記它們。
以下是五種常用的計(jì)算機(jī)視覺注釋工具,用于對訓(xùn)練數(shù)據(jù)集進(jìn)行對象識別和標(biāo)記。
1. ?LabelImg
? : LabelImg 是一個(gè)開源的用于圖像處理和標(biāo)注的標(biāo)注工具。它是用 ?Python
?開發(fā)的,并有一個(gè)用 Qt 構(gòu)建的圖形用戶界面。這是一種快速且免費(fèi)的圖像標(biāo)簽方式。使用此標(biāo)記工具完成的注釋以 PASCAL VOC XML 格式保存。
2. ?Computer Vision Annotation Tool (CVAT)
?:Computer Vision Annotation Tool (CVAT) 是由 Intel 創(chuàng)建的免費(fèi)圖像標(biāo)記程序。它也是開源的,使用 ?CSS
?、?Python
?、?Django
?、?TypeScript
?和 ?React
?等編程語言編寫。CVAT 有助于監(jiān)督學(xué)習(xí)任務(wù),如對象檢測、圖像分割和分類等。 CVAT 提供強(qiáng)大的功能,可以利用深度學(xué)習(xí)模型進(jìn)行半自動注釋。
3.視覺對象標(biāo)記工具(?VOTT
?):微軟團(tuán)隊(duì)創(chuàng)建了一個(gè)視覺對象標(biāo)記工具(?VOTT
?)來使用計(jì)算機(jī)視覺識別和注釋視頻和圖像,并使用 TypeScript 進(jìn)行編程。如果你的數(shù)據(jù)存儲在 Azure Blob 存儲中或者你正在使用 Bing 圖像搜索,你可以直接通過他們的網(wǎng)站使用 VOTT。使用每個(gè)版本的安裝包是本地安裝 VoTT 的最便捷方式。適用于 Mac OSX 的 VoTT、適用于 Linux 的 VoTT 和適用于 Windows 的 VoTT 均作為安裝包提供。
4. ?Labelme
?:Labelme是麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室于2012年開發(fā)的開源標(biāo)注庫,它有助于使用圓形、矩形、三角形、點(diǎn)、線和線條對圖像進(jìn)行標(biāo)注。Labelme 是使用 Python 編寫的,對于圖形界面,它使用 Qt。使用 Labelme 可以輕松完成語義分割、邊界框和圖像分類。
5. ?RectLabel
? : RectLabel 是一個(gè)圖像標(biāo)注工具,用于標(biāo)注圖片以識別和分割邊界框?qū)ο蟆4藞D像注釋工具可自動與一些核心 ML 模型配合使用,無需任何其他實(shí)現(xiàn)。Rectlabel 支持 PASCAL VOC XML 格式。支持使用骨架、多邊形、邊界框、線、點(diǎn)和三次貝塞爾曲線繪制關(guān)鍵點(diǎn)。您還可以自定義標(biāo)簽對話框,以便它可以與特征一起使用。RectLabel 可以導(dǎo)出為 YOLO、COCO JSON 和 CSV 格式。這樣,用戶還可以導(dǎo)出索引掩碼圖像和分離的掩碼圖像,同時(shí)還可以執(zhí)行圖像調(diào)整大小和增強(qiáng)等任務(wù)。