在python中視覺注釋工具有幾種？五種流行用于對(duì)象檢測(cè)的計(jì)算機(jī)視覺注釋工具！

宇宙一級(jí)潛在鴿王 2021-08-25 09:57:56 瀏覽數(shù) (2684)

反饋

計(jì)算機(jī)視覺是人工智能的一個(gè)子集，專注于教機(jī)器如何正確解釋來自圖片、視頻幀和其他來源的數(shù)據(jù)。我們通常需要使用帶注釋的數(shù)據(jù)來監(jiān)控深度學(xué)習(xí)模型，以利用當(dāng)代計(jì)算機(jī)視覺技術(shù)。為了使用對(duì)象檢測(cè)和識(shí)別等計(jì)算機(jī)視覺技術(shù)，需要使用這些對(duì)象的特定圖像實(shí)例訓(xùn)練 ML 模型并標(biāo)記它們。

以下是五種常用的計(jì)算機(jī)視覺注釋工具，用于對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行對(duì)象識(shí)別和標(biāo)記。

視覺工具流程圖解

1. ?LabelImg? : LabelImg 是一個(gè)開源的用于圖像處理和標(biāo)注的標(biāo)注工具。它是用 ?Python ?開發(fā)的，并有一個(gè)用 Qt 構(gòu)建的圖形用戶界面。這是一種快速且免費(fèi)的圖像標(biāo)簽方式。使用此標(biāo)記工具完成的注釋以 PASCAL VOC XML 格式保存。

2. ?Computer Vision Annotation Tool (CVAT)?：Computer Vision Annotation Tool (CVAT) 是由 Intel 創(chuàng)建的免費(fèi)圖像標(biāo)記程序。它也是開源的，使用 ?CSS?、?Python?、?Django?、?TypeScript ?和 ?React ?等編程語言編寫。CVAT 有助于監(jiān)督學(xué)習(xí)任務(wù)，如對(duì)象檢測(cè)、圖像分割和分類等。 CVAT 提供強(qiáng)大的功能，可以利用深度學(xué)習(xí)模型進(jìn)行半自動(dòng)注釋。

3.視覺對(duì)象標(biāo)記工具（?VOTT?）：微軟團(tuán)隊(duì)創(chuàng)建了一個(gè)視覺對(duì)象標(biāo)記工具（?VOTT?）來使用計(jì)算機(jī)視覺識(shí)別和注釋視頻和圖像，并使用 TypeScript 進(jìn)行編程。如果你的數(shù)據(jù)存儲(chǔ)在 Azure Blob 存儲(chǔ)中或者你正在使用 Bing 圖像搜索，你可以直接通過他們的網(wǎng)站使用 VOTT。使用每個(gè)版本的安裝包是本地安裝 VoTT 的最便捷方式。適用于 Mac OSX 的 VoTT、適用于 Linux 的 VoTT 和適用于 Windows 的 VoTT 均作為安裝包提供。

4. ?Labelme?：Labelme是麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室于2012年開發(fā)的開源標(biāo)注庫，它有助于使用圓形、矩形、三角形、點(diǎn)、線和線條對(duì)圖像進(jìn)行標(biāo)注。Labelme 是使用 Python 編寫的，對(duì)于圖形界面，它使用 Qt。使用 Labelme 可以輕松完成語義分割、邊界框和圖像分類。

5. ?RectLabel? : RectLabel 是一個(gè)圖像標(biāo)注工具，用于標(biāo)注圖片以識(shí)別和分割邊界框?qū)ο?。此圖像注釋工具可自動(dòng)與一些核心 ML 模型配合使用，無需任何其他實(shí)現(xiàn)。Rectlabel 支持 PASCAL VOC XML 格式。支持使用骨架、多邊形、邊界框、線、點(diǎn)和三次貝塞爾曲線繪制關(guān)鍵點(diǎn)。您還可以自定義標(biāo)簽對(duì)話框，以便它可以與特征一起使用。RectLabel 可以導(dǎo)出為 YOLO、COCO JSON 和 CSV 格式。這樣，用戶還可以導(dǎo)出索引掩碼圖像和分離的掩碼圖像，同時(shí)還可以執(zhí)行圖像調(diào)整大小和增強(qiáng)等任務(wù)。

Python 大數(shù)據(jù) 人工智能工具

0 人點(diǎn)贊