微網(wǎng)站制作價(jià)格頁(yè)面設(shè)計(jì)
動(dòng)物姿態(tài)識(shí)別是指利用計(jì)算機(jī)視覺和深度學(xué)習(xí)技術(shù)來識(shí)別動(dòng)物的姿態(tài),即確定動(dòng)物身體的姿態(tài)、方向和位置等信息。這種技術(shù)可應(yīng)用于動(dòng)物行為研究、動(dòng)物健康監(jiān)測(cè)、智能養(yǎng)殖等領(lǐng)域。
動(dòng)物姿態(tài)識(shí)別的關(guān)鍵技術(shù)包括圖像處理、特征提取和分類器設(shè)計(jì)。首先,需要對(duì)動(dòng)物圖像進(jìn)行預(yù)處理和增強(qiáng),以消除噪聲和增強(qiáng)圖像質(zhì)量。其次,需要提取特征來描述動(dòng)物的身體特征和姿態(tài)信息,常用的特征包括輪廓、角度、比例、骨架和運(yùn)動(dòng)軌跡等。最后,需要設(shè)計(jì)一個(gè)分類器來將不同姿態(tài)的動(dòng)物進(jìn)行分類和識(shí)別,并輸出識(shí)別結(jié)果。
目前,動(dòng)物姿態(tài)識(shí)別已經(jīng)被廣泛應(yīng)用于動(dòng)物行為研究和養(yǎng)殖管理中。例如,通過對(duì)家禽和豬的姿態(tài)進(jìn)行監(jiān)測(cè),可以提高養(yǎng)殖效率和生產(chǎn)效益;通過對(duì)野生動(dòng)物的姿態(tài)進(jìn)行追蹤和分析,可以更好地理解它們的行為和生態(tài)環(huán)境。
但是,動(dòng)物姿態(tài)識(shí)別也面臨一些挑戰(zhàn)和限制。首先,不同種類的動(dòng)物具有不同的身體特征和姿態(tài),因此需要針對(duì)不同的動(dòng)物種類進(jìn)行模型訓(xùn)練和優(yōu)化。其次,光線、角度、背景等因素也會(huì)影響動(dòng)物圖像的質(zhì)量和識(shí)別效果。因此,如何設(shè)計(jì)高效的算法和優(yōu)化模型,是動(dòng)物姿態(tài)識(shí)別研究中需要解決的難題。
總之,動(dòng)物姿態(tài)識(shí)別是一種有前景的技術(shù),它可以幫助我們更好地了解動(dòng)物的行為和生存環(huán)境,同時(shí)也有望在動(dòng)物養(yǎng)殖和保護(hù)等領(lǐng)域得到廣泛應(yīng)用。
介紹
這是基于《野外動(dòng)物姿勢(shì)》所做的工作。
它包含了動(dòng)物姿態(tài)數(shù)據(jù)集的介紹、標(biāo)注文件和代碼。
動(dòng)物姿態(tài)數(shù)據(jù)集是第一個(gè)用于通用動(dòng)物姿勢(shì)估計(jì)的大規(guī)模數(shù)據(jù)集。它包含了來自23個(gè)動(dòng)物家族和54個(gè)物種的10,015張圖像,具有高質(zhì)量的關(guān)鍵點(diǎn)標(biāo)注。
我們還包含了約50,000張帶有家族和物種標(biāo)簽的圖像。該數(shù)據(jù)集可用于監(jiān)督學(xué)習(xí)、跨領(lǐng)域遷移學(xué)習(xí)、家族內(nèi)和家族間領(lǐng)域等。它還可用于自監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)等。標(biāo)注文件采用COCO風(fēng)格提供。
關(guān)鍵點(diǎn)定義?
具體定義如下:?
?背景
環(huán)境安裝
步驟 0. 從官方網(wǎng)站下載并安裝Miniconda。
步驟 1. 創(chuàng)建并激活一個(gè)conda環(huán)境。
conda create --name openmmlab python=3.8 -y
conda activate openmmlab
?
步驟 2. 安裝PyTorch,按照官方說明進(jìn)行操作,例如:
在GPU平臺(tái)上:
conda install pytorch torchvision -c pytorch
此命令將自動(dòng)安裝最新版本的PyTorch和cudatoolkit,請(qǐng)檢查它們是否與您的環(huán)境匹配。
在CPU平臺(tái)上:
conda install pytorch torchvision cpuonly -c pytorch
安裝
我們建議用戶按照我們的最佳實(shí)踐安裝MMPose。然而,整個(gè)過程是高度可定制的。請(qǐng)查看“自定義安裝”部分以獲取更多信息。
最佳實(shí)踐
步驟 0. 使用MIM安裝MMCV。
pip install -U openmim
mim install mmcv-full
數(shù)據(jù)及代碼使用
數(shù)據(jù)集準(zhǔn)備
請(qǐng)從下載部分下載數(shù)據(jù)集,并將其解壓縮到data文件夾下,例如:
mkdir data
unzip ap-10k.zip -d data/
mv data/ap-10k data/ap10k
解壓后的數(shù)據(jù)集應(yīng)該如下所示:
AP-10K
├── mmpose
├── docs
├── tests
├── tools
├── configs
|── data│── ap10k│-- annotations│ │-- ap10k-train-split1.json│ |-- ap10k-train-split2.json│ |-- ap10k-train-split3.json│ │-- ap10k-val-split1.json│ |-- ap10k-val-split2.json│ |-- ap10k-val-split3.json│ |-- ap10k-test-split1.json│ |-- ap10k-test-split2.json│ |-- ap10k-test-split3.json│-- data│ │-- 000000000001.jpg│ │-- 000000000002.jpg│ │-- ...
推理
可以從HRNet-w32、HRNet-w48、ResNet-50、ResNet-101下載檢查點(diǎn)。
python tools/test.py <CONFIG_FILE> <DET_CHECKPOINT_FILE>
訓(xùn)練
bash tools/dist_train.sh <CONFIG_FILE> <GPU_NUM>
例如,要在1個(gè)GPU上訓(xùn)練HRNet-w32模型,請(qǐng)運(yùn)行:
bash tools/dist_train.sh configs/animal/2d_kpt_sview_rgb_img/topdown_heatmap/ap10k/hrnet_w32_ap10k_256x256.py 1
關(guān)鍵問題
1. 數(shù)據(jù)集的創(chuàng)建目的是什么?
數(shù)據(jù)集的創(chuàng)建旨在促進(jìn)動(dòng)物姿勢(shì)估計(jì)領(lǐng)域的研究。在更多來自不同物種的訓(xùn)練數(shù)據(jù)可用的情況下,有必要研究一些具有挑戰(zhàn)性的問題,比如:
1)不同代表性人體姿勢(shì)模型在動(dòng)物姿勢(shì)估計(jì)任務(wù)上的性能如何?
2)深度模型的表征能力是否受益于在具有不同物種的大規(guī)模數(shù)據(jù)集上的訓(xùn)練?
3)在具有不同物種的大規(guī)模數(shù)據(jù)集的背景下,預(yù)訓(xùn)練(例如在ImageNet數(shù)據(jù)集或人體姿勢(shì)估計(jì)數(shù)據(jù)集上的預(yù)訓(xùn)練)的影響如何?
4)在使用來自特定物種或家族的數(shù)據(jù)訓(xùn)練的模型中,模型的家族內(nèi)和家族間泛化能力如何?
然而,先前用于動(dòng)物姿勢(shì)估計(jì)的數(shù)據(jù)集包含有限數(shù)量的動(dòng)物物種。因此,使用現(xiàn)有數(shù)據(jù)集無法研究這些問題,因?yàn)樗鼈儼淖疃嘀挥?種物種,這遠(yuǎn)遠(yuǎn)不足以得出可靠的結(jié)論。相比之下,數(shù)據(jù)集包含23個(gè)家族和54個(gè)物種,因此可以幫助研究人員研究這些問題。
2. 是否進(jìn)行了數(shù)據(jù)清理?
我們使用aHash算法檢測(cè)相似圖像并進(jìn)行手動(dòng)檢查,刪除了重復(fù)的圖像。手動(dòng)刪除了有重疊和標(biāo)志的圖像。清理后的圖像被分類到不同的物種和家族中。
3. 關(guān)鍵點(diǎn)如何指導(dǎo)進(jìn)行標(biāo)注?
標(biāo)注者首先了解動(dòng)物的相貌、體型和關(guān)鍵點(diǎn)分布。然后,給標(biāo)注者展示每個(gè)物種的五張圖像,用于標(biāo)注關(guān)鍵點(diǎn),這些標(biāo)注用于評(píng)估其標(biāo)注質(zhì)量。具有良好標(biāo)注質(zhì)量的標(biāo)注者進(jìn)一步接受培訓(xùn),了解如何處理由于遮擋導(dǎo)致的身體部分的部分缺失,并參與后續(xù)的標(biāo)注過程。標(biāo)注者被要求標(biāo)注所有可見的關(guān)鍵點(diǎn)。對(duì)于被遮擋的關(guān)鍵點(diǎn),他們被要求標(biāo)注他們可以根據(jù)身體結(jié)構(gòu)、姿勢(shì)和身體的對(duì)稱性估計(jì)的關(guān)鍵點(diǎn),其中可以從可見的肢體或關(guān)鍵點(diǎn)推斷出被遮擋的肢體的長(zhǎng)度或被遮擋的關(guān)鍵點(diǎn)的位置。其他關(guān)鍵點(diǎn)則保持未標(biāo)記。
為了確保標(biāo)注質(zhì)量,我們采用了順序標(biāo)注策略。進(jìn)行了三輪交叉檢查和校正,包括手動(dòng)檢查和自動(dòng)檢查(根據(jù)特定規(guī)則,例如,屬于同一實(shí)例的關(guān)鍵點(diǎn)位于同一邊界框中),以減少可能的錯(cuò)誤標(biāo)注。首先,標(biāo)注者標(biāo)注了每個(gè)實(shí)例的關(guān)鍵點(diǎn),并向經(jīng)驗(yàn)豐富的高級(jí)標(biāo)注者提交了版本-1標(biāo)簽,然后經(jīng)驗(yàn)豐富的高級(jí)標(biāo)注者檢查了版本-1標(biāo)簽的質(zhì)量,并向標(biāo)注者返回了錯(cuò)誤列表,標(biāo)注者根據(jù)此列表修復(fù)了這些錯(cuò)誤。最后,標(biāo)注者向經(jīng)驗(yàn)豐富的高級(jí)標(biāo)注者提交了修復(fù)后的版本-2標(biāo)簽,他們進(jìn)行最后的校正,查找任何潛在的錯(cuò)誤標(biāo)注的關(guān)鍵點(diǎn)。完成所有三輪工作后,帶有高質(zhì)量標(biāo)簽的數(shù)據(jù)集的發(fā)布版本完成了。
結(jié)果展示
?歡迎交流學(xué)習(xí)QQ767172261。