近日,中國科學(xué)院合肥物質(zhì)院智能所智慧農業(yè)研究中心王儒敬研究員團隊提出了一種基于多尺度空間特征的水下圖像增強方法。相關(guān)研究成果發(fā)表在計算機科學(xué)領(lǐng)域期刊 Journal of King Saud University - Computer and Information Sciences 上。
水下圖像的高質(zhì)量獲取一直是漁業(yè)監測、環(huán)境保護及物種保護等領(lǐng)域的關(guān)鍵技術(shù)難題。水下圖像往往呈現出模糊、色彩失真等問(wèn)題,嚴重影響了圖像的可用性和后續分析的準確性。近年來(lái),雖然深度學(xué)習技術(shù)在圖像增強領(lǐng)域取得了顯著(zhù)進(jìn)展,但大多數現有方法對于計算資源和內存的需求較高,難以在水下設備平臺上有效應用。為了解決這個(gè)問(wèn)題,團隊提出了一種名為多尺度特征調制網(wǎng)絡(luò )(MFMN)的新方法,以更好地實(shí)現模型效率和重構性能之間的權衡。具體來(lái)說(shuō),科研團隊在一個(gè)類(lèi)似于視覺(jué)變壓器(VIT)的模塊上開(kāi)發(fā)了一個(gè)多尺度調制模塊,在該模塊中使用多尺度空間特征模塊提取輸入圖像的特征,動(dòng)態(tài)選擇圖像特征空間中的代表性特征;此外,由于多尺度空間特征模塊從圖像的空間角度來(lái)處理圖像特征缺乏通道特征信息,團隊進(jìn)一步引入了通道混合模塊來(lái)執行通道混合。
實(shí)驗結果表明,該方法在網(wǎng)絡(luò )參數方面比目前最先進(jìn)的水下圖像增強方法要小8.5倍,同時(shí)實(shí)現了基本相同甚至更優(yōu)的圖像增強效。這意味著(zhù),在保持高性能的同時(shí),該方法顯著(zhù)降低了對計算資源的需求,為水下圖像增強技術(shù)的實(shí)際應用提供了新的可能性。
鄭世健博士生為論文第一作者,汪六三副研究員為論文通訊作者。該項研究工作得到了國家自然科學(xué)基金、國家重點(diǎn)研發(fā)計劃的支持。
論文鏈接:https://www.sciencedirect.com/science/article/pii/S1319157823004421
圖1 MFMN網(wǎng)絡(luò )結構