近日,中國科學(xué)院合肥物質(zhì)院智能所智慧農業(yè)研究中心王儒敬研究員團隊提出了一種可學(xué)習全頻變壓器雙生成對抗網(wǎng)絡(luò )方法,可顯著(zhù)提升水下成像質(zhì)量。相關(guān)研究成果發(fā)表在海洋科學(xué)領(lǐng)域TOP期刊Frontiers in marine science上。
水下成像面臨著(zhù)一系列嚴峻的挑戰,如顏色失真、噪聲干擾和低對比度問(wèn)題,這些問(wèn)題極大地削弱了圖像的視覺(jué)質(zhì)量。為了攻克這些難題,科研團隊提出了一種創(chuàng )新的方法——可學(xué)習全頻變壓器雙生成對抗網(wǎng)絡(luò )(LFT-DGAN)。該方法首先引入了一種基于可逆卷積的圖像分解技術(shù),能夠將水下圖像的信息精準地分解為低頻、中頻和高頻域,有助于更全面地提取圖像特征;然后,利用圖像通道和空間之間的相似性,構建了一個(gè)可學(xué)習的全頻域變壓器,促進(jìn)不同信息分支之間的交流與融合;最后,開(kāi)發(fā)了一種功能強大的雙域鑒別器,具備學(xué)習水下圖像空間特征的能力,能夠深入捕捉其頻域特征。
在UIEB數據集上,通過(guò)LFT-DGAN方法增強后的圖像質(zhì)量在PSNR、SSIM、UQIM、UCIQE指標上比最先進(jìn)算法(CWR、Semi-UIR、RCT等)分別平均提高4.3%、9.4%、21.6%、24.7%。
鄭世健博士生為論文第一作者,汪六三副研究員為論文通訊作者。該項研究工作得到了國家自然科學(xué)基金、國家重點(diǎn)研發(fā)計劃的支持。
論文鏈接為:https://www.frontiersin.org/articles/10.3389/fmars.2024.1321549/full