




深圳先進院聯合團隊獲CVPR 2019視頻復原大賽冠軍
近日,計算機視覺領域內最負盛名的學術會議——IEEE國際計算機視覺與模式識別會議(CVPR 2019)在美國加州舉行,會上頒發了Workshop NTIRE 2019 視頻復原比賽相關獎項。由中國科學院深圳先進技術研究院、商湯科技、香港中文大學、南洋理工大學組成的聯合團隊研發的EDVR算法,包攬了該比賽四個賽道的全部冠軍。
此次視頻復原比賽包含兩個視頻去模糊和兩個視頻超分辨率賽道,比賽結果顯示,共有14支隊伍進入最終的排名,該聯合團隊的算法大幅超越各個賽道的第二名,且在大部分數據集上精度指標都是最高的。目前,該算法論文 EDVR: Video Restoration with Enhanced Deformable Convolutional Networks 已發布于arXiv,同時團隊已將代碼開源,深圳先進院數字所多媒體集成技術研究中心副研究員董超為論文作者之一。
在該論文中,作者介紹了這種新型算法,通過一種新的網絡模塊 PCD 對齊模塊,使用 Deformable 卷積進行視頻的對齊,可實現整個過程端到端的訓練;而在挖掘時域(視頻前后幀)和空域(同一幀內部)的信息融合時,作者又提出了一種時空注意力模型,來進行更好的信息融合。該算法未來有望應用在視頻直播、高清電視、手機拍攝、視頻監控等領域。
在同期舉辦的圖像復原大賽中,聯合團隊論文同樣獲得冠軍。利用深度學習解決圖像超分辨率問題,需要用到大量的訓練數據,一般情況下,至少200個以上的圖像對才能保證圖像的超分辨率效果。而此次比賽僅提供60個圖像對作為訓練數據,大大限制了超分辨率的效果。團隊的論文首次分析并解決了超分辨率網絡中的過擬合問題,即便使用少量的圖像數據,也可以獲得出色的結果。
這支在國際頂級計算機視覺大賽中脫穎而出的隊伍,專注于底層計算機視覺,包括圖像和視頻的超分辨率、去噪與增強等技術。2014年該團隊首次利用深度學習實現圖像超分辨率,引起了深度學習在底層視覺領域應用的熱潮。2017年,團隊獲得CVPR 2017圖像超分辨率的亞軍;2018年,團隊分別獲得CVPR18和ECCV18兩屆圖像超分辨率比賽單一賽道的冠軍。

深圳先進院數字所多媒體集成技術研究中心團隊