(相關資料圖)
阿里巴巴旗下的達摩院近日與大連理工大學聯合推出了一款名為HQTrack的人工智能框架。該框架主要由視頻多目標分割器(VMOS)和掩模優化器(MR)組成,其主要目標是“實現對視頻中任何目標的高質量跟蹤”。 據研究團隊介紹,HQTrack基于開源框架DeAOT、HQ-SAM,并在此基礎上進行了一定的改進,實現了“在視頻中分割各目標”的可能性。同時,研究團隊使用Intern-T作為特征提取器,提高了框架對不同類型物體的區分能力,并加入了一個門控傳播模塊(GPM),以便于框架在復雜環境中感知更多微小物體,生成高質量的即時目標遮罩。 據了解,HQTrack在VOTS2023競賽中以0.615的質量得分獲得第二名。研究團隊表示,該人工智能框架可以應用于人臉識別、智能駕駛、監控追蹤等領域,并有望在未來商業應用中落地。 目前,該項目已經在GitHub中開放。HQTrack的核心功能包括:多目標追蹤,可以同時追蹤多個目標對象,適用于復雜場景下的目標追蹤任務;目標分割,能夠準確地分割視頻中的目標對象,并生成高質量的目標遮罩,可用于目標識別和分析;高質量輸出,其追蹤結果具有高質量和高準確性,能夠滿足各種應用場景的需求;簡單易用,提供了簡潔的接口和使用指南,用戶可以輕松地使用和集成該工具。