作者:趙曄 核稿:白宗文
近日,我校物理與電子信息學(xué)院張富春教授團(tuán)隊(duì)撰寫的論文《Intention Action Anticipation Model with Guide-Feedback Loop Mechanism》被人工智能領(lǐng)域國際頂級學(xué)術(shù)期刊Knowledge-Based Systems(IF=8.8,中科院一區(qū)TOP期刊)正式接收并在線發(fā)表。
隨著自動(dòng)駕駛、機(jī)器人技術(shù)和虛擬現(xiàn)實(shí)等領(lǐng)域的迅速發(fā)展,準(zhǔn)確預(yù)測人類意圖成為了一個(gè)重要的研究方向。然而,現(xiàn)有的預(yù)測方法存在一定的局限性,特別是在處理復(fù)雜、動(dòng)態(tài)的人類行為時(shí)往往未能充分利用視頻的全局和局部特征來預(yù)測未來的行為。
針對以上問題,本文提出了一個(gè)層級的完整-近期信息融合模型(HCR),該模型充分利用了整個(gè)視頻序列的特征(即完整特征)和視頻尾部序列的特征(即近期特征)。HCR模型中的兩個(gè)主要機(jī)制:指導(dǎo)-反饋循環(huán)(GFL)機(jī)制旨在模擬一個(gè)近期特征與一個(gè)完整特征之間的關(guān)系;基于GFL的多完整-近期特征聚合(MCRFA)模塊用于模擬一個(gè)近期特征與多尺度完整特征之間的關(guān)系。通過這兩種機(jī)制,HCR模型能夠?qū)哟位靥剿鞫喑叨韧暾卣髋c多尺度近期特征之間豐富的內(nèi)部關(guān)系。研究結(jié)果在兩個(gè)大型的公開數(shù)據(jù)集上的一系列比較和消融實(shí)驗(yàn)驗(yàn)證了HCR模型的有效性。
截止目前,馬宗楠共參與撰寫了4篇學(xué)術(shù)論文,其中在2023年的機(jī)器人領(lǐng)域頂級會(huì)議(Robotics:Science and Systems Foundation)上與來自麻省理工學(xué)院、普林斯頓大學(xué)、哈佛大學(xué)和劍橋大學(xué)等國際一流大學(xué)的8位同學(xué)在“Contributed Talks”環(huán)節(jié)進(jìn)行了論文成果演講和分享。另外撰寫的2篇SCI論文正在審稿中。
論文鏈接:https://www.sciencedirect.com/science/article/pii/S0950705124002612?via=ihub