近日,顏成鋼教授團隊以杭電為第一單位的論文PANDORA: A Panoramic Detection Dataset for Object with Orientation被計算機視覺領域頂級學術會議ECCV 2022接收,該研究的合作單位還有中國科學院計算所和華為諾亞方舟實驗室。論文第一作者是我校“智能信息處理實驗室”(HDU IIPLab)的博士研究生徐杭。 ECCV的全稱是European Conference on Computer Vision(歐洲計算機視覺國際會議) ,每隔兩年舉辦一次,是計算機視覺三大會議(另外兩個是ICCV和CVPR)之一。本屆大會的有效投稿量達5803篇,接收論文1650篇,接收率約為28%。
全景視覺數據是通過全景數據采集設備采集得到的全景圖像或全景視頻,它包含了空間中全方位360度的視覺信息,具有“視野全、可交互、沉浸感強”的特點。這使得其在很多領域都得到了很好的應用,如虛擬現實、機器人、視頻監控等。但是,由于全景視覺數據表示的是空間中整個球面360度的視覺信息,需要采用特定的投影方式將球面投影到平面上。等距柱面投影目前已經成為事實上的全景圖像投影標準,這種投影方式使得物體在最后存儲的圖像中會產生畸變,并且畸變程度和基本形狀與物體在球面上所處的緯度位置相關。從而導致全景視覺數據的特征表達與傳統視覺數據的特征表達產生明顯的差異,為計算機視覺任務帶來巨大的挑戰。本研究工作專注于全景視覺物體檢測領域,為該領域建立了一個基準。具體來說,首先,結合全景視覺數據的特點,論文提出了一種全新的全景物體檢測的標注方式RBFoV和IoU計算方法。其次,根據這種新的標注方式制作了一個更加合理的全景物體檢測數據集PANDORA。 最后,在新的數據集上,提出了一種全景物體檢測方法R-CenterNet。相比于之前的方法,該方法達到了最佳的性能。相信本文提出的一整套全景物體檢測新基準,將為該領域帶來全新的進展。
杭州電子科技大學“智能信息處理實驗室”(HDU IIPLab)主任為顏成鋼教授。實驗室現有在職教師16名,含3位國家級人才及4位省級人才,包括浙江省“錢江學者”特聘教授、浙江省杰出青年基金獲得者、浙江省“151人才工程”第一層次、浙江省高校中青年學科帶頭人重點資助等多名國家及省部級人才。現有碩博生87名,畢業生多就職于阿里巴巴、騰訊、字節跳動、海康威視、華為、網易等國內知名大公司。實驗室采用與海內外知名高校、研究所(清華大學、北京大學、中國科學院、美國北卡羅來納大學教堂山分校、澳大利亞悉尼科技大學、京東AI研究院等等)聯合培養制,長期致力于智能信息處理方面的研究,主要研究方向包括:機器學習、模式識別、計算機視覺、計算機圖形學、醫學影像處理、生物信息學等。實驗室為學校交叉創新團隊,擁有自由開放的學術氛圍和國際前沿的研究方向,可以在多個學院招生,包括但不限于自動化、計算機、電子、通信等學院。