近日,大華股份基于深度學習技術(shù)研發(fā)的3D目標檢測技術(shù),刷新了The KITTI Vision Benchmark Suite中3D車輛類目檢測任務(3D Object Detection Evaluation)排行榜,取得了3D車輛類目檢測第一名,這標志著大華股份的人工智能技術(shù)在3D目標檢測領域處于國際領先水平。
大華股份在人工智能的核心技術(shù)領域持續(xù)耕耘,不斷提升智能算法、算力的核心競爭力。這是大華股份繼取得字符識別、場景流識別、目標跟蹤、2D目標檢測、行人重識別等多項國際競賽第一之后,再次在3D目標檢測領域取得突破。
源自:
http://www.cvlibs.net/datasets/kitti/eval_object.php?obj_benchmark=3d 關(guān)于KITTI: KITTI數(shù)據(jù)集由德國卡爾斯魯厄理工學院和豐田美國
技術(shù)研究院聯(lián)合創(chuàng)辦,是目前國際上最大的計算機視覺算法評測數(shù)據(jù)集之一。數(shù)據(jù)集用于評測立體匹配(stereo)、光流(flow)、場景流(sceneflow)、視覺里程計(visual odometry)、物體檢測(object detection)和跟蹤(tracking)、道路分割(road)、語義分割(semantics)等計算機視覺
技術(shù)的性能。KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場景采集的真實圖像數(shù)據(jù),每張圖像中最多包含15輛車和30個行人,且存在不同程度的遮擋與截斷。
3D目標檢測 3D目標檢測是自動駕駛領域的核心
技術(shù)之一,自動駕駛的汽車需要實時檢測周圍所有交通參與者,包括機動車、非機動車、行人,并準確地檢測出各個目標的位置、大小和運動方向。由于2D圖像缺少深度信息,難以準確地估計目標的距離,加上天氣、光照、陰影等因素的影響,基于視覺的2D目標檢測
技術(shù)難以應對復雜的道路環(huán)境,因此自動駕駛
技術(shù)中主要依靠基于雷達設備所采集的點云數(shù)據(jù)進行3D目標檢測,同時采用基于2D的圖像識別
技術(shù)提高3D目標檢測的準確性。
本次競賽在大華自主研發(fā)的深度學習平臺上,汲取了2D目標檢測、場景流識別等算法的優(yōu)點,研發(fā)了一套基于圖模型和神經(jīng)網(wǎng)絡的3D目標檢測框架,使用3D點云數(shù)據(jù)與2D圖像數(shù)據(jù),從多個視角進行目標檢測,并將多視角的檢測結(jié)果進行融合,有效地提升了3D目標檢測的準確性。
該項國際競賽數(shù)據(jù)集的車輛3D檢測效果圖 圖1 3D檢測效果圖
圖2 點云數(shù)據(jù)的鳥瞰圖效果