近日,大華股份基于深度學習算法的圖像語義分割技術(shù),刷新了KITTI語義分割競賽(The KITTI Semantic Segmentation Evaluation)全球最好成績,取得語義分割排行榜第一名,超越其他一流AI公司和頂尖的學術(shù)研究機構(gòu),這標志著大華股份在語義分割領(lǐng)域處于領(lǐng)先水平。
大華股份DH-MDS算法取得KITTI Semantic Segmentation排行榜第一名
(網(wǎng)址: www.cvlibs.net/datasets/kitti/eval_semseg.php)
大華股份已建成用于算法訓練的超大規(guī)模計算中心和數(shù)據(jù)中心,重點研究并商用化多個領(lǐng)域算法,已形成核心競爭力。 2017年大華股份在場景流、光流和文字識別檢測等領(lǐng)域分別取得第一;2018年在2D車輛目標檢測、MOT跟蹤、行人重識別等國際競賽中分別取得第一;2019年初,在實例分割國際競賽中取得第一。本次在語義分割算法領(lǐng)域再次取得新突破。
關(guān)于KITTI:
KITTI數(shù)據(jù)集由德國卡爾斯魯厄理工學院和豐田美國技術(shù)研究院聯(lián)合創(chuàng)辦,是目前國際上最大的計算機視覺算法評測數(shù)據(jù)集之一。數(shù)據(jù)集用于評測立體圖像(Stereo)、光流(Optical Flow)、視覺測距(Visual Odometry)、物體檢測(Object Detection)和跟蹤(Tracking)、道路分割(Road)、語義分割(Semantics)等計算機視覺技術(shù)在車載環(huán)境下的性能。KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場景采集的真實圖像數(shù)據(jù),每張圖像中最多包含15輛車和30個行人,且存在不同程度的遮擋與截斷。
語義分割:
語義分割是指將計算機輸入圖像的每個像素分類為所屬對象類別的過程。它不僅是計算機視覺的基本任務(wù),同時在自動駕駛、機器人場景理解以及虛擬現(xiàn)實方面有著非常重要的應(yīng)用。
在KITTI語義分割任務(wù)中,需要把各種場景下的汽車、行人、道路、摩托車、自行車、交通標志、建筑物和植被等19類物體準確分割出來。同時,訓練集只提供200張數(shù)據(jù),屬于小樣本學習。
本次國際比賽,大華股份為提升語義分割精度,汲取了圖像分類、單目標分割和全像素語義分割等先進算法的優(yōu)點,構(gòu)建了基于多位置和通道特征的全局關(guān)注機制,并采用遷移學習和增量學習方法,有效提升了算法的分割精度。
該競賽語義分割效果
輸入圖像1
分割結(jié)果1
輸入圖像2
分割結(jié)果2
在大華實際產(chǎn)品和未來產(chǎn)品中的應(yīng)用
❖車道線分割:
車道線分割并疊加顯示
❖機器人場景理解及語義地圖構(gòu)建:
大華園區(qū)圖像
大華園區(qū)分割結(jié)果
免責聲明:本文來源于大華股份,本文僅代表作者個人觀點,本站不作任何保證和承諾,若有任何疑問,請與本文作者聯(lián)系。