近十年來,在安防行業(yè)的數(shù)字化進程中,DVR、DVS得到了長足發(fā)展。特別是近兩年,隨著平安城市項目的推進,各個城市的大街小巷已經(jīng)布滿了攝像頭。存儲技術(shù)的不斷更新,也為大量案件積存了海量視頻信息,這給公安破案帶來極大的便利。這時,如何在海量視頻中快速提取有價值的線索便顯得尤為重要。隨著安防智能化需求越來越強烈,視頻檢索技術(shù)也得以快速發(fā)展。本文將深入地為大家解讀智能視頻檢索技術(shù)。
一、傳統(tǒng)視頻檢索方式
在安防視頻監(jiān)控系統(tǒng)的實際應用過程中,用戶常常希望可以快速地從海量的、數(shù)以萬計的攝像頭視頻錄像中,方便地找到一些有明顯特征的人或物。傳統(tǒng)的基于預設(shè)告警和時間的視頻檢索方式,對于這類深層次的需求往往無能為力,常有“隔靴搔癢”之憾,因而如何快速準確地進行智能檢索就成為大型視頻監(jiān)控系統(tǒng)需要解決的重要課題。
傳統(tǒng)視頻檢索方法主要就是“人海戰(zhàn)術(shù)”,效率十分低下。主要原因有以下三點:第一,由于人類的生理局限,長時間專注于單一視頻畫面,容易造成刑偵人員注意力低下,產(chǎn)生視覺疲勞,嚴重影響審看效率;第二,人眼無法克服誤差,因為人眼的視覺疲勞,極易忽略重要的目標線索,造成“過眼不過腦”的情況,人對于單調(diào)的事物無法長時間的集中注意力,因此,一段視頻往往需要花費更多的時間進行重復審看,大大增加了工作量,并且仍無法完全避免遺漏和誤差;第三,獲取到有效信息耗時過長,通常一個案件需要審看周邊幾十個攝像頭、前后數(shù)天的視頻,所審看的視頻量時常達到數(shù)百上千小時。在目前的審看模式下,傳統(tǒng)的方法需要從頭到尾順序播放,往往需要數(shù)倍于原始視頻的時間才能審看完成,因此需要大量人員連續(xù)加班數(shù)周進行視頻審看。為了規(guī)避遺漏和誤差,很多刑偵隊采用加大人力投入的方法。但是經(jīng)過實踐證明,這種方法吃力不討好,等找到關(guān)鍵信息,犯罪分子很有可能已經(jīng)做出更大破壞。
二、智能視頻檢索技術(shù)的現(xiàn)狀
視頻監(jiān)控檢索關(guān)注的人數(shù)據(jù)以視頻為主,主要目的是定位查找某個事件的起因和關(guān)聯(lián)的發(fā)展過程,事件的關(guān)鍵信息數(shù)據(jù)包含:時間、地點、主導事件的人或物、圖像和聲音信息。檢索條件傳遞的信息越豐富,定位越精準,檢索的算法也就越簡單;相反,檢索條件傳遞的信息越簡單,定位就越模糊,想要精確定位時,檢索算法的難度也就越大。一般來說,用戶期望檢索條件簡單,同時也能定位精準。
智能視頻檢索技術(shù)的出現(xiàn)把人從單調(diào)、繁重的任務中解放出來。它利用了視頻分割、自動數(shù)字化、語音識別、鏡頭檢測、關(guān)鍵幀抽取、內(nèi)容自動關(guān)聯(lián)、視頻結(jié)構(gòu)化等技術(shù),以圖像處理、模式識別、計算機視覺、圖像理解等領(lǐng)域的知識為基礎(chǔ),通過自動化的智能分析預處理,將雜亂無章、毫無邏輯的監(jiān)控視頻內(nèi)容(運動目標、行人、車輛)進行梳理,自動獲取視頻內(nèi)事件及目標的關(guān)鍵信息,并根據(jù)這些信息生成視頻內(nèi)容及索引。為了提高計算速度,目前采用了集群方式,可提供幾十上百倍實時以上的快速分析能力,并可根據(jù)應用需要進行擴展,提高計算能力,節(jié)約辦案時間。
從根本上看,視頻檢索技術(shù)應用于安防監(jiān)控是以智能視頻分析技術(shù)為基礎(chǔ)的。智能視頻分析技術(shù)是指利用計算機圖像視覺分析技術(shù),通過將場景中背景和目標分離進而分析并追蹤在攝像機場景內(nèi)出現(xiàn)的目標。近幾年,大數(shù)據(jù)一詞越來越多地被提及與使用,涉及到各行業(yè),人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù)。智能視頻分析技術(shù)的引入可能極大地提升原有海量監(jiān)控視頻存儲系統(tǒng)的檢索效率和命中率。
在智能視頻檢索過程中,用戶可以根據(jù)自己所需要的檢索條件,通過智能視頻分析技術(shù),從海量視頻中獲取想要的關(guān)鍵信息。目前智能視頻檢索方式主要有以下幾個分類:
1、運動目標屬性分析
目標的運動屬性包括目標的運動軌跡、運動幅度、速度及規(guī)律等因素;谀繕塑壽E的檢索是指通過在視頻中選定一個特定的區(qū)域,目標進入或離開該區(qū)域、以及滯留該區(qū)域,視頻檢索算法可以快速關(guān)注所有時間內(nèi)在該區(qū)域出現(xiàn)過的目標。
還可以對目標圖例或排查結(jié)果的類型進行過濾,在目標結(jié)果較多的情況下,系統(tǒng)支持將目標中的類型進行分離,進一步縮小關(guān)注范圍,比如人、顏色等。
2、人臉索引
基于內(nèi)容的圖像檢索是近年來的熱門研究內(nèi)容,涉及圖像處理、計算機視覺和數(shù)據(jù)庫系統(tǒng)等方面的學科。其中,有效的高維索引機制是使大規(guī)模圖像庫的檢索能夠達到實時性要求的關(guān)鍵技術(shù)。
目前的技術(shù)主要是通過智能分析預處理以及人臉檢測算法,將監(jiān)控視頻中的人臉進行整理匯總,獲取視頻內(nèi)感興趣目標的相關(guān)信息,并根據(jù)這些人臉信息生成索引。相關(guān)人員通過查看人臉圖示,就可在幾分鐘內(nèi),查看數(shù)個小時視頻中包含的所有目標,并確定嫌疑目標,也可觀看該目標在整個視頻中的存在片段與運動軌跡。
在系統(tǒng)中輸入待查詢的人臉照片,選擇需要檢索的人臉后進行相似度等參數(shù)設(shè)置后開始檢索,最后檢索出的相似人臉的結(jié)果會在界面上顯示出來。
文章來源:中國投影網(wǎng) ©版權(quán)所有。未經(jīng)許可,不得轉(zhuǎn)載。