版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

[科普中國(guó)]-面部跟蹤

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識(shí)科普陣地
收藏

介紹

在海關(guān)、機(jī)場(chǎng)、銀行、電視電話會(huì)議等場(chǎng)合,都需要對(duì)特定人臉目標(biāo)進(jìn)行跟蹤。顯然,要跟蹤圖象中的人臉。首先要識(shí)別人臉。人臉識(shí)別就是利用計(jì)算機(jī)分析靜態(tài)圖片或視頻序列。從中找出人臉并輸出人臉的數(shù)目、位置及其大小等有效信息。其次就是跟蹤人臉。就是要在檢測(cè)到人臉的前提下。在后續(xù)幀中繼續(xù)捕獲人臉的位置及其大小等信息。人臉跟蹤技術(shù)涉及到模式識(shí)別、圖象處理、計(jì)算機(jī)視覺、生理學(xué)、心理學(xué)及形態(tài)學(xué)等諸多學(xué)科。并與基于其它生物特征的身份鑒別方法以及計(jì)算機(jī)人機(jī)感知交互的研究領(lǐng)域密切相關(guān)。與基于指紋、視網(wǎng)膜、虹膜、DNA等其它人體生物特征識(shí)別系統(tǒng)相比。人臉跟蹤技術(shù)更為直接、友好。不會(huì)對(duì)用戶造成心理障礙。此外,人臉跟蹤技術(shù)研究與相關(guān)學(xué)科的發(fā)展及對(duì)人腦的認(rèn)識(shí)程度緊密相關(guān)。這諸多因素使人臉跟蹤研究成為一項(xiàng)既困難又極富挑戰(zhàn)性的課題。

目前常見的跟蹤技術(shù)大致可分為4大類:基于模型跟蹤;基于運(yùn)動(dòng)信息跟蹤;基于人臉局部特征跟蹤和基于神經(jīng)網(wǎng)絡(luò)跟蹤等方法。

方法基于模型跟蹤基于模型跟蹤的方法就是獲取目標(biāo)的先驗(yàn)知識(shí),建立低價(jià)參數(shù)模型,對(duì)輸入的每一幀圖象通過滑動(dòng)窗口進(jìn)行模型匹配,實(shí)現(xiàn)人臉識(shí)別與跟蹤。常見的跟蹤模型有:膚色模型、橢圓模型、紋理模型及雙眼模板等。

基于膚色模型的跟蹤方法就是利用恰當(dāng)?shù)谋砩到y(tǒng),把膚色作為實(shí)現(xiàn)人臉跟蹤的關(guān)鍵信息。由于膚色信息具有對(duì)放大和縮小以及對(duì)微小變形不敏感的優(yōu)點(diǎn),加上人臉相對(duì)鏡頭的變化對(duì)膚色信息本身的影響不大,該類方法很容易在前一幀圖象分析結(jié)果的基礎(chǔ)上跟蹤到后一幀圖象的人臉區(qū)域,因此具有速度快、姿態(tài)不變性等特點(diǎn)。目前的人臉跟蹤技術(shù)大都采用基于膚色模型的方法。

基于運(yùn)動(dòng)信息跟蹤基于運(yùn)動(dòng)信息跟蹤法主要是充分利用圖象連續(xù)幀間目標(biāo)運(yùn)動(dòng)的連續(xù)性規(guī)律,進(jìn)行人臉區(qū)域的預(yù)測(cè)以達(dá)到快速跟蹤的目的。通常采用運(yùn)動(dòng)分割、光流、立體視覺等方法。利用時(shí)空梯度,卡爾曼濾波器進(jìn)行跟蹤。

光流是空間運(yùn)動(dòng)物體被觀測(cè)面上的像素點(diǎn)運(yùn)動(dòng)產(chǎn)生的瞬時(shí)速度場(chǎng),包含了物體3D表面結(jié)構(gòu)和動(dòng)態(tài)行為的重要信息。一般情況下,光流由相機(jī)運(yùn)動(dòng)、場(chǎng)景中目標(biāo)運(yùn)動(dòng)、或兩者的運(yùn)動(dòng)產(chǎn)生。光流分析經(jīng)常被用于目標(biāo)運(yùn)動(dòng)估計(jì)。當(dāng)場(chǎng)景中有獨(dú)立的運(yùn)動(dòng)目標(biāo)時(shí),通過光流分析可以確定運(yùn)動(dòng)目標(biāo)的數(shù)目、運(yùn)動(dòng)速度、目標(biāo)距離和目標(biāo)的表面結(jié)構(gòu)。光流分析可以分為連續(xù)光流法和特征光流法,特征光流法是通過特征匹配求得特征點(diǎn)處的光流。

基于人臉局部特征跟蹤基于人臉局部特征跟蹤法的主要思想是根據(jù)不同的人臉器官特征信息進(jìn)行器官跟蹤。這類方法經(jīng)常利用眼睛、嘴和鼻子等器官特征信息進(jìn)行跟蹤定位。傳統(tǒng)的人臉特征點(diǎn)跟蹤方法通常是在人面部畫上標(biāo)識(shí)點(diǎn)進(jìn)行跟蹤,如Kouadio等提出了一種通過加標(biāo)識(shí)點(diǎn)來跟蹤視頻中人臉特征點(diǎn)的方法,采用了一種分析人面部曲線的方法來跟蹤人臉。

基于神經(jīng)網(wǎng)絡(luò)跟蹤神經(jīng)網(wǎng)絡(luò)是近年來發(fā)展較快的一個(gè)交叉研究學(xué)科。人工神經(jīng)網(wǎng)絡(luò)模型具備人腦思維的一些典型特征,如自組織、聯(lián)想記憶、非線性、大規(guī)模并行連接等。并且具有強(qiáng)大的學(xué)習(xí)能力!將神經(jīng)網(wǎng)絡(luò)用于人臉跟蹤具有一定的優(yōu)勢(shì)。因?yàn)橐@性地對(duì)人臉識(shí)別特征進(jìn)行描述相當(dāng)困難,而神經(jīng)網(wǎng)絡(luò)則可以通過學(xué)習(xí),自動(dòng)地獲得識(shí)別規(guī)律的隱性表達(dá)。

目前神經(jīng)網(wǎng)絡(luò)方法也是人臉識(shí)別與跟蹤技術(shù)中的研究熱點(diǎn)。Valentin提出一種方法,首先提取人臉的50個(gè)主元,然后用自相關(guān)神經(jīng)網(wǎng)絡(luò)將它映射到5維空間中,再用一個(gè)普通的多層感知器進(jìn)行判別。對(duì)一些簡(jiǎn)單的測(cè)試圖象效果較好;Intrator等提出了一種混合型神經(jīng)網(wǎng)絡(luò)來進(jìn)行人臉跟蹤,其中非監(jiān)督神經(jīng)網(wǎng)絡(luò)用于特征提取,而監(jiān)督神經(jīng)網(wǎng)絡(luò)用于分類。1