視頻拼接技術(shù),即對(duì)有重疊區(qū)域的多路源視頻數(shù)據(jù)利用拼接算法進(jìn)行拼接,消除重疊區(qū)域,形成寬角度、大視場(chǎng)視頻圖像的技術(shù)。
隨著數(shù)字視頻技術(shù)的發(fā)展,視頻拼接技術(shù)在各工業(yè)領(lǐng)域均有廣泛的應(yīng)用需求,如天文探測(cè)中需要提供大面積和高分辨率的全景圖像;汽車環(huán)視系統(tǒng)需要為汽車駕駛提供車身四周更全面的輔助駕駛圖像信息;道路監(jiān)控系統(tǒng)需要提供更寬角度的道路視頻信息;海洋勘探中也需要提供全景觀測(cè)圖像。圖像和視頻拼接技術(shù)可以廣泛滿足以上領(lǐng)域的需求,提供高質(zhì)量與大角度的圖像和視頻信息。
自1965年計(jì)算機(jī)圖形學(xué)創(chuàng)始人Ivan Sutherland在IFIP會(huì)議上做了題為“TheUelimate Display”的報(bào)告,提出計(jì)算機(jī)圖像配準(zhǔn)技術(shù)這一課題以來(lái),圖像配準(zhǔn)技術(shù)已經(jīng)歷近半個(gè)世紀(jì)?偨Y(jié)其發(fā)展歷程,圖像配準(zhǔn)方法歸結(jié)起來(lái)可大體分為兩類,即基于區(qū)域的圖像配準(zhǔn)方法 和基于特征的圖像配準(zhǔn)方法。
基于區(qū)域的圖像配準(zhǔn)方法出現(xiàn)較早,查閱相關(guān)文獻(xiàn)發(fā)現(xiàn),目前基于區(qū)域的圖像配準(zhǔn)方法主要有相位相關(guān)法、灰度信息法和極坐標(biāo)法。
基于區(qū)域的配準(zhǔn)方法以相位相關(guān)法為代表,相位相關(guān)法由Kuslin和Hines于1975年提出,并先后由De Castro和Morandi等人,以及Reddy和Chatterji等人進(jìn)行改進(jìn),使得其對(duì)于具有旋轉(zhuǎn)和縮放的圖像變換具有較強(qiáng)的適應(yīng)性。
基于特征的圖像配準(zhǔn)方法起步較晚,最早是Burt P.J 于20世紀(jì)80年代提出的基于拉普拉斯金字塔變換算法,基于特征的圖像配準(zhǔn)方法在近些年得到了廣泛的關(guān)注和研究。與基于區(qū)域的圖像配準(zhǔn)方法相比,基于特征的圖像配準(zhǔn)方法起步較晚,但由于其拼接效果好,以及具有通用性好的優(yōu)勢(shì),所以在近些年取得了快速發(fā)展。但是,該方法的缺陷是算法較復(fù)雜,耗時(shí)較長(zhǎng)。
在國(guó)內(nèi),圖像配準(zhǔn)技術(shù)也日益得到廣泛關(guān)注,衍生出許多比較優(yōu)秀的算法。早在1997年,王小睿等人提出了基于序列相似度檢測(cè)的圖像配準(zhǔn)方法實(shí)現(xiàn)了圖像的自動(dòng)配準(zhǔn),是國(guó)內(nèi)較早研究圖像配準(zhǔn)技術(shù)并取得顯著成果的案例。對(duì)于圖像配準(zhǔn)中存在的兩大關(guān)鍵問(wèn)題,即配準(zhǔn)速度和拼接質(zhì)量,也提出了相應(yīng)的改進(jìn),比較有代表性的包括:
(1)2005年,針對(duì)圖像金字塔搜索數(shù)據(jù)量大和運(yùn)算速度慢等問(wèn)題,侯舒維和郭寶龍等人提岀了邊緣信息閉值法。
(2)2010年,李慶和李芬等人以提高圖像配準(zhǔn)質(zhì)量為目標(biāo),提出基于SUKF的PCB圖像拼接算法。
總體來(lái)說(shuō),近年來(lái),圖像配準(zhǔn)技術(shù)在國(guó)內(nèi)外發(fā)展迅速且成果顯著,但也在配準(zhǔn)速度、精確度和實(shí)時(shí)性,以及自動(dòng)化等方面存在較大的發(fā)展空間。