• <input id="zdukh"></input>
  • <b id="zdukh"><bdo id="zdukh"></bdo></b>
      <b id="zdukh"><bdo id="zdukh"></bdo></b>
    1. <i id="zdukh"><bdo id="zdukh"></bdo></i>

      <wbr id="zdukh"><table id="zdukh"></table></wbr>

      1. <input id="zdukh"></input>
        <wbr id="zdukh"><ins id="zdukh"></ins></wbr>
        <sub id="zdukh"></sub>
        公務(wù)員期刊網(wǎng) 精選范文 計算機(jī)視覺感知技術(shù)范文

        計算機(jī)視覺感知技術(shù)精選(九篇)

        前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機(jī)視覺感知技術(shù)主題范文,僅供參考,歡迎閱讀并收藏。

        計算機(jī)視覺感知技術(shù)

        第1篇:計算機(jī)視覺感知技術(shù)范文

        1計算機(jī)視覺的概述及基本體系結(jié)構(gòu)

        1.1計算機(jī)視覺概述

        通過使用計算機(jī)和相關(guān)設(shè)備,對生物視覺進(jìn)行模擬的方式,就是計算機(jī)視覺。對采集到的圖片或視頻進(jìn)行相應(yīng)的技術(shù)處理,從而獲得相應(yīng)的三維信息場景,是計算機(jī)視覺的主要任務(wù)。計算機(jī)視覺是一門學(xué)問,它就如何通過計算機(jī)和照相機(jī)的運(yùn)用,使人們獲得被拍攝對象的數(shù)據(jù)與信息所需等問題進(jìn)行研究。簡單的說,就是讓計算機(jī)通過人們給其安裝上的“大腦”和“眼睛”,對周圍環(huán)境進(jìn)行感知。計算機(jī)視覺是一門綜合性學(xué)科,在各個領(lǐng)域都有所作為,已經(jīng)吸引了各個領(lǐng)域的研究者對其研究。同時,計算機(jī)視覺也是科學(xué)領(lǐng)域中一個具有重要挑戰(zhàn)性的研究。

        1.2計算機(jī)視覺領(lǐng)域基本體系結(jié)構(gòu)

        提出第一個較為完善的視覺系統(tǒng)框架的是Marr,他從信息處理系統(tǒng)角度出發(fā),結(jié)合圖像處理、心理物理學(xué)等多領(lǐng)域的研究成果,提出被計算機(jī)視覺工作者基本接受的計算機(jī)視覺系統(tǒng)框架。在此基礎(chǔ)上,研究者們針對視覺系統(tǒng)框架的各個角度、各個階段、各個功能進(jìn)行分析研究,得出了計算機(jī)視覺系統(tǒng)的基本體系結(jié)構(gòu),如圖1。

        2計算機(jī)視覺在交通領(lǐng)域的應(yīng)用

        2.1牌照識別

        車輛的唯一身份是車輛牌照。在檢測違規(guī)車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應(yīng)用價值。然而在實際應(yīng)用工作中,雖然車牌識別技術(shù)相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術(shù)仍需改善。車牌定位技術(shù)、車牌字符識別技術(shù)和車牌字符分割技術(shù)是組成車牌識別技術(shù)的重要部分。

        2.2車輛檢測

        目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續(xù)變化的。此外,對于某些交通區(qū)域來說,公共資源的配備,比如交通警察、交通車輛的數(shù)量是有限的。如果能根據(jù)計算機(jī)視覺技術(shù),對交通路口的不同時間、不同位置的交通情況進(jìn)行分析計算,并對交通流量進(jìn)行預(yù)測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據(jù)實際情況設(shè)置動態(tài)變化等技術(shù)提供支持。

        2.3統(tǒng)計公交乘客人數(shù)

        城市公共交通的核心內(nèi)容是城市公交調(diào)度問題,一個城市如何合理的解決公交調(diào)度問題,是緩解城市運(yùn)力和運(yùn)量矛盾,緩解城市交通緊張的有效措施。城市公交調(diào)度問題,為公交公司與乘客的平衡利益,為公交公司的經(jīng)濟(jì)利益和社會效益的提高做出了巨大的貢獻(xiàn)。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調(diào)度不均衡問題,使有限資源浪費(fèi)嚴(yán)重。在計算機(jī)視覺智能公交系統(tǒng)中,自動乘客計數(shù)技術(shù)是其關(guān)鍵技術(shù)。自動乘客計數(shù)技術(shù),是對乘客上下車的時間和地點自動收集的最有效的技術(shù)之一。根據(jù)其收集到的數(shù)據(jù),從時間和地點兩方面對客流分析,為城市公交調(diào)度進(jìn)行合理的安排。

        2.4對車道偏離程度和駕駛員工作狀態(tài)判斷

        交通事故的發(fā)生率隨著車輛數(shù)量的增加而增加。引發(fā)交通事故的重要因素之一就是駕駛員疲勞駕駛。據(jù)相關(guān)數(shù)據(jù)顯示,因車道偏離導(dǎo)致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導(dǎo)致車道偏離的主要原因。針對此種現(xiàn)象,為減少交通事故的發(fā)生,計算機(jī)視覺中車道偏離預(yù)警系統(tǒng)被研究開發(fā)并被廣泛應(yīng)用。針對駕駛員眨眼頻率,利用計算機(jī)視覺對駕駛員面部進(jìn)行圖像處理和分析,再根據(jù)疲勞駕駛關(guān)注度與眨眼頻率的關(guān)系,對駕駛員的工作狀態(tài)進(jìn)行判斷。此外,根據(jù)道路識別技術(shù),對車輛行駛狀態(tài)進(jìn)行檢測,也是判斷駕駛員工作狀態(tài)的方法之一。這兩種方法,是目前基于計算機(jī)視覺的基礎(chǔ)上,檢測駕駛員疲勞狀態(tài)的有效方法。

        2.5路面破損檢測

        最常見的路面損壞方式就是裂縫。利用計算機(jī)視覺,及時發(fā)現(xiàn)路面破損情況,并在其裂縫程度嚴(yán)重之前進(jìn)行修補(bǔ),有利于節(jié)省維護(hù)成本,也避免出現(xiàn)路面坍塌,車輛凹陷的情況發(fā)生。利用計算機(jī)視覺進(jìn)行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強(qiáng)了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。

        3結(jié)論

        本文從計算機(jī)視覺的概述,及計算機(jī)視覺基本體系結(jié)構(gòu),和計算機(jī)視覺在交通領(lǐng)域中的應(yīng)用三面進(jìn)行分析,可見計算機(jī)視覺在交通領(lǐng)域中的廣泛應(yīng)用,在交通領(lǐng)域中應(yīng)用的有效性、顯著性,以此可得計算機(jī)視覺在現(xiàn)展過程中的重要性。隨著計算機(jī)視覺技術(shù)的越來越成熟,交通領(lǐng)域的檢測管理一定會加嚴(yán)格,更加安全。

        作者:夏棟 單位:同濟(jì)大學(xué)軟件學(xué)院

        參考文獻(xiàn):

        [1]段里仁.智能交通系境在我國道路空通管理中的應(yīng)用[J].北方工業(yè)時報,2015(06).

        [2]王豐元.計算機(jī)視覺在建筑區(qū)間的應(yīng)用實例分析[J].河北電力學(xué)報,2015(04).

        [3]李釗稱.主動測距技術(shù)在計算機(jī)數(shù)據(jù)分析中的作用探析[J].計算機(jī)應(yīng)用,2015(08).

        [4]馬良紅.三維物體影像的攝取與分析[J].中國公路學(xué)報,2014(05).

        第2篇:計算機(jī)視覺感知技術(shù)范文

        關(guān)鍵詞:動態(tài)場景;自適應(yīng)預(yù)測;多特征融合;計算機(jī)視覺;運(yùn)動目標(biāo)

        接受信息的關(guān)鍵手段之一就是視覺系統(tǒng),隨著科學(xué)技術(shù)水平的不斷發(fā)展,以及計算機(jī)和信號處理理論的誕生,讓機(jī)器擁有人類視覺功能已經(jīng)不再是夢。對所采集視頻中的運(yùn)動目標(biāo)進(jìn)行跟蹤、檢測,并對其目標(biāo)行為進(jìn)行分析,就是運(yùn)動目標(biāo)分析的內(nèi)容,運(yùn)動目標(biāo)分析是計算機(jī)視覺領(lǐng)域關(guān)鍵內(nèi)容之一,其屬于圖像理解與圖像分析的范疇。而在運(yùn)動目標(biāo)分析系統(tǒng)中,跟蹤與檢測運(yùn)動目標(biāo)則為中級和低級處理部分,是分析與理解行為的高等層分析模塊的基礎(chǔ)。檢測與跟蹤運(yùn)動目標(biāo)技術(shù)主要包括了:機(jī)器人視覺導(dǎo)航、軍事領(lǐng)域、運(yùn)動圖像編碼、交通管制、視覺監(jiān)視等。

        1目標(biāo)檢測算法

        連續(xù)圖像序列由視頻中提取出,由前景區(qū)域與背景區(qū)域共同組成了整個畫面。前景區(qū)域包含了如運(yùn)動的人體、車輛等動態(tài)要素,它是指人們較為感興趣的區(qū)域。而背景區(qū)域主要包含例如樹木、建筑物等靜態(tài)要素,它的像素值僅發(fā)生微弱變化或者不產(chǎn)生變化。在連續(xù)圖像序列中,采用一系列算法分隔開背景區(qū)域和前景區(qū)域,將運(yùn)動目標(biāo)信息有效提取,則為運(yùn)動目標(biāo)檢測。以靜態(tài)場景為基礎(chǔ)的運(yùn)動目標(biāo)檢測算法包括了光流法、背景差分法、幀間查分法等,文章主要針對背景差分法進(jìn)行介紹。

        背景差分法通常適用于靜態(tài)場景,其是將背景圖像與當(dāng)前幀圖像進(jìn)行差分,運(yùn)動目標(biāo)依靠閥值化進(jìn)行檢測,因為該算法僅能夠在背景變化緩慢或者不發(fā)生變化的情況下應(yīng)用,因此就有著一定的局限性。假設(shè)當(dāng)前幀圖像為fk(x,y),背景圖像B(x,y)可通過一定的方法得出,而這時背景差分圖像則為:

        (1)

        而假設(shè)二值化閥值為Th,二值化圖像B(x,y)則為:

        (2)

        運(yùn)動目標(biāo)檢測結(jié)果可通過數(shù)學(xué)形態(tài)學(xué)處理獲得。

        2 背景模型的實時更新

        要更新背景圖像可采用一階KALMAN濾波來實現(xiàn),為了克服氣候變化、光照變化等外部環(huán)境變化對運(yùn)動檢測產(chǎn)生的影響,采用一階KALMAN濾波更新背景圖像公式如下:

        Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)

        而增益因子則為:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)

        公式中?琢1和?琢2是權(quán)值系數(shù);M是第k時刻二值化后目標(biāo)圖像中p像素的值;B為背景圖像;I為當(dāng)前幀圖像。要想將運(yùn)動目標(biāo)從背景序列圖像中有效分割出來,就必須要達(dá)到?琢2足夠小的條件,且?琢1應(yīng)等于或者大于10?琢2,若?琢1值過大,就會將算法自身的去噪特性喪失,在序列背景圖像中也會存儲越來越多的運(yùn)動變化。

        3 更新車輛目標(biāo)模型

        核與活動輪廓算法具有效率高、技術(shù)復(fù)雜度低等特點,它以非參數(shù)核概率密度估計理論為基礎(chǔ),在視頻運(yùn)動目標(biāo)跟蹤中廣泛應(yīng)用。彩色圖像序列通過攝像機(jī)獲取,人臉目標(biāo)模型可以采用RGB顏色空間來進(jìn)行描述。在跟蹤車輛的過程中,噪聲、遮擋、光照等干擾或多或少存在,因干擾因素的存在,車輛像素特征也會發(fā)生相應(yīng)的微弱變化。若不對目標(biāo)模型進(jìn)行更新,會對跟蹤精度產(chǎn)生影響,所以,采用的矩形模板會包括一定背景。而在實施跟蹤的過程中,要對車輛目標(biāo)模型進(jìn)行更換。如果其過程物遮擋,當(dāng)BHATTACHARYYA系數(shù)滿足?籽>Tudm條件時,更新車輛目標(biāo)模型,更新模型為:

        (5)

        公式中Tudm是模板更新閥值;qk-1是更新之前的車輛目標(biāo)模型。通過視頻跟蹤,在近場景和遠(yuǎn)場景拍攝到的視頻中,多尺度圖像空間由各個幀圖像構(gòu)成。例如:將將書本作為跟蹤對象,由遠(yuǎn)及近從書本的正上方拍攝六十幀圖像,為了能使矩形框正好能夠包含書本,對每幀圖像張書本手工劃定矩形框,并對框內(nèi)圖像的信息量進(jìn)行統(tǒng)計。最后,隨書本尺度的變化,給出圖像信息量變化曲線。

        4 計算機(jī)視覺原理

        計算機(jī)視覺是一門研究怎樣使機(jī)器進(jìn)行觀察的科學(xué),更切確地說,就是指利用電腦和攝影機(jī)代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺,并進(jìn)一步做圖形處理,用電腦處理成為傳送給儀器檢測或更適合人眼觀察的圖像。計算機(jī)視覺研究相關(guān)的理論和技術(shù)作為一個科學(xué)學(xué)科,嘗試創(chuàng)建能夠從圖像或者多維數(shù)據(jù)中獲取信息的人工智能系統(tǒng)。這里所指的信息指Shannon定義的,可以用來幫助做一個決定的信息。因為感知可以看作是從感官信號中提取信息,所以計算機(jī)視覺也可以看作是研究如何使人工系統(tǒng)從圖像或多維數(shù)據(jù)中感知的科學(xué)。

        計算機(jī)視覺就是由計算機(jī)來代替大腦完成處理和解釋,用各種成象系統(tǒng)代替視覺器官作為輸入敏感手段。使計算機(jī)能象人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力就是計算機(jī)視覺的最終研究目標(biāo),而需要經(jīng)過長期的努力才能達(dá)到這個目標(biāo)。所以,在實現(xiàn)最終目標(biāo)以前,通過努力的中期目標(biāo)是建立一種視覺系統(tǒng),這個系統(tǒng)能依靠反饋的某種程度的智能和視覺敏感完成一定的任務(wù)。例如:計算機(jī)視覺的一個重要應(yīng)用領(lǐng)域就是自主車輛的視覺導(dǎo)航,但要實現(xiàn)自主導(dǎo)航的系統(tǒng),卻還沒有條件實現(xiàn)象人那樣能識別和理解任何環(huán)境。所以,人們通過不懈的努力,研究在高速公路上具有道路跟蹤能力,有效避免與前方車輛碰撞的視覺輔助駕駛系統(tǒng)。人類視覺系統(tǒng)是有史以來,人們所知道的功能最強(qiáng)大和完善的視覺系統(tǒng)。這里要指出的一點是在計算機(jī)視覺系統(tǒng)中計算機(jī)起代替人腦的作用。計算機(jī)視覺可以而且應(yīng)該根據(jù)計算機(jī)系統(tǒng)的特點來進(jìn)行視覺信息的處理,但并不等于計算機(jī)必須按人類視覺的方法完成視覺信息的處理??梢哉f,對人類視覺處理機(jī)制的研究將給計算機(jī)視覺的研究提供指導(dǎo)和啟發(fā),所以,用計算機(jī)信息處理的方法研究人類視覺的機(jī)理,建立人類視覺的計算理論,與此同時也是一個十分重要和讓人感興趣的研究領(lǐng)域。這方面的研究被稱為計算視覺。計算視覺可被認(rèn)為是計算機(jī)視覺中的一個研究領(lǐng)域。計算機(jī)視覺領(lǐng)域的不完善性與多樣性為其突出特點。

        5 結(jié)束語

        對視頻中的運(yùn)動目標(biāo)進(jìn)行跟蹤、識別、檢測,并對目標(biāo)行為進(jìn)行研究、分析,這就是基于視覺運(yùn)動目標(biāo)分析。以計算機(jī)視覺為基礎(chǔ),分析運(yùn)動目標(biāo),包括了目標(biāo)行為的理解與分析、目標(biāo)跟蹤、運(yùn)動目標(biāo)檢測、預(yù)處理圖像等,它是計算機(jī)視覺領(lǐng)域重要內(nèi)容之一。理解與分析運(yùn)動目標(biāo)的行為,既是計算機(jī)視覺的根本目的之一,也是檢測與跟蹤運(yùn)動目標(biāo)的最終目標(biāo)。從理論層考慮,理解與分析運(yùn)動目標(biāo)的行為可以分為人工智能理論研究與模式識別。簡要闡述基于計算機(jī)視覺的運(yùn)動目標(biāo)分析,而所面臨的是對運(yùn)動目標(biāo)行為的理解。

        參考文獻(xiàn)

        [1]楊可,劉明軍,毛欣,夏維建,劉偉,周旋,吳煒,周凱.基于計算機(jī)視覺的電纜終端表面溫升分析系統(tǒng)[J].電視技術(shù),2013(7).

        [2]葉闖,沈益青,李豪,曹思汗,王柏祥.基于人類視覺特性(HVS)的離散小波變換(DWT)數(shù)字水印算法[J].浙江大學(xué)學(xué)報:理學(xué)版,2013(2).

        [3]何青海,馬本學(xué),瞿端陽,李宏偉,王寶.基于機(jī)器視覺棉葉螨自動監(jiān)測與分級方法研究[J].農(nóng)機(jī)化研究,2013(4).

        [4]賈挺猛,茍一,鮑官軍,董茂,楊慶華.基于機(jī)器視覺的葡萄樹枝骨架提取算法研究[J].機(jī)電工程,2013(4).

        第3篇:計算機(jī)視覺感知技術(shù)范文

        關(guān)鍵詞: 計算機(jī) 視覺注意機(jī)制 計算機(jī)視覺注意模型

        1.引言

        隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)處理量劇增,以及用戶不斷擴(kuò)大的個性化需求,對計算機(jī)信息處理能力提出了越來越高的要求。如何在場景中快速準(zhǔn)確地找到與任務(wù)相關(guān)的局部信息,即物體選擇與識別,已經(jīng)成為計算機(jī)信息處理領(lǐng)域的一個研究熱點。隨著在心理學(xué)領(lǐng)域注意機(jī)制研究的不斷發(fā)展,將注意機(jī)制引入信息處理領(lǐng)域來解決物體識別問題,已經(jīng)不再是紙上談兵。

        人類視覺系統(tǒng)進(jìn)行視覺信息處理時,總是迅速選擇少數(shù)幾個顯著對象進(jìn)行優(yōu)先處理,忽略或舍棄其他的非顯著對象。進(jìn)入人類視野的海量信息,通過注意選擇機(jī)制進(jìn)行篩選,就能使我們有選擇地分配有限的視覺處理資源,保證視覺信息處理的效率,這就是視覺選擇注意機(jī)制的原理。依據(jù)人類視覺選擇注意的基本原理,開發(fā)能夠進(jìn)行智能圖像信息處理的計算機(jī)系統(tǒng),就成為一大任務(wù)。我們研究的主要方向是使計算機(jī)處理對象時,能夠具備與人類相似的視覺選擇注意能力。

        2.視覺注意機(jī)制

        研究視覺注意機(jī)制是個多學(xué)科交叉的問題,目前多個領(lǐng)域的研究人員都取得了研究成果,并且對視覺注意的理論都形成了一些共識。目前普遍認(rèn)為注意既可以是按自底向上(自下而上)的圖像數(shù)據(jù)驅(qū)動的,也可以是安自頂向下(自上而下)的任務(wù)驅(qū)動的。其中,自下而上的研究主要來自圖像中物體數(shù)據(jù)本身的顯著性。例如,在視覺搜索實驗中,顯著的物體會自動跳出,如圖1中的圓點通過特征對比,以形狀跳出的形式獲得注意。自上而下的引導(dǎo)主要來自當(dāng)前的視覺任務(wù),以及場景的快速認(rèn)證結(jié)果,即我們可以“故意”去注意任何一個“不起眼”的物體,如我們可以在圖書館浩如煙海的藏書中,找到自己感興趣的那本書。

        研究視覺注意機(jī)制的重要方法是研究眼睛在搜索目標(biāo)時的表現(xiàn)。顯著圖中的各目標(biāo)在競爭中吸引注意點,注意點在各個注意目標(biāo)間轉(zhuǎn)移。根據(jù)注意點轉(zhuǎn)移時是否伴隨眼動,視覺注意也分為隱式注意和顯式注意。隱式注意的中央凹不會隨著注意點的轉(zhuǎn)移而移動,而顯式注意的中央凹隨每次注意點的轉(zhuǎn)移而運(yùn)動。

        對視覺注意機(jī)制的研究為計算機(jī)視覺的發(fā)展提供了可能。計算機(jī)視覺借鑒人類視覺的注意機(jī)制,建立視覺注意的計算模型。通過“注意點”的選擇與轉(zhuǎn)移,實現(xiàn)對復(fù)雜場景中任務(wù)的搜索與定位,最終來實現(xiàn)實時信息的響應(yīng)處理。在計算機(jī)視覺的研究中,顯式注意應(yīng)用較多。

        3.計算機(jī)視覺注意模型

        從人的角度來看,人類視覺系統(tǒng)通過視覺,選擇注意在復(fù)雜的場景中迅速將注意力集中在少數(shù)幾個顯著的視覺對象上。從場景的角度來看,場景中的某些內(nèi)容比其他內(nèi)容更能引起觀察者的注意,我們稱之為視覺顯著性,兩者其實是從不同的角度對視覺選擇注意過程的描述。

        我們把引起注意的場景內(nèi)容定義為注意焦點FOA(Focus of Attention)。Treisman的特征整合理論中將視覺信息處理過程劃分為前注意和注意兩個階段,各種視覺特征在前注意階段被以并行的方式提取出來,并在注意階段以串行方式整合為視覺客體,即注意的特征和客體是通過不同方式進(jìn)行的。在注意焦點的選擇和轉(zhuǎn)移上,Koch[2]進(jìn)行了深入的研究,他提出注意焦點FOA的變化具有四個特征,即單焦點性:同一時刻只能存在一個FOA;縮放性:FOA的空間范圍可以擴(kuò)大或者縮小;焦點轉(zhuǎn)移性:FOA能夠由一個位置向另一個位置轉(zhuǎn)移;鄰近優(yōu)先性:FOA轉(zhuǎn)移時傾向于選擇與當(dāng)前注視內(nèi)容接近的位置。同時注意焦點具有抑制返回的特點,即FOA轉(zhuǎn)移時抑制返回最近被選擇過的注視區(qū)域。在此基礎(chǔ)上,視覺注意的研究人員提出了多種視覺注意模型。

        4.視覺注意模型的研究現(xiàn)狀

        人類的視覺注意過程包括兩個方面:一方面是對自下而上的初級視覺特征的加工,另一方面是由自上而下的任務(wù)的指導(dǎo),兩方面結(jié)合,共同完成了視覺的選擇性注意。與此對應(yīng),當(dāng)前的計算機(jī)視覺注意研究也分為這兩個方面。

        4.1自下向上的數(shù)據(jù)驅(qū)動注意模型研究及分析

        在沒有先驗任務(wù)指導(dǎo)的情況下,視覺注意的目標(biāo)選擇主要是由場景中自下而上的數(shù)據(jù)驅(qū)動的,目標(biāo)是否被關(guān)注,由它的顯著性決定。現(xiàn)在,自下而上的注意研究主要基于Treisman的特征整合理論和Koch&Ullman的顯著性模型,Itti、satoh等人均在此基礎(chǔ)上提出了自己的研究模型,并做了一些模型的改進(jìn)研究。自下而上的研究方法通過對輸入圖像提取顏色、朝向、亮度等方面的基本視覺特征的研究,形成各個特征對應(yīng)的顯著圖。另外,一些研究者采用基于局部或全局對比度的方法,來得到圖中每個像素的顯著性,進(jìn)而得到顯著圖。

        現(xiàn)有的自下而上的視覺注意計算模型中,Itti的顯著圖模型(簡稱Itti模型)最具代表性。該模型主要包含3個模塊:特征提取、顯著圖生成和注意焦點轉(zhuǎn)移。模型通過初級特征的提取,將多種特征、多種尺度的視覺空間通過中央―周邊算子得到的各個特征的顯著性圖合成一幅顯著圖。顯著圖中的各個目標(biāo)通過勝者為王的競爭機(jī)制,選出唯一的注意目標(biāo),其中注意焦點的轉(zhuǎn)移用的是禁止返回機(jī)制。但該模型也有一些缺點,如顯著區(qū)與目標(biāo)區(qū)域有偏差、計算量較大、運(yùn)行時間較長、動態(tài)場景中實時處理不平等。

        在動態(tài)場景之中,由于Itti模型很難滿足實時性的要求,科研工作者們正在努力研究動態(tài)場景的特性,并建立相應(yīng)的動態(tài)模型。如Wolfe[1]指出,影響前注意的特征包括顏色、方向、曲率、尺寸、運(yùn)動、深度特征、微調(diào)支距、光澤、形狀,等等,其中又以運(yùn)動特征最為敏感。而You等采用了一種空間域特征和時間域特征相結(jié)合的視覺注意模型,該模型假設(shè)當(dāng)場景中存在全局運(yùn)動時,視覺注意對象將極少做運(yùn)動。然而,許多真實的場景并不能滿足這個假設(shè),限制了模型的適用范圍。Hang等人提出了一種運(yùn)動圖的計算方法,并把運(yùn)動圖作為特征之一,與顏色、亮度、方向等特征結(jié)合。這些研究關(guān)注了運(yùn)動特征對視覺的影響,但是均存在一定的局限性,對于復(fù)雜的運(yùn)動場景的注意焦點計算很難取得良好的效果。

        我國研究者也在Itti注意模型的基礎(chǔ)上研究了適合動態(tài)場景中的注意模型,形成了一些理論成果。如曾志宏[2]等人提出注意焦點計算模型,鄭雅羽[3]等提出基于時空特征融合的視覺注意計算模型。這些模型都能較好地提取動態(tài)場景下的視覺目標(biāo)。

        4.2自上而下的任務(wù)驅(qū)動的注意模型研究及分析

        自上而下的注意即任務(wù)驅(qū)動的注意,通過目標(biāo)和任務(wù)的抽象知識,在一定程度上指導(dǎo)注意焦點的選擇。在自上而下注意模型的研究方面,Laar(1997)提出了一個用于隱式視覺注意的模型,該模型通過任務(wù)學(xué)習(xí),將注意集中于重要的特征。Rabak[4]提出了基于注意機(jī)制的視覺感知識別模型,該模型在定義目標(biāo)顯著性時,通過語義分析對其他三個自下向上的視覺控制參數(shù)項進(jìn)行線性組合。Salah將可觀測馬爾科夫模型引入到模擬任務(wù)驅(qū)動的注意模型研究中,并在數(shù)字識別和人臉識別的實驗中取得了很好的效果。Itti提出以調(diào)節(jié)心理閾值函數(shù)的形式來控制視覺感知。

        目前對自下而上的數(shù)據(jù)驅(qū)動方面的研究較多,而對自下而上的任務(wù)驅(qū)動方面研究較少。因為任務(wù)驅(qū)動的注意與人的主觀意識有關(guān),同時受到場景的全局特征影響。自上而下的注意涉及記憶、控制等多個模塊的分工協(xié)作,其過程非常復(fù)雜。

        5.計算機(jī)視覺注意模型研究的趨勢

        自底向上和自頂向下的加工是兩種方向不同的信息處理機(jī)制,兩者的結(jié)合形成了統(tǒng)一的視知覺系統(tǒng)。人類的視覺信息處理系統(tǒng)只有遵循這樣的方法,才能有效地實現(xiàn)視覺選擇注意的目的。

        實踐證明,把自底向上和自頂向下的研究相分離的研究方法并不能很好地解決計算機(jī)的視覺注意過程。要想使計算機(jī)能夠準(zhǔn)確模擬人類的視覺注意過程,實現(xiàn)主動的視覺選擇注意的目的,采用兩種研究方法相結(jié)合的形式勢在必行。自底向上的視覺注意計算往往離不開與自頂向下的有機(jī)結(jié)合,實現(xiàn)二者的優(yōu)勢互補(bǔ)是以后計算機(jī)視覺注意研究的一個趨勢。

        參考文獻(xiàn):

        [1]Wolf J M,Cave K R.Deploying visual attention:the guided search model.In:Troscianko T,Blake A,eds.AI and the Eye.Chichester,UK:Wiley press,1990.

        [2]曾志宏,周昌樂,林坤輝,曲延云,陳嘉威.目標(biāo)跟蹤的視覺注意計算模型[J].計算機(jī)工程,2008,(23).

        [3]鄭雅羽,田翔,陳耀武.基于時空特征融合的視覺注意模型[J].吉林大學(xué)學(xué)報,2009,(11).

        [4]Rabak I A,Gusakova V I,Golovan A V,et al.A model of attention-guided vision perception and recognition.Vision Research,1998,38.

        第4篇:計算機(jī)視覺感知技術(shù)范文

        關(guān)鍵詞OpenCV;科學(xué)教育;推廣價值

        1、OpenCV庫簡介

        OpenCV是由Intel微處理器研究實驗室的視覺交互組開發(fā)的一個跨平臺計算機(jī)視覺庫,它的代碼都是開源的而且都經(jīng)過非常好的優(yōu)化,并且具有很好的移植性,可以根據(jù)需求導(dǎo)入到合適的環(huán)境中使用。它可以實現(xiàn)有關(guān)圖像識別與處理和計算機(jī)視覺技術(shù)方面的很多通用算法。它的優(yōu)勢是可以運(yùn)行在當(dāng)代社會使用熱門的各大操作系統(tǒng)上,適用性強(qiáng),還可以脫離外部庫而獨(dú)立運(yùn)行。OpenCV的C和C++都是經(jīng)過優(yōu)化的開源代碼,采用靈活的接口,提升計算機(jī)的運(yùn)行速度。其中包含的函數(shù)就有500多個,包括的種類有C和C++等。OpenCV因為免費(fèi)面向市場,已經(jīng)被社會各界廣泛使用?,F(xiàn)已應(yīng)用于人機(jī)互動、圖像識別、圖像分割、目標(biāo)追蹤、3D重建、機(jī)器視覺、結(jié)構(gòu)分析等數(shù)個領(lǐng)域。OpenCV主要包括以下幾個部分:①cxcore:核心功能模塊,包含一些基本函數(shù),運(yùn)用于各種數(shù)據(jù)類型的計算。②cv:圖像處理和計算機(jī)視覺功能。③ml:機(jī)器學(xué)習(xí)模塊,主要內(nèi)容是分類器。④cvaux:包括大部分實驗性的函數(shù),例如ViewMorph-ing、三維跟蹤、PCA、HMM等。⑤Highgui:圖像界面接口,支持?jǐn)z像頭的讀取和轉(zhuǎn)換。

        2、OpenCV處理圖像的功能

        OpenCV中有很多的函數(shù),可以實現(xiàn)很多不同的功能,其中最具有學(xué)習(xí)價值的部分就是圖像處理。處理圖像主要分為三部分:加載圖像,顯示圖像,處理圖像。

        2.1加載圖像

        不同類型的圖像有著不同的內(nèi)部結(jié)構(gòu)。我們需要根據(jù)圖像的結(jié)構(gòu)采用合適的方法將圖像文件中的數(shù)據(jù)讀入內(nèi)存。OpenCV中的cvLoadImage()函數(shù),可以加載圖像數(shù)據(jù)。而且圖像的格式不影響加載的效果,加載后它以一個指向IplImage結(jié)構(gòu)體的指針形式返回,大大方便了后續(xù)處理的過程。2.2顯示圖像加載圖像后需要通過函數(shù)使其顯示。cvNamedWindow()函數(shù)由HighGUI庫提供,它可以在屏幕上創(chuàng)建一個窗口,將圖像顯示出來。cvShowImage()函數(shù)的作用是在這個創(chuàng)建的窗口中顯示出加載過后的圖像。觀察圖像時經(jīng)常用到的重要函數(shù)還有可以使程序暫停的函數(shù)cvWaitKey(),以及用于釋放內(nèi)存的函數(shù)cvReleaseImage()和cvDestoryWindow(),掌握并運(yùn)用這些函數(shù),就可以輕松的實現(xiàn)觀察圖像的功能。

        2.3處理圖像

        OpenCV中包含的多種函數(shù),可以達(dá)到圖像處理技術(shù)方面的很多效果,包括圖像灰度化函數(shù)cvtColor(),邊緣檢測函數(shù)Sobel()、Laplacian()、Canny(),其中Canny算子只能處理8位灰度圖,其余兩種8位32位都可以,合并梯度函數(shù)addWeighted(),放大縮小函數(shù)resize(),閾值化操作函數(shù)imshow()等等。適當(dāng)選用合適的函數(shù)并加以運(yùn)用即可達(dá)到目標(biāo)所需。

        3、OpenCV的推廣價值體現(xiàn)

        OpenCV可以應(yīng)用在社會的各個領(lǐng)域,價值就體現(xiàn)在每個科學(xué)的產(chǎn)物當(dāng)中。舉個近在身邊的例子,隨著社會的發(fā)展,生活質(zhì)量的提高,人們的居住環(huán)境也在逐漸改善,樓層越蓋越高,無數(shù)摩天大樓,商業(yè)大廈群起而立,電梯已經(jīng)成為了我們?nèi)粘I钪斜夭豢缮俚墓ぞ?。盡管現(xiàn)在電梯的功能、質(zhì)量不斷地提升,但是仍然存在些許不足,當(dāng)我們在學(xué)校的教學(xué)樓內(nèi)等電梯時發(fā)現(xiàn)了一個問題,那就是在電梯使用的高峰期時,比如在上下課時段,有很多人都在同一樓層等電梯。但是此時只有一臺離該樓層最近的電梯會過來,而其余的電梯都會自動向其它叫梯樓層運(yùn)行或是閑置??墒谴藭r這一臺電梯只能容納有限數(shù)量的人,時常不能使所有人坐上電梯,這樣就無法滿足全部人的需求,由此就導(dǎo)致了有部分人無法及時地坐上電梯,需要繼續(xù)等候,而閑置的電梯又不能及時地被利用。這樣不僅不能合理地利用資源,反而浪費(fèi)了許多不必要的時間。因此,我們想到可以通過利用圖像識別與處理的方法來彌補(bǔ)這個不足,首先通過硬件設(shè)備連接拍照捕獲候梯人像,后臺運(yùn)行判斷出候梯人數(shù),然后運(yùn)用語言編程來確定調(diào)動電梯的個數(shù),從而來達(dá)到實現(xiàn)自動控制每個電梯的運(yùn)行的目的,使所有人都能在第一時間乘坐電梯。而上文中提到的OpenCV就可以完成這項艱巨的任務(wù)。我們將OpenCV導(dǎo)入編程環(huán)境,其次修改電梯工作系統(tǒng)的運(yùn)行程序,將軟件與硬件設(shè)備相連通,這樣通過調(diào)度程序,就可以輕松高效地解決這個問題。使用這種方法,不僅可以節(jié)約人們的候梯時間,方便學(xué)生、老師上課,而且可以合理有效地調(diào)度電梯,使電梯的價值得到最大化。見微知著,OpenCV可以應(yīng)用在每個領(lǐng)域,對各界的發(fā)展起到推動作用,造福社會的科技發(fā)展,方便人們的生活。

        4、科學(xué)教育存在的問題

        在歷年的教學(xué)模式中,老師們往往會強(qiáng)調(diào)理論知識的重要性,但卻忽略了對學(xué)生使用動手能力的培養(yǎng),學(xué)生不能獨(dú)立完成實踐性的技術(shù)操作,也就是說教學(xué)模式缺乏實踐性。只有將理論與實踐相結(jié)合,才能實現(xiàn)知識價值的最大化,因此,應(yīng)當(dāng)在教學(xué)中配合著實踐課程,舉一反三,讓學(xué)生們更加深刻地學(xué)習(xí)和了解所學(xué)到的知識。而如今雖然一部分學(xué)校也開設(shè)了實踐課程,但也只是淺嘗輒止,并沒有過多地講授計算機(jī)技術(shù)實踐方面的知識,學(xué)生們也沒有真正擁有動手實踐能力,這使學(xué)生們的技術(shù)知識十分受限。雖然現(xiàn)在多數(shù)學(xué)生對計算機(jī)略懂一二,但是實際上僅僅會使用類似Word等簡單的軟件,而技術(shù)要求較高的一些軟件及工具卻全然不知,甚至對自己所學(xué)過的課程軟件的使用也是馬馬虎虎,這對于未來工作所需的能力來講,實在是九牛一毛。目前中學(xué)生使用電腦的重心更多放在了社交軟件和游戲上,很少有人利用計算機(jī)學(xué)習(xí)更多的技能,這對青少年的發(fā)展實在是利大于弊的,而且這樣也失去了計算機(jī)的正向價值。因此,我們應(yīng)該改變現(xiàn)有的教學(xué)模式,一邊教授理論知識,一邊配合指導(dǎo)學(xué)生動手操作,將理論與實踐相結(jié)合,也能讓學(xué)生更好地消化和吸收所學(xué)到的知識,并且引導(dǎo)學(xué)生正確使用計算機(jī),發(fā)揮計算機(jī)的價值,讓學(xué)生們都能夠在計算機(jī)中獲得更多的知識。

        5OpenCV開源算法庫在各個領(lǐng)域的實例化體現(xiàn)

        OpenCV在醫(yī)學(xué)領(lǐng)域、軍事領(lǐng)域、安全防護(hù)領(lǐng)域等都有很大的重要意義。在醫(yī)學(xué)領(lǐng)域中,由于有了這個開源算法庫,我們可以盡可能地調(diào)用它,從而來進(jìn)行圖像處理、對象檢測,讓醫(yī)生更好更快速觀測人體結(jié)構(gòu),及時發(fā)現(xiàn)病癥。在軍事領(lǐng)域中,大多數(shù)無人操作的機(jī)器運(yùn)作,比如無人機(jī)飛行、水下無人駕駛儀、無人駕駛汽車等等,都需要用到OpenCV來對圖像進(jìn)行處理,并進(jìn)行分析,并且可以檢測出人眼看不到的事物,這是OpenCV能夠帶來人類的巨大的進(jìn)步。在安全防護(hù)領(lǐng)域中,我們現(xiàn)實生活中常見的汽車的安全駕駛,房屋入侵的檢測、自動監(jiān)視報警系統(tǒng)等等,正是由于這些技術(shù),讓我們的環(huán)境更加安全,這都是我們生活中息息相關(guān)不可缺少的?,F(xiàn)如今,國家的科學(xué)技術(shù)飛速發(fā)展,日益強(qiáng)盛,OpenCV的成績有目共睹,未來的發(fā)展需要科學(xué)技術(shù)的不斷推進(jìn),才能為祖國未來的其他事業(yè)提供強(qiáng)有力的后盾。

        6OpenCV在科學(xué)教育中的作用

        在文化改革的大背景下,文盲的概念早已從沒有文化轉(zhuǎn)變成了不會使用計算機(jī)。因為隨著科技的進(jìn)步,計算機(jī)的使用已經(jīng)越來越廣泛,計算機(jī)已經(jīng)逐步取代了以往人工可以完成的許多工作,比如在超市生成的結(jié)賬單、用計算機(jī)控制動力系統(tǒng)的運(yùn)行、人造衛(wèi)星軌跡的計算等等,這些都依賴于計算機(jī)強(qiáng)大的功能。計算機(jī)的推廣證明著我國科技的發(fā)展和人類文明的進(jìn)步,由此可見,計算機(jī)技術(shù)知識的掌握對現(xiàn)代人來說是十分重要的。如果想要成為一個真正有技術(shù)、有能力的人才,就務(wù)必要熟練掌握計算機(jī)技術(shù)的使用。但是目前當(dāng)代社會的教育在計算機(jī)技術(shù)方面的內(nèi)容還不夠豐富。減壓政策開放以來,教育課時被壓縮,技術(shù)知識的傳輸也相應(yīng)減少,學(xué)生們的能力也因此日益下降。而科學(xué)教育,顧名思義,是使科學(xué)技術(shù)在教育過程中得以傳承。想要科學(xué)地教育學(xué)生,就必須要多多講授科學(xué)技術(shù)方面有關(guān)的知識。說到科學(xué)技術(shù),它的重點自然是計算機(jī)技術(shù),而OpenCV作為計算機(jī)視覺技術(shù)的核心,可以說也是計算機(jī)技術(shù)甚至科學(xué)教育中的一個重要部分。在教育中普及并傳承這個技術(shù)無疑可以提高學(xué)生們的技術(shù)水平。但是,相信有大多數(shù)的人在此之前從未聽說過計算機(jī)視覺技術(shù),也并不了解OpenCV庫,更加不會學(xué)習(xí)到與之有關(guān)的技術(shù)知識。在這樣嚴(yán)峻的形勢下,我們更應(yīng)該將類似OpenCV方面技術(shù)有關(guān)的知識通過教育傳遞下去。各大高校應(yīng)積極開展有關(guān)計算機(jī)的活動,開設(shè)與計算機(jī)技術(shù)有關(guān)的課程。這樣才能根據(jù)社會的需求來培養(yǎng)更多的綜合性人才。如果可以將其投入到現(xiàn)代教育當(dāng)中,定會使現(xiàn)在的教育事業(yè)更加輝煌,也能使祖國的未來更加璀璨。

        參考文獻(xiàn)

        [1]于仕琪,劉瑞禎.學(xué)習(xí)OpenCV(中文版)[M].北京:清華大學(xué)出版社,2009.

        [2]陰法名.基于OpenCV圖像處理[J].科技信息,2009(32):220.

        [3]賈小軍,喻擎蒼.基于開源計算機(jī)視覺庫OpenCV的圖像處理[J].計算機(jī)應(yīng)用與軟件,2008,25(4):276-278.

        [4]陳勝勇.基于OpenCV的計算機(jī)視覺技術(shù)實現(xiàn)[M].北京:科學(xué)出版社,2008.

        [5]劉潔,馮貴玉,張汗靈.一種圖像處理和計算機(jī)視覺的開發(fā)工具[J].計算機(jī)仿真,2006(11).

        第5篇:計算機(jī)視覺感知技術(shù)范文

        關(guān)鍵詞:多模態(tài);檢索;圖像特征

        0 引言

        現(xiàn)階段基于圖像檢索普遍采用方式是人工對上傳到網(wǎng)絡(luò)中的數(shù)字圖像進(jìn)行文字標(biāo)注,根據(jù)每幅圖像的視覺特征人為的設(shè)置他們的文字描述。在檢索時,使用標(biāo)注的文字作為關(guān)鍵字來檢索我們想要的數(shù)字圖像。這種依據(jù)圖像標(biāo)注的文字匹配檢索的方法簡稱為“字找圖”,它的缺點為:(1)由于需要大量的人工對每幅圖像進(jìn)行文字標(biāo)注,數(shù)字圖像的數(shù)量是海量的,標(biāo)注工作是非常耗費(fèi)人力和時間;(2)由于每個人對圖像的認(rèn)識不同,所以,在標(biāo)注的過程中會按照自己對圖像的認(rèn)識來選擇標(biāo)注文字,這樣會使不同的人對圖像的標(biāo)注不同,而在檢索中會產(chǎn)生很大誤差;(3)不同國家使用的標(biāo)注文字不同,所以在匹配文字時也會產(chǎn)生很大的偏差;(4)有的圖像里面含有大量的內(nèi)容,不可能用幾個關(guān)鍵字就能表達(dá)清楚。為解決標(biāo)注圖像檢索的缺陷問題。學(xué)者著手開展對內(nèi)容的圖像檢索技術(shù)的研究。基于多模態(tài)的圖像檢索的改善了此類瓶頸問題,主要從被檢圖像庫根據(jù)海量圖像特征進(jìn)行檢測和匹配,獲取圖像之間的相關(guān)性特征信息。

        1 基于多模態(tài)的圖像特征匹配方法

        (1)直接從圖像中尋找匹配線索,而不是通過人為的文字標(biāo)注,正因為這個特點,突破了傳統(tǒng)的關(guān)鍵字標(biāo)注的耗費(fèi)人力時間的缺點,而是直接對圖像本身進(jìn)行處理和分析,使檢索更貼近圖像本身。

        (2)檢索可以是人機(jī)交互的,當(dāng)使用一種特征選取方式檢索的結(jié)果不能滿足人們的需求時,人們可以人工的改變特征選取方式使檢索結(jié)果向于人們需求的方向接近。這樣避免了計算機(jī)檢索圖像時的不靈活性,加入了人為的因素。因此,人和計算機(jī)結(jié)合檢索能使效率和準(zhǔn)確率更高。

        (3)基于內(nèi)容的圖像檢索是一種相似性檢索,可以將檢索結(jié)果進(jìn)行相似性排序,我們可以采取逐步求精的算法,不斷減小檢索的范圍,直到定位到準(zhǔn)確目標(biāo),這與傳統(tǒng)數(shù)據(jù)庫精確匹配有很大的不同。

        由于這些方法,基于多模態(tài)內(nèi)容的圖像檢索漸漸成為人們研究的重點,此類技術(shù)可以應(yīng)用在社會安全、遙感、醫(yī)學(xué)、數(shù)字圖書館、建筑、計算機(jī)輔助設(shè)計、地理信息系統(tǒng)、商標(biāo)版權(quán)管理、等諸多領(lǐng)域。

        2 基于紋理識別的多模態(tài)的圖像檢索系統(tǒng)的框架和技術(shù)

        基于紋理識別的多模態(tài)圖像檢索系統(tǒng)組成部分如圖1所示。

        (1)輸入模塊:分析和獲取圖像的紋理特征值,并將特征向量輸入圖像特征數(shù)據(jù)庫。

        (2)描述模塊:利用查詢抽象檢索技術(shù),實現(xiàn)將用戶需求抽象提取相關(guān)圖像特征語義,并完整描述成計算機(jī)能進(jìn)行識別的特征向量。

        (3)檢索模塊:與圖像數(shù)據(jù)庫的圖像紋理特征值進(jìn)行相關(guān)性匹配,根據(jù)機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù),對跨語義的特征向量進(jìn)行學(xué)習(xí)和篩選,獲取最符合查詢要求的圖像信息,并返回給用戶。

        3 基于圖像紋理特征的檢測方法

        圖像有三大底層特征,分別是顏色特征、紋理特征和形狀特征。紋理特征是顯著的視覺特征,其弱化了顏色和亮度的作用,但它吸收了表面結(jié)構(gòu)的排列與組織次序,而且表現(xiàn)出了上下文的關(guān)系,反映出了同質(zhì)再現(xiàn)的視覺特征。

        紋理源于人們對物體表面觸感的概念,這種固有的內(nèi)在特征反映了物體表面的組織結(jié)構(gòu)或者上下文內(nèi)容的關(guān)系等諸多有用的信息,或者反映了圖像像素間的灰度變化情況或者顏色變化情況。組成紋理的基本元素叫作紋元或者紋理基元,是一個觸發(fā)視覺感知并且特性相對穩(wěn)定的基本單元,這些單元在一定的區(qū)域內(nèi)的不同位置會以不同的形態(tài)再現(xiàn),主要是灰度或色彩模式呈現(xiàn)不同特點,其包含多個像素,在物體表面呈現(xiàn)三種:周期性、準(zhǔn)周期性或隨機(jī)性。

        如今,神經(jīng)網(wǎng)絡(luò)、最近鄰分類器、決策樹和支持向量機(jī)等模式方法已經(jīng)廣泛的應(yīng)用到了許多領(lǐng)域,譬如圖像分類、視頻處理、檢索等。模式類就是由一些共同屬性所決定的,模式分類就是根據(jù)對象的特征或?qū)傩赃M(jìn)行分類。

        按照學(xué)習(xí)方法的監(jiān)督程度,也就是根據(jù)否存在先驗知識并且是否使用到這些先驗知識,模式分類方法可以分為監(jiān)督分類和非監(jiān)督分類。

        監(jiān)督分類對各對象分類的依據(jù)是通過訓(xùn)練樣本,選擇合適的特征參數(shù),以此建立判別函數(shù)。監(jiān)督分類必須要有分類區(qū)域的先驗類別知識用以建立判別函數(shù),從而獲得訓(xùn)練分類器,它把圖像分解為多個組成部分,求解各部分之間的空間關(guān)系。一般監(jiān)督分類在訓(xùn)練階段需要手工選擇分類區(qū)域從而可以確定模型。

        在沒有先驗知識情況下,非監(jiān)督分類能夠有效地分類,是因為其根據(jù)圖像像元間的相似度和從分析數(shù)據(jù)上得到的統(tǒng)計特性,它不需要獲取判別函數(shù)集而去進(jìn)行場地訓(xùn)練。熟知并且常用的K-means和ISODATA法就是非監(jiān)督分類方法,也是一種聚類分析方法。這種方法是將圖像視作一些特征的集合,先對這些特征進(jìn)行聚類分析,得到特征單詞和特征碼,再用統(tǒng)計方法對特征單詞和特征碼進(jìn)行統(tǒng)計分析,最后根據(jù)統(tǒng)計特征進(jìn)行有效分類。

        前面一種分類是根據(jù)監(jiān)督程度來劃分,模式分類方法還可以分為經(jīng)驗型分類方法和理論型分類方法,此時是根據(jù)有無前人分類算法的思想。經(jīng)驗型方法中比較常用的有最近鄰分類器、RBF網(wǎng)絡(luò)和神經(jīng)網(wǎng)絡(luò)等。理論型模式分類算法比較常用的有貝葉斯分類器,支持向量機(jī),這種分類算法數(shù)量較少,遠(yuǎn)沒有經(jīng)驗型分類方法多。貝葉斯分類器通過計算樣本概率的差異,將樣本進(jìn)行分類,但是分布函數(shù)的求取較為困難;支持向量機(jī)方法SVM基于統(tǒng)計學(xué)習(xí)理論,在實際應(yīng)用中取得了一定的成效。

        第6篇:計算機(jī)視覺感知技術(shù)范文

        技術(shù)層面:以骨干企業(yè)為創(chuàng)新主體,結(jié)合高校、科研院所等智力資源,著力突破一批重大共性關(guān)鍵技術(shù)。

        自然語言處理。研發(fā)自動分詞、命名實體識別、詞性標(biāo)注等自然語言處理基礎(chǔ)技術(shù),開展語法分析、語義分析、對話管理、意圖檢測等深度技術(shù)研究,重點突破對話級別的語義理解及知識問答技術(shù),語篇級別的語義理解分析技術(shù)和高精度的文本情感分析技術(shù)等。

        計算機(jī)視覺。利用深度學(xué)習(xí)技術(shù)提升識別效果,研發(fā)面向電視遙控、手機(jī)遙控、汽車導(dǎo)航等交互領(lǐng)域的手勢識別技術(shù);研發(fā)面向人數(shù)估計、擁堵分析、目標(biāo)跟蹤、異常檢測等的大規(guī)模人群視頻監(jiān)控與智能分析技術(shù),形成具有國際先進(jìn)水平的、完整的自主知識產(chǎn)權(quán)、可轉(zhuǎn)移轉(zhuǎn)化的計算機(jī)視覺軟件系統(tǒng)。

        機(jī)器學(xué)習(xí)。通過實現(xiàn)可以靈活變換的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),應(yīng)對不同類型數(shù)據(jù)的隱層模型、百億級別的數(shù)據(jù)處理能力和模型尺度;賦予機(jī)器類人腦的時空認(rèn)知能力,形成機(jī)器學(xué)習(xí)的時空建??蚣芎透咏祟惛兄到y(tǒng)的神經(jīng)網(wǎng)絡(luò)。

        知識圖譜。面向教育、互動娛樂、智能客服等特定領(lǐng)域,研究大規(guī)模知識圖譜中不同類型知識的表示框架與學(xué)習(xí)機(jī)制,從非結(jié)構(gòu)化或半結(jié)構(gòu)化的互聯(lián)網(wǎng)信息中獲取有結(jié)構(gòu)的知識,探索多源異構(gòu)信息的知識獲取與融合表示,自動構(gòu)建知識圖譜,并研究知識表示驅(qū)動的推理技術(shù)。

        平臺層面:依托統(tǒng)一平臺實現(xiàn)智力、數(shù)據(jù)、技術(shù)和計算資源的高效對接,促進(jìn)產(chǎn)學(xué)研用聯(lián)合創(chuàng)新。

        人工智能共性技術(shù)研發(fā)平臺。加強(qiáng)智能語音處理、計算機(jī)視覺、生物特征識別、自然語言處理、機(jī)器翻譯、知識圖譜、智能邏輯推理、機(jī)器自主學(xué)習(xí)、智能機(jī)器人等重大共性關(guān)鍵技術(shù)研發(fā),為行業(yè)及有潛力的應(yīng)用創(chuàng)新開發(fā)企業(yè)和個人提供核心技術(shù)支撐,提供成熟的智能人機(jī)交互、自然語言處理、自動知識檢索等共性技術(shù)引擎及產(chǎn)品。

        人工智能開放支撐服務(wù)平臺。基于面向人工智能領(lǐng)域的大規(guī)模分布式軟硬件基礎(chǔ)設(shè)施,匯聚企業(yè)、高校、科研院所以及創(chuàng)業(yè)者等社會多方力量,建設(shè)面向全行業(yè)和創(chuàng)新應(yīng)用開發(fā)者提供人工智能算法和服務(wù)支撐的云服務(wù)平臺,實現(xiàn)技術(shù)向產(chǎn)業(yè)活動和經(jīng)濟(jì)發(fā)展的高效轉(zhuǎn)化,推動傳統(tǒng)產(chǎn)業(yè)和社會服務(wù)向智能化方向發(fā)展。

        人工智能產(chǎn)業(yè)公共服務(wù)平臺。支持和鼓勵業(yè)內(nèi)政產(chǎn)學(xué)研用等單位,整合業(yè)內(nèi)相關(guān)資源,建立涵蓋戰(zhàn)略研究、咨詢服務(wù)、標(biāo)準(zhǔn)制定、評測認(rèn)證、應(yīng)用示范等功能于一體的產(chǎn)業(yè)公共服務(wù)平臺,為行業(yè)發(fā)展提供全面支撐。

        應(yīng)用層面:結(jié)合共性技術(shù)研發(fā)和平臺建設(shè)實際,優(yōu)先推動在服務(wù)機(jī)器人、無人駕駛、信息安全等領(lǐng)域示范應(yīng)用。

        智能客服。研發(fā)面向智能客戶服務(wù)的智能語音、語義理解等共性關(guān)鍵技術(shù),構(gòu)建特定領(lǐng)域知識庫,研發(fā)自助客服、商業(yè)智能、生物特征識別認(rèn)證等平臺系統(tǒng)。

        服務(wù)機(jī)器人。重點研發(fā)面向家庭環(huán)境的語音增強(qiáng)、室內(nèi)定位和導(dǎo)航跟蹤等共性關(guān)鍵技術(shù),整合傳感器和機(jī)械控制相關(guān)技術(shù)成果,實現(xiàn)軟硬件一體化的服務(wù)機(jī)器人綜合系統(tǒng),并在家庭、教育、醫(yī)療等方面形成示范應(yīng)用。

        第7篇:計算機(jī)視覺感知技術(shù)范文

        眼下,在北京中關(guān)村頤和園附近的一所宅院里,最接近科幻的一幕現(xiàn)實版故事正在上演。

        落地

        這是一家專注于計算機(jī)視覺以及人工智能的科技公司,致力于讓計算機(jī)像人一樣主動獲取視覺信息并進(jìn)行精確的實時分析。它創(chuàng)立于2013年初,成立不久就獲得真格基金和聯(lián)創(chuàng)策源的天使投資,并于2014年6月獲得紅杉資本數(shù)千萬美元A輪投資。

        似乎有意無意和中關(guān)村的幾十萬創(chuàng)業(yè)大軍和眾多極客有所區(qū)分,格靈深瞳選擇了一處古色古香的大院子作為辦公場所。本刊記者在一個有點陰雨的天氣里,隨著中關(guān)村管委會等部門組織的媒體團(tuán)來探訪這個有點神秘的科技公司。

        一臉陽光的格靈深瞳CEO何搏飛帶領(lǐng)眾人穿越回廊,讓人感覺在穿越格非小說里的南方,而中央大廳里辦公的年輕人專注于電腦屏幕和鍵盤的神情則提醒我們這是一個IT公司。事實上,這里的人有不少來自美國斯坦福、布朗大學(xué)等名校,而且,按照何搏飛的說法,這里完全按照硅谷的方法來管理。

        當(dāng)我們落座在會議室的時候,何搏飛和同事打開了鏈接投影儀的電腦,他早就準(zhǔn)備了一場演說。他的同事也有一些散落在聽眾席上,年輕的臉上洋溢著青春的印記。在講述了人工智能時代的趨勢之外,何搏飛也介紹了他們正在做的具體業(yè)務(wù)。

        作為一種并不那么科幻的務(wù)實之舉,格靈深瞳現(xiàn)階段聚焦于將人工智能及模式識別技術(shù)應(yīng)用到安防、交通、零售等領(lǐng)域,客戶包括了中國網(wǎng)點最多的銀行、銷售額最高的商場,以及客流量最大的機(jī)場等。這是一個可以讓技術(shù)優(yōu)勢變現(xiàn)的領(lǐng)域,可以讓格靈深瞳不至于凌空蹈虛。

        這是一塊大蛋糕。據(jù)何搏飛的介紹,安防監(jiān)控領(lǐng)域的中國市場規(guī)模在2013年就已達(dá)到4000億人民幣,比智能手機(jī)的市場高出了800多億,而且未來中國安防監(jiān)控領(lǐng)域還有巨大的增長空間。

        關(guān)于行業(yè)痛點,他分別從“監(jiān)”和“控”兩個層面給大家進(jìn)行了分析。以國內(nèi)某大型機(jī)場的航站樓為例,中控室里面的每個保安需要同時看12500個攝像頭的畫面,由于人的生理極限限制,這是不可能辦到的;再以天安門為例,所有的攝像頭每24小時產(chǎn)生的數(shù)據(jù)量為1800T,如果天安門發(fā)生了一件事,需要找到當(dāng)事人,工作量也龐大得難以想象。

        現(xiàn)在格靈深瞳可以有辦法解決傳統(tǒng)監(jiān)控“看不見”和“找不到”的問題。他們自主研發(fā)的“深瞳無人監(jiān)控安防系統(tǒng)”可以實時地監(jiān)控人的行為并作出判斷,在最短時間內(nèi)發(fā)現(xiàn)甚至預(yù)判一些非常規(guī)事件的發(fā)生,比如暴力、跌倒等。

        聚人

        格靈深瞳的兩個創(chuàng)始人,一個是受過良好商業(yè)訓(xùn)練的經(jīng)理人,一個是頂尖的科學(xué)人才,構(gòu)成了最初的人才組合。CEO何搏飛畢業(yè)于斯坦福大學(xué)商學(xué)院,曾先后成功創(chuàng)建了兩家美國公司中國區(qū)的團(tuán)隊和業(yè)務(wù),29歲就擔(dān)任了美國上市公司中國區(qū)總經(jīng)理。而CTO的趙勇則是畢業(yè)于布朗大學(xué)計算機(jī)工程系的博士,他另一個令人矚目的身份是前Google Research研究員和谷歌眼鏡核心團(tuán)隊成員。

        這種組合猶如蘋果當(dāng)年喬布斯和沃茲的組合。科技和商業(yè),誰也離不開誰。

        真格基金很早就介入到這個創(chuàng)業(yè)團(tuán)隊中。如果沒有王強(qiáng)和徐小平的運(yùn)作和推動,趙勇何時回中國恐怕還是個未知數(shù)。

        王強(qiáng)和徐小平都是新東方教師出身,敦厚愛才之心常溢于言表。他們先后投資了陳歐、季逸超、趙勇等人。在投資季逸超的時候,他們看中的居然是季逸超只做和直接現(xiàn)實不大相關(guān)的事情。而作為谷歌眼鏡研發(fā)團(tuán)隊之一的趙勇,最初身上似乎也并未可見有多大的“市場屬性”。

        王和徐曾兩次在硅谷和趙勇喝酒,卻從來沒談創(chuàng)業(yè)或技術(shù)改變世界。他們注意到趙勇“內(nèi)心涌動著一種東西?!蓖鯊?qiáng)和徐小平覺察到了什么呢?也許趙勇在谷歌感到了瓶頸,他的自由生長欲望被阻礙了。

        徐小平捕捉到了趙勇內(nèi)心的那種閃動,開始動員他創(chuàng)業(yè),據(jù)說花了一年半左右的時間。

        2013年趙勇拎著皮箱告別谷歌,來到小平的住處。他回來之前很多基金也是非常興奮,都說投,但是當(dāng)天晚上小平告訴趙勇,其他的基金不投了,因為他現(xiàn)在沒有產(chǎn)品,也沒有什么方向。小平說:“我們?nèi)?,你敢扔掉谷歌,我們?yōu)槭裁床桓胰游覀兊腻X?”

        王強(qiáng)的觀念是這樣的:“投資的工夫在投資之外,大家都在算數(shù)字的時候我就不算,你可能獲得的就是大數(shù)字,你天天算小數(shù)字,非常清晰加在一起也是非常有限的,人生投資創(chuàng)業(yè)都是一樣的道理?!?/p>

        現(xiàn)在,在頤和園旁邊的大宅院里,已經(jīng)聚集了25個人,這些都是有夢想的年輕人。他們中有21歲的陳心怡,她曾就讀于普林斯頓大學(xué),是第一個獲得美國“20 under 20”獎項的中國人,這個獎會給予每個獲獎?wù)呤f美元的資金,而獲獎的一個必要條件就是必須輟學(xué)去做一些有意義有創(chuàng)意的事情,心怡最后加入了格靈深瞳;宋晨,美國麻省理工學(xué)院碩士畢業(yè),在通用電氣工作了8個月,放棄了還有3個月就可以到手的北京戶口,迫不及待地加入了格靈深瞳;覃曉飛,西安交大的一名工科研究生,憑著自己的興趣運(yùn)營了一個微信公眾號,因為何搏飛的朋友圈屢次被該公眾號的內(nèi)容刷屏,在好奇心的驅(qū)使下,他聯(lián)系上了覃曉飛,給了他一個月的實習(xí)機(jī)會。在覃曉飛實習(xí)的第20天時,他決定退學(xué)加入格靈深瞳。何搏飛說,這三個優(yōu)秀的年輕人只是格靈深瞳員工團(tuán)隊的一個縮影,是一群有理想有熱情有創(chuàng)業(yè)夢想的優(yōu)秀人才的代表。

        造風(fēng)

        在一次極客圈里的聚會活動中。趙勇用了幾個科技大片感十足的視頻為大家展示了機(jī)器人的工作場景。借助機(jī)器視覺,機(jī)器人甚至可以在跳動的心臟上做手術(shù),機(jī)器人也可以代替人開車。之后,計算機(jī)視覺的想象空間會越來越大。他還指出,機(jī)器視覺的三個關(guān)鍵技術(shù)是3D視覺、高性能計算(神經(jīng)網(wǎng)絡(luò)計算)、機(jī)器深度學(xué)習(xí)。

        顯然,這家公司可以發(fā)力的領(lǐng)域還很寬廣。安全監(jiān)控市場只是他們展開應(yīng)用和市場化的第一個領(lǐng)域,這家公司把自己定位在更為前沿的人工智能類的公司,它面向的是一個近乎無限的市場。

        何搏飛認(rèn)為,互聯(lián)網(wǎng)的盛宴已經(jīng)宣告結(jié)束,打通人與機(jī)器的連接才是未來的奧秘之地。目前人能理解機(jī)器,未來機(jī)器要能更理解人。而格靈深瞳正在做的,是從視覺入手,讓機(jī)器有智能化的視覺能力,能讀懂人的行為模式。只有當(dāng)人與物之間能夠有效地雙向聯(lián)系,讓世間萬物能夠像人一樣感知和思考,才能最大程度地釋放出計算機(jī)的潛能為人服務(wù),這就是即將到來的“人工智能”時代,也就是“萬物智能”的時代。

        無獨(dú)有偶,前微軟亞太研發(fā)集團(tuán)主席張亞勤也發(fā)表過類似觀點:下一波科技趨勢是“互聯(lián)網(wǎng)的物理化”,即從現(xiàn)在開始到未來的幾十年,更多數(shù)字虛擬的世界將走向?qū)嶓w,物理化。

        格靈深瞳的投資人徐小平和王強(qiáng)對這個公司贊不絕口,甚至親自上場,在一個網(wǎng)絡(luò)視頻里為公司的招聘做代言。在視頻里,平時較為學(xué)究氣的王強(qiáng)援引哈羅德?布魯姆的話說,傳統(tǒng)的印刷文字的想像文學(xué)的時代,將會被一種視覺文化來替代。而計算機(jī)網(wǎng)絡(luò)的智能化又是一個非常明顯的趨勢,所以格靈深瞳踩對了未來的兩個最重要的或者全部的節(jié)點。

        徐小平認(rèn)為格靈深瞳的出現(xiàn),讓全世界的計算機(jī)擁有了人類那樣的獨(dú)立自主的判斷。這個公司做的是根本性的顛覆人類與世界關(guān)系的這么一種科技預(yù)產(chǎn)品。他興奮地?fù)u動著肩膀和兩只手,用歡快的語氣說:“我只能說我充滿了無限的遐想,以及堅定的信念。”

        筆者有點納悶,作為初創(chuàng)型公司,格靈深瞳的宣傳視頻是否略顯高調(diào)了呢?中國人平時都講究含蓄,悶聲不響發(fā)大財。但接下去的內(nèi)容讓筆者若有所悟。

        趙勇坦言,計算機(jī)視覺本身只是對世界進(jìn)行感知的一個技術(shù)。要讓它完成一個價值的話,需要整個思維體系、行動體系來配合。“比如說我們要指揮一個機(jī)器人,除了感知技術(shù)以外,要把自動控制結(jié)合起來,要把通訊結(jié)合起來,還要把機(jī)械傳動結(jié)合起來,才能夠形成一個完整的設(shè)備以及一個完整的服務(wù)或者體驗。”所以格靈深瞳需要各個方面的優(yōu)秀計算機(jī)工程師和科學(xué)家。

        筆者的感受是:格靈深瞳其實已經(jīng)找準(zhǔn)了一塊非常有潛力的領(lǐng)域,而且在關(guān)鍵環(huán)節(jié)建立了一定核心優(yōu)勢,這將撬起一個大產(chǎn)業(yè)。這時候,打出旗號,召集最優(yōu)秀的人的聚集,就是搶占前沿領(lǐng)域的一個重要步驟――得人才者得天下,適當(dāng)?shù)妮浾撛靹菀彩且环N必要的策略。

        第8篇:計算機(jī)視覺感知技術(shù)范文

        【關(guān)鍵詞】智能車輛 機(jī)器視覺 發(fā)展

        一、前言

        機(jī)器視覺技術(shù),即計算機(jī)視覺技術(shù),是智能車輛行駛環(huán)境感知的通道,一些控制決策參數(shù)直接由機(jī)器視覺獲取。例如,智能車輛自主導(dǎo)航行駛時前方預(yù)瞄點位置的獲取,超車行駛時前方車輛和車道邊界位置的獲取等等都要由機(jī)器視覺來完成。機(jī)器視覺系統(tǒng)在智能車輛上的應(yīng)用源于20世紀(jì) 80年代中期。其早期研究是針對具有良好的室內(nèi)試驗環(huán)境條件進(jìn)行設(shè)計的。

        從20世紀(jì)90年代中期開始,智能車輛機(jī)器視覺的研究出現(xiàn)兩個發(fā)展方向,其中一個發(fā)展方向是相對簡單的機(jī)器視覺系統(tǒng)在智能車輛中的早期應(yīng)用。主要體現(xiàn)在如下幾個方面:(1)機(jī)器視覺橫向輔助導(dǎo)航系統(tǒng)。(2)自適應(yīng)導(dǎo)航控制系統(tǒng)。(3)自主“停車啟動”駕駛系統(tǒng)。(4)換道輔助系統(tǒng)[1]。智能車輛機(jī)器視覺技術(shù)發(fā)展的另一個方向是研制開發(fā)具有擬人駕駛性能水平的復(fù)雜機(jī)器視覺系統(tǒng)。從長遠(yuǎn)來看,這種視覺系統(tǒng)還應(yīng)具有自學(xué)習(xí)的功能。目前,德國聯(lián)邦國防大學(xué)(UBM)著名學(xué)者Dickmanns教授開展了“多焦距主動汽車眼”(MarVEye-Multi-focal active/reactive Vehicle Eye)的研究。這種新型的綜合視覺系統(tǒng)將智能車輛機(jī)器視覺技術(shù)提高到了一個新的水平。

        二、國內(nèi)外研究現(xiàn)狀

        機(jī)器視覺導(dǎo)航智能車輛已經(jīng)成為當(dāng)今智能車輛的發(fā)展主流,世界各主要國家都在競相開展智能車輛視覺系統(tǒng)的研究。機(jī)器視覺系統(tǒng)是智能車輛感知局部環(huán)境的重要“器官”,而其所起的核心作用無外乎兩個:識別行駛道路邊界與行駛環(huán)境中的其它車輛(主要指前方車輛)或其它障礙物。具體地講,就是利用安裝在智能車輛前方的單目或多目光學(xué)CCD攝像機(jī)(或其它傳感器)實時地獲取圖像,利用圖像中的信息根據(jù)設(shè)計的算法識別出道路邊界位置和前方車輛位置,再將這些路、車位置信息傳給智能車輛的指揮系統(tǒng),為其自主導(dǎo)航?jīng)Q策提供依據(jù)。而國內(nèi)外的研究工作也主要集中在道路位置識別和前方車輛識別這兩個方面。

        目前對道路邊界的識別主要集中在直線路形和路旁障礙物較少的道路條件。直線路形識別較為簡單,用直線方程描述道路邊界,可以大大減少計算量,此技術(shù)也相對較為成熟,例如有霍夫變換法,通過幾何折射關(guān)系直接將道路邊界標(biāo)注出來。這種方法的缺點是受噪聲尤其是直線噪聲的影響較大,且算法不穩(wěn)定。

        吉林大學(xué)智能車輛課題組用基于圖像灰度與方差統(tǒng)計的方法識別直線路界,即在得到圖像后進(jìn)行預(yù)處理并在最終的二值圖像中劃分網(wǎng)格,通過計算各網(wǎng)格的統(tǒng)計特性,由馬氏距離區(qū)分道路邊界點與非邊界點,得到邊界點最多的一條直線作為直線道路邊界。此方法能夠準(zhǔn)確的識別道路邊界,但當(dāng)路旁噪聲較大時識別效果不夠理想。同時,基于熵最大化邊緣提取的圖像預(yù)處理過程由于算法復(fù)雜,耗時較長。

        由于彎曲路形模式較為復(fù)雜,情況變化多樣,算法難以統(tǒng)一,并且由于算法的復(fù)雜性,很難滿足準(zhǔn)確性和實時性要求。因此國內(nèi)外對彎曲路徑識別的研究從方法上并不成熟。國外有人用具有某些特征的曲線方程擬合彎曲路界,但由于參數(shù)的增加,計算量增大,因此很難滿足實時性要求。國內(nèi)有人用直線整條或分段近似擬合彎曲路界,在車道邊界曲率不大時能夠基本滿足要求,但當(dāng)曲率較大時識別準(zhǔn)確性不高。因此,可以認(rèn)為對道路邊界尤其是彎曲道路邊界的識別還有待于進(jìn)一步研究。

        由于前方車輛在圖像中的灰度信息特征很不明顯,例如當(dāng)車輛在遠(yuǎn)方與近處時的灰度統(tǒng)計特性、紋理特性、外形特性等完全不同。因此,算法魯棒性是一個非常棘手的問題。很難提出一種滿足各種狀態(tài)的識別算法。一般利用機(jī)器視覺進(jìn)行車輛識別的方法可分為以下三類:

        (1)基于車輛特征的方法。該方法利用圖像中車輛存在的特征(紋理、邊緣、對稱性以及底部陰影等)進(jìn)行分割和識別。這種方法的缺點是,當(dāng)單獨(dú)使用某一種特征時,經(jīng)常會因光照或環(huán)境的變化,導(dǎo)致該特征信息量不足。因此,極易出現(xiàn)錯判或漏判的現(xiàn)象。

        (2)基于模板匹配的方法。這種方法利用大量的預(yù)先做好的車輛模板(基于灰度信息或小波特征) ,與實時采集的圖像進(jìn)行匹配。尋找相關(guān)性最大的匹配區(qū)域作為車輛存在區(qū)域。通常,這種方法魯棒性相對較好,缺點是實時性較差。

        (3)基于學(xué)習(xí)的方法。這種方法的本質(zhì)是利用神經(jīng)網(wǎng)絡(luò),對大量的車輛圖像進(jìn)行訓(xùn)練,然后通過分類器進(jìn)行分類。通常這種方法被用來對已檢測的車輛進(jìn)行驗證。

        吉林大學(xué)智能車輛課題組提出一種基于車輛特征的方法識別和跟蹤前方的車輛。首先,利用車輛底部存在陰影的特征,在圖像中確定可能存在的車輛區(qū)域。然后,通過分形維數(shù)計算該區(qū)域的紋理特征,排除非車輛區(qū)域。這種方法對于強(qiáng)光條件和車輛顏色與路面的顏色特征相似的情況,識別和定位的效果不夠理想。

        三、關(guān)鍵難點與長遠(yuǎn)發(fā)展

        在不考慮硬件設(shè)備的情況下,制約智能車輛視覺系統(tǒng)探測效果的三個關(guān)鍵因素是視覺系統(tǒng)所應(yīng)用算法的實時性、魯棒性和精確性。實時性要求視覺系統(tǒng)數(shù)據(jù)處理必須與車輛的高速行駛同步進(jìn)行;魯棒性要求智能車輛視覺系統(tǒng)在各種復(fù)雜的路面環(huán)境下均具有良好的適應(yīng)性,例如路面有大量樹木與建筑物陰影、變化的氣候條件等;精確性則要求視覺系統(tǒng)在一些復(fù)雜環(huán)境下不能出現(xiàn)過多的錯判率。這三個要求相輔相成,互相制約。要完全達(dá)到上述要求,智能車輛機(jī)器視覺系統(tǒng)還需要很長的發(fā)展歷程。目前有關(guān)智能車輛機(jī)器視覺系統(tǒng)的研究正處于一個高速發(fā)展的階段,由于硬件水平的提高和理論研究工作的深入,在可以預(yù)見的將來將達(dá)到一個更高的水平。

        參考文獻(xiàn):

        [1]王榮本, 游峰, 崔高健, 郭烈. 基于計算機(jī)視覺高速智能車輛的道路識別. 計算機(jī)工程與應(yīng)用,2004,(8):34-39

        [2]顧柏園, 王榮本, 余天洪, 郭烈. 基于視覺的前方車輛探測技術(shù)研究方法綜述. 公路交通科技. 2005,(10):28-33

        第9篇:計算機(jī)視覺感知技術(shù)范文

        以人為中心的交互

        傳統(tǒng)方式下,計算機(jī)通過多種設(shè)定的程序與人交互,需要人去主動適應(yīng)計算機(jī)。在新的交互模式中,計算機(jī)則能根據(jù)人的動作來主動適應(yīng)人的要求,例如通過分析語音來識別人發(fā)出的命令,并通過語音合成來表達(dá)信息。

        如何讓計算機(jī)“看”,屬于計算機(jī)視覺研究的范疇,已開始應(yīng)用于實際的身份認(rèn)證技術(shù),例如虹膜識別、人臉識別等技術(shù),通過采集的圖像來獲得信息并得出結(jié)果。現(xiàn)有的技術(shù)可以通過攝像機(jī)拍攝人的面部表情,然后利用圖像分析和識別技術(shù)進(jìn)行表情識別。能把圖像“看進(jìn)去”早已不是問題,一個小小的攝像頭就能勝任,關(guān)鍵是如何從圖像中獲取所需的信息。要讓計算機(jī)像人一樣的“看”,最根本的問題在于計算機(jī)對圖像的最終分析和理解,盡管圖片中的形狀、顏色、紋理已經(jīng)為計算機(jī)提供了較多的信息,但是要能用先驗知識去思考、識別,就又回到了人工智能這個老問題。

        2002 年倫敦帝國學(xué)院的科研小組花費(fèi)數(shù)年時間來研究人類眼睛活動與大腦感知之間的關(guān)系,最終發(fā)明出一種專門用來捕捉眼球細(xì)微動作的紅外線感應(yīng)裝置,被他們稱為“眼標(biāo)”。它能鑒別眼睛在顯示屏上的移動和注視,如果電腦使用者盯住屏幕上的某個鏈接圖標(biāo)1秒以上,電腦就自動打開該鏈接;如果使用者盯住打印或者存盤的圖標(biāo),電腦就會自動進(jìn)行相應(yīng)的操作(附圖)

        中科院自動化所研制成功的通過臉部動作來控制的智能輪椅,能夠讓使用者利用頭部姿態(tài)控制其轉(zhuǎn)動,即當(dāng)人的頭轉(zhuǎn)向左邊,輪椅左轉(zhuǎn);人的頭轉(zhuǎn)向右邊,輪椅右轉(zhuǎn)。這實際上是適時臉部跟蹤和頭位估計的問題。

        隨著傳感器技術(shù)的發(fā)展,越來越精確的交互方式成為可能,例如用于識別手勢的數(shù)據(jù)手套。它能對較為復(fù)雜的手的動作進(jìn)行檢測,包括手的位置和方向、手指彎曲度,并根據(jù)這些信息對手勢進(jìn)行分類。類似的,SimGraphics于1994年開發(fā)的虛擬演員系統(tǒng),通過用戶戴上的安裝有觸及臉不同部位的傳感器的頭盔,來控制計算機(jī)生成表情圖像。

        人機(jī)交互追求全方位

        雖然語音、表情、姿態(tài)等均能獨(dú)立表示一定的含義,并在某些場合完成交互過程,但人在交互過程中卻總是通過各種信息的同時處理來進(jìn)行的。實現(xiàn)多通道的人機(jī)界面是人與計算機(jī)最為自然的交互方式,它集自然語言、語音、手語、人臉、唇讀、頭勢、體勢等多通道為一體的,并對這些通道信息進(jìn)行編碼、壓縮、集成和融合,集中處理包括圖像、音頻、視頻、文本等多媒體信息。目前,多模態(tài)技術(shù)正在成為智能人機(jī)交互的研究熱點。

        “模糊”理解人的情感

        精確交互技術(shù)能用一種技術(shù)來完全達(dá)到用戶的交互目的,例如鍵盤和鼠標(biāo)器均需用戶精確輸入。而人們的動作或思想往往并不很精確,計算機(jī)應(yīng)該理解人的要求,甚至糾正人的錯誤,智能化的交互界面就是為了實現(xiàn)這樣的目標(biāo)。與此同時,新一代的人機(jī)交互過程能夠處理復(fù)雜的情感信息,這就是所謂的情感計算。

        人的情緒與心境狀態(tài)的變化總是伴隨著某些生理特征或行為特征的起伏,人們表達(dá)情感通過一系列的面部表情、肢體動作和語音來進(jìn)行,又通過視覺、聽覺、觸覺來感知情感的變化。視覺察覺則主要通過面部表情、姿態(tài)來進(jìn)行。語音、音樂則是主要的聽覺途徑。觸覺模型則包括對、沖擊、汗液分泌、心跳等的處理。

        情感計算研究的重點就在于通過各種傳感器獲取由人的情感所引起的生理及行為特征信號,建立“情感模型”,從而創(chuàng)建一個能感知、識別和理解人類情感的能力,并能針對用戶的情感做出智能、靈敏、友好反應(yīng)的個人計算系統(tǒng),縮短人機(jī)之間的距離,營造真正和諧的人機(jī)環(huán)境。目前為止,有關(guān)研究已經(jīng)在人臉表情、姿態(tài)分析、語音的情感識別和表達(dá)方面獲得了一定的進(jìn)展。

        無處不在的計算

        由于新一代高速互聯(lián)網(wǎng)的飛速發(fā)展,網(wǎng)絡(luò)帶寬和CPU 計算能力的成倍增長,以及多媒體技術(shù)的日益成熟,計算機(jī)、通信及多媒體技術(shù)逐步趨向融合。以互聯(lián)網(wǎng)為基礎(chǔ)的信息基礎(chǔ)設(shè)施,將成為人與人之間交互或人與信息源、外部世界交互的媒介。在這種環(huán)境下,計算將無處不在。

        無處不在的計算最早是由已故的Xerox Parc計算機(jī)科學(xué)實驗室主任Mark Weiser 和他的研究小組在20 世紀(jì)90 年代初構(gòu)想并提出的。Mark認(rèn)為,從長遠(yuǎn)看,個人計算機(jī)和工作站會消失,因為計算會變得無處不在,這種消失并不是技術(shù)發(fā)展的直接后果,而是人類心理的作用。當(dāng)人類對某些事物掌握得足夠好的時候,這些事物就會成為生活中不可分割的一部分,人們就會慢慢地忽略其存在。今后,許多計算裝置也會變得就像Don Norman描述的那樣變成了不可見的計算機(jī),計算也會變成無處不在,不可見的人機(jī)交互也會無處不在的。就像我們時刻呼吸著的氧氣一樣,我們看不見卻可以體驗到。

        受到無處不在的計算以及穿戴式計算機(jī)和虛擬現(xiàn)實發(fā)展的影響,MIT Media Lab的H. Lshii等人對早期的GUI(Graspable UserInterface,可抓握用戶界面)理論進(jìn)行了重要發(fā)展,于1997 年提出有形用戶界面的思想。傳統(tǒng)的圖形用戶界面事實上成為隔離物質(zhì)世界和信息世界之間的屏障,而有形用戶界面希望在用戶、比特和原子之間建立一個無縫交互界面。

        信息內(nèi)容的智能處理

        人和計算機(jī)的交互一方面是為了獲得服務(wù),另一方面則需要通過計算機(jī)處理大量的信息。因此,智能人機(jī)交互的另一個重要范疇就是實現(xiàn)信息內(nèi)容的智能處理。

        信息技術(shù)產(chǎn)品逐步進(jìn)入后PC時代,各式各樣的信息家電、網(wǎng)絡(luò)接入終端以及集成計算與通信功能的產(chǎn)品繁多。易用性、善解人意已逐漸變成信息設(shè)備參與市場競爭的關(guān)鍵。甚至一個具有重大創(chuàng)新的知識產(chǎn)權(quán)將帶動一個新產(chǎn)業(yè)。如中文和漢語信息處理,面向信息內(nèi)容的智能化處理技術(shù),包括文字與語音的識別、翻譯、查詢、分類、摘要等。這方面的技術(shù)突破將極大地推動信息服務(wù)業(yè)和計算機(jī)產(chǎn)業(yè)。

        將信息轉(zhuǎn)變?yōu)橹R、將信息基礎(chǔ)設(shè)施發(fā)展為知識基礎(chǔ)設(shè)施是21世紀(jì)的重要技術(shù)發(fā)展方向。其中,軟件技術(shù)將在數(shù)據(jù)發(fā)掘、知識發(fā)現(xiàn)、Internet海量信息的智能化檢索和網(wǎng)上軟件機(jī)器人等方面進(jìn)行重點突破。

        傳統(tǒng)與智能交互并存

        新一代的智能人機(jī)交互,力圖淡化傳統(tǒng)的計算機(jī)數(shù)值計算的概念,突出以人為本的交互過程。那么傳統(tǒng)的以鍵盤、鼠標(biāo)和屏幕為基礎(chǔ)的GUI 交互界面是否馬上就會消失呢?

        美國著名的計算機(jī)圖形學(xué)家A.VanDam 認(rèn)為:“雖然各種三維圖形的應(yīng)用發(fā)展得很快,如虛擬現(xiàn)實、科學(xué)計算可視化等,但GUI、3D Widget等都將長期存在”。這是因為目前大量的應(yīng)用已經(jīng)采用成熟的GUI 技術(shù),因此GUI 不會被淘汰。

        國內(nèi)外研究狀況

        无码人妻一二三区久久免费_亚洲一区二区国产?变态?另类_国产精品一区免视频播放_日韩乱码人妻无码中文视频
      2. <input id="zdukh"></input>
      3. <b id="zdukh"><bdo id="zdukh"></bdo></b>
          <b id="zdukh"><bdo id="zdukh"></bdo></b>
        1. <i id="zdukh"><bdo id="zdukh"></bdo></i>

          <wbr id="zdukh"><table id="zdukh"></table></wbr>

          1. <input id="zdukh"></input>
            <wbr id="zdukh"><ins id="zdukh"></ins></wbr>
            <sub id="zdukh"></sub>
            亚洲性爱免费视频在线 | 视频在线欧美十亚洲曰本 | 在线看片免费人成视频网 | 亚洲欧美日韩中文字幕在线 | 午夜福利网址入囗 | 性高潮久久久久久久久久 |