狠狠综合久久久久综合网浪潮,影音先锋男人av橹橹色,亚州最大网站一区二区三区

· 定義
·要件
·解析
·原理
·相關(guān)
·現(xiàn)狀
·應(yīng)用
·異同
·問題
·系統(tǒng)

計(jì)算機(jī)視覺是一門研究如何使機(jī)器“看”的科學(xué)，更進(jìn)一步的說，就是是指用攝影機(jī)和電腦代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺，并進(jìn)一步做圖形處理，使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。作為一個(gè)科學(xué)學(xué)科，計(jì)算機(jī)視覺研究相關(guān)的理論和技術(shù)，試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取‘信息’的人工智能系統(tǒng)。這里所指的信息指Shannon定義的，可以用來幫助做一個(gè)“決定”的信息。因?yàn)楦兄梢钥醋魇菑母泄傩盘栔刑?取信息，所以計(jì)算機(jī)視覺也可以看作是研究如何使人工系統(tǒng)從圖像或多維數(shù)據(jù)中“感知”的科學(xué)。

定義

　　計(jì)算機(jī)視覺是使用計(jì)算機(jī)及相關(guān)設(shè)備對生物視覺的一種模擬。它的主要任務(wù)就是通過對采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場景的三維信息，就像人類和許多其他類生物每天所做的那樣。

　　計(jì)算機(jī)視覺是一門關(guān)于如何運(yùn)用照相機(jī)和計(jì)算機(jī)來獲取我們所需的，被拍攝對象的數(shù)據(jù)與信息的學(xué)問。形象地說，就是給計(jì)算機(jī)安裝上眼睛（照相機(jī)）和大腦（算法），讓計(jì)算機(jī)能夠感知環(huán)境。我們中國人的成語"眼見為實(shí)"和西方人常說的"One picture is worth ten thousand words"表達(dá)了視覺對人類的重要性。不難想象，具有視覺的機(jī)器的應(yīng)用前景能有多么地寬廣。

　　計(jì)算機(jī)視覺既是工程領(lǐng)域，也是科學(xué)領(lǐng)域中的一個(gè)富有挑戰(zhàn)性重要研究領(lǐng)域。計(jì)算機(jī)視覺是一門綜合性的學(xué)科，它已經(jīng)吸引了來自各個(gè)學(xué)科的研究者參加到對它的研究之中。其中包括計(jì)算機(jī)科學(xué)和工程、信號處理、物理學(xué)、應(yīng)用數(shù)學(xué)和統(tǒng)計(jì)學(xué)，神經(jīng)生理學(xué)和認(rèn)知科學(xué)等。

解析

　　視覺是各個(gè)應(yīng)用領(lǐng)域，如制造業(yè)、檢驗(yàn)、文檔分析、醫(yī)療診斷，和軍事等領(lǐng)域中各種智能/自主系統(tǒng)中不可分割的一部分。由于它的重要性，一些先進(jìn)國家，例如美國把對計(jì)算機(jī)視覺的研究列為對經(jīng)濟(jì)和科學(xué)有廣泛影響的科學(xué)和工程中的重大基本問題，即所謂的重大挑戰(zhàn)（grand challenge）。計(jì)算機(jī)視覺的挑戰(zhàn)是要為計(jì)算機(jī)和機(jī)器人開發(fā)具有與人類水平相當(dāng)?shù)囊曈X能力。機(jī)器視覺需要圖象信號，紋理和顏色建模，幾何處理和推理，以及物體建模。一個(gè)有能力的視覺系統(tǒng)應(yīng)該把所有這些處理都緊密地集成在一起。作為一門學(xué)科，計(jì)算機(jī)視覺開始于60年代初，但在計(jì)算機(jī)視覺的基本研究中的許多重要進(jìn)展是在80年代取得的。計(jì)算機(jī)視覺與人類視覺密切相關(guān)，對人類視覺有一個(gè)正確的認(rèn)識將對計(jì)算機(jī)視覺的研究非常有益。為此我們將先介紹人類視覺。

原理

　　計(jì)算機(jī)視覺就是用各種成象系統(tǒng)代替視覺器官作為輸入敏感手段，由計(jì)算機(jī)來代替大腦完成處理和解釋。計(jì)算機(jī)視覺的最終研究目標(biāo)就是使計(jì)算機(jī)能象人那樣通過視覺觀察和理解世界，具有自主適應(yīng)環(huán)境的能力。要經(jīng)過長期的努力才能達(dá)到的目標(biāo)。因此，在實(shí)現(xiàn)最終目標(biāo)以前，人們努力的中期目標(biāo)是建立一種視覺系統(tǒng)，這個(gè)系統(tǒng)能依據(jù)視覺敏感和反饋的某種程度的智能完成一定的任務(wù)。例如，計(jì)算機(jī)視覺的一個(gè)重要應(yīng)用領(lǐng)域就是自主車輛的視覺導(dǎo)航，還沒有條件實(shí)現(xiàn)象人那樣能識別和理解任何環(huán)境，完成自主導(dǎo)航的系統(tǒng)。因此，人們努力的研究目標(biāo)是實(shí)現(xiàn)在高速公路上具有道路跟蹤能力，可避免與前方車輛碰撞的視覺輔助駕駛系統(tǒng)。這里要指出的一點(diǎn)是在計(jì)算機(jī)視覺系統(tǒng)中計(jì)算機(jī)起代替人腦的作用，但并不意味著計(jì)算機(jī)必須按人類視覺的方法完成視覺信息的處理。計(jì)算機(jī)視覺可以而且應(yīng)該根據(jù)計(jì)算機(jī)系統(tǒng)的特點(diǎn)來進(jìn)行視覺信息的處理。但是，人類視覺系統(tǒng)是迄今為止，人們所知道的功能最強(qiáng)大和完善的視覺系統(tǒng)。如在以下的章節(jié)中會看到的那樣，對人類視覺處理機(jī)制的研究將給計(jì)算機(jī)視覺的研究提供啟發(fā)和指導(dǎo)。因此，用計(jì)算機(jī)信息處理的方法研究人類視覺的機(jī)理，建立人類視覺的計(jì)算理論，也是一個(gè)非常重要和信人感興趣的研究領(lǐng)域。這方面的研究被稱為計(jì)算視覺（Computational Vision）。計(jì)算視覺可被認(rèn)為是計(jì)算機(jī)視覺中的一個(gè)研究領(lǐng)域。

現(xiàn)狀

　　計(jì)算機(jī)視覺領(lǐng)域的突出特點(diǎn)是其多樣性與不完善性。這一領(lǐng)域的先驅(qū)可追溯到更早的時(shí)候，但是直到20世紀(jì)70年代后期，當(dāng)計(jì)算機(jī)的性能提高到足以處理諸如圖像這樣的大規(guī)模數(shù)據(jù)時(shí)，計(jì)算機(jī)視覺才得到了正式的關(guān)注和發(fā)展。然而這些發(fā)展往往起源于其他不同領(lǐng)域的需要，因而何謂“計(jì)算機(jī)視覺問題”始終沒有得到正式定義，很自然地，“計(jì)算機(jī)視覺問題”應(yīng)當(dāng)被如何解決也沒有成型的公式。

　　盡管如此，人們已開始掌握部分解決具體計(jì)算機(jī)視覺任務(wù)的方法，可惜這些方法通常都僅適用于一群狹隘的目標(biāo)（如：臉孔、指紋、文字等），因而無法被廣泛地應(yīng)用于不同場合。

　　對這些方法的應(yīng)用通常作為某些解決復(fù)雜問題的大規(guī)模系統(tǒng)的一個(gè)組成部分（例如醫(yī)學(xué)圖像的處理，工業(yè)制造中的質(zhì)量控制與測量）。在計(jì)算機(jī)視覺的大多數(shù)實(shí)際應(yīng)用當(dāng)中，計(jì)算機(jī)被預(yù)設(shè)為解決特定的任務(wù)，然而基于機(jī)器學(xué)習(xí)的方法正日漸普及，一旦機(jī)器學(xué)習(xí)的研究進(jìn)一步發(fā)展，未來“泛用型”的電腦視覺應(yīng)用或許可以成真。

　　人工智能所研究的一個(gè)主要問題是：如何讓系統(tǒng)具備“計(jì)劃”和“決策能力”？從而使之完成特定的技術(shù)動(dòng)作（例如：移動(dòng)一個(gè)機(jī)器人通過某種特定環(huán)境）。這一問題便與計(jì)算機(jī)視覺問題息息相關(guān)。在這里，計(jì)算機(jī)視覺系統(tǒng)作為一個(gè)感知器，為決策提供信息。另外一些研究方向包括模式識別和機(jī)器學(xué)習(xí)（這也隸屬于人工智能領(lǐng)域，但與計(jì)算機(jī)視覺有著重要聯(lián)系），也由此，計(jì)算機(jī)視覺時(shí)常被看作人工智能與計(jì)算機(jī)科學(xué)的一個(gè)分支。

　　物理是與計(jì)算機(jī)視覺有著重要聯(lián)系的另一領(lǐng)域。

　　計(jì)算機(jī)視覺關(guān)注的目標(biāo)在于充分理解電磁波——主要是可見光與紅外線部分——遇到物體表面被反射所形成的圖像，而這一過程便是基于光學(xué)物理和固態(tài)物理，一些尖端的圖像感知系統(tǒng)甚至?xí)?yīng)用到量子力學(xué)理論，來解析影像所表示的真實(shí)世界。同時(shí)，物理學(xué)中的很多測量難題也可以通過計(jì)算機(jī)視覺得到解決，例如流體運(yùn)動(dòng)。也由此，計(jì)算機(jī)視覺同樣可以被看作是物理學(xué)的拓展。

　　另一個(gè)具有重要意義的領(lǐng)域是神經(jīng)生物學(xué)，尤其是其中生物視覺系統(tǒng)的部分。

　　在整個(gè)20世紀(jì)中，人類對各種動(dòng)物的眼睛、神經(jīng)元、以及與視覺刺激相關(guān)的腦部組織都進(jìn)行了廣泛研究，這些研究得出了一些有關(guān)“天然的”視覺系統(tǒng)如何運(yùn)作的描述（盡管仍略嫌粗略），這也形成了計(jì)算機(jī)視覺中的一個(gè)子領(lǐng)域——人們試圖建立人工系統(tǒng)，使之在不同的復(fù)雜程度上模擬生物的視覺運(yùn)作。同時(shí)計(jì)算機(jī)視覺領(lǐng)域中，一些基于機(jī)器學(xué)習(xí)的方法也有參考部分生物機(jī)制。

　　計(jì)算機(jī)視覺的另一個(gè)相關(guān)領(lǐng)域是信號處理。很多有關(guān)單元變量信號的處理方法，尤其是對時(shí)變信號的處理，都可以很自然的被擴(kuò)展為計(jì)算機(jī)視覺中對二元變量信號或者多元變量信號的處理方法。但由于圖像數(shù)據(jù)的特有屬性，很多計(jì)算機(jī)視覺中發(fā)展起來的方法，在單元信號的處理方法中卻找不到對應(yīng)版本。這類方法的一個(gè)主要特征，便是他們的非線性以及圖像信息的多維性，以上二點(diǎn)作為計(jì)算機(jī)視覺的一部分，在信號處理學(xué)中形成了一個(gè)特殊的研究方向。

　　除了上面提到的領(lǐng)域，很多研究課題同樣可被當(dāng)作純粹的數(shù)學(xué)問題。例如，計(jì)算機(jī)視覺中的很多問題，其理論基礎(chǔ)便是統(tǒng)計(jì)學(xué)，最優(yōu)化理論以及幾何學(xué)。

　　如何使既有方法通過各種軟硬件實(shí)現(xiàn)，或說如何對這些方法加以修改，而使之獲得合理的執(zhí)行速度而又不損失足夠精度，是現(xiàn)今電腦視覺領(lǐng)域的主要課題。

應(yīng)用

　　人類正在進(jìn)入信息時(shí)代，計(jì)算機(jī)將越來越廣泛地進(jìn)入幾乎所有領(lǐng)域。一方面是更多未經(jīng)計(jì)算機(jī)專業(yè)訓(xùn)練的人也需要應(yīng)用計(jì)算機(jī)，而另一方面是計(jì)算機(jī)的功能越來越強(qiáng)，使用方法越來越復(fù)雜。這就使人在進(jìn)行交談和通訊時(shí)的靈活性與在使用計(jì)算機(jī)時(shí)所要求的嚴(yán)格和死板之間產(chǎn)生了尖銳的矛盾。人可通過視覺和聽覺，語言與外界交換信息，并且可用不同的方式表示相同的含義，而計(jì)算機(jī)卻要求嚴(yán)格按照各種程序語言來編寫程序，只有這樣計(jì)算機(jī)才能運(yùn)行。為使更多的人能使用復(fù)雜的計(jì)算機(jī)，必須改變過去的那種讓人來適應(yīng)計(jì)算機(jī)，來死記硬背計(jì)算機(jī)的使用規(guī)則的情況。而是反過來讓計(jì)算機(jī)來適應(yīng)人的習(xí)慣和要求，以人所習(xí)慣的方式與人進(jìn)行信息交換，也就是讓計(jì)算機(jī)具有視覺、聽覺和說話等能力。這時(shí)計(jì)算機(jī)必須具有邏輯推理和決策的能力。具有上述能力的計(jì)算機(jī)就是智能計(jì)算機(jī)。

　　智能計(jì)算機(jī)不但使計(jì)算機(jī)更便于為人們所使用，同時(shí)如果用這樣的計(jì)算機(jī)來控制各種自動(dòng)化裝置特別是智能機(jī)器人，就可以使這些自動(dòng)化系統(tǒng)和智能機(jī)器人具有適應(yīng)環(huán)境，和自主作出決策的能力。這就可以在各種場合取代人的繁重工作，或代替人到各種危險(xiǎn)和惡劣環(huán)境中完成任務(wù)。

　　應(yīng)用范圍從任務(wù)，比如工業(yè)機(jī)器視覺系統(tǒng)，比方說，檢查瓶子上的生產(chǎn)線加速通過，研究為人工智能和計(jì)算機(jī)或機(jī)器人，可以理解他們周圍的世界。計(jì)算機(jī)視覺和機(jī)器視覺領(lǐng)域有顯著的重疊。計(jì)算機(jī)視覺涉及的被用于許多領(lǐng)域自動(dòng)化圖像分析的核心技術(shù)。機(jī)器視覺通常指的是結(jié)合自動(dòng)圖像分析與其他方法和技術(shù)，以提供自動(dòng)檢測和機(jī)器人指導(dǎo)在工業(yè)應(yīng)用中的一個(gè)過程。在許多計(jì)算機(jī)視覺應(yīng)用中，計(jì)算機(jī)被預(yù)編程，以解決特定的任務(wù)，但基于學(xué)習(xí)的方法現(xiàn)在正變得越來越普遍。計(jì)算機(jī)視覺應(yīng)用的實(shí)例包括用于系統(tǒng)：

　?。?）控制過程，比如，一個(gè)工業(yè)機(jī)器人；

　　（2）導(dǎo)航，例如，通過自主汽車或移動(dòng)機(jī)器人；

　?。?）檢測的事件，如，對視頻監(jiān)控和人數(shù)統(tǒng)計(jì) ；

　?。?）組織信息，例如，對于圖像和圖像序列的索引數(shù)據(jù)庫；

　　（5）造型對象或環(huán)境，如，醫(yī)學(xué)圖像分析系統(tǒng)或地形模型；

　?。?）相互作用，例如，當(dāng)輸入到一個(gè)裝置，用于計(jì)算機(jī)人的交互；

　　（7）自動(dòng)檢測，例如，在制造業(yè)的應(yīng)用程序。

　　其中最突出的應(yīng)用領(lǐng)域是醫(yī)療計(jì)算機(jī)視覺和醫(yī)學(xué)圖像處理。這個(gè)區(qū)域的特征的信息從圖像數(shù)據(jù)中提取用于使患者的醫(yī)療診斷的目的。通常，圖像數(shù)據(jù)是在形式顯微鏡圖像，X射線圖像，血管造影圖像，超聲圖像和斷層圖像。的信息，可以從這樣的圖像數(shù)據(jù)中提取的一個(gè)例子是檢測的腫瘤，動(dòng)脈粥樣硬化或其他惡性變化。它也可以是器官的尺寸，血流量等。這種應(yīng)用領(lǐng)域還支持通過提供新的信息，醫(yī)學(xué)研究的測量例如，對腦的結(jié)構(gòu)，或約醫(yī)學(xué)治療的質(zhì)量。計(jì)算機(jī)視覺在醫(yī)療領(lǐng)域的應(yīng)用還包括增強(qiáng)是由人類的解釋，例如超聲圖像或X射線圖像，以降低噪聲的影響的圖像。

　　第二個(gè)應(yīng)用程序區(qū)域中的計(jì)算機(jī)視覺是在工業(yè)，有時(shí)也被稱為機(jī)器視覺，在那里信息被提取為支撐的制造工序的目的。一個(gè)例子是質(zhì)量控制，其中的信息或最終產(chǎn)品被以找到缺陷自動(dòng)檢測。另一個(gè)例子是，被拾取的位置和細(xì)節(jié)取向測量由機(jī)器人臂。機(jī)器視覺也被大量用于農(nóng)業(yè)的過程，從散裝材料，這個(gè)過程被稱為去除不想要的東西，食物的光學(xué)分揀。

　　軍事上的應(yīng)用很可能是計(jì)算機(jī)視覺最大的地區(qū)之一。最明顯的例子是探測敵方士兵或車輛和導(dǎo)彈制導(dǎo)。更先進(jìn)的系統(tǒng)為導(dǎo)彈制導(dǎo)發(fā)送導(dǎo)彈的區(qū)域，而不是一個(gè)特定的目標(biāo)，并且當(dāng)導(dǎo)彈到達(dá)基于本地獲取的圖像數(shù)據(jù)的區(qū)域的目標(biāo)做出選擇。現(xiàn)代軍事概念，如“戰(zhàn)場感知”，意味著各種傳感器，包括圖像傳感器，提供了豐富的有關(guān)作戰(zhàn)的場景，可用于支持戰(zhàn)略決策的信息。在這種情況下，數(shù)據(jù)的自動(dòng)處理，用于減少復(fù)雜性和融合來自多個(gè)傳感器的信息，以提高可靠性。

　　一個(gè)較新的應(yīng)用領(lǐng)域是自主車，其中包括潛水，陸上車輛（帶輪子，轎車或卡車的小機(jī)器人），高空作業(yè)車和無人機(jī)（UAV）。自主化水平，從完全獨(dú)立的（無人）的車輛范圍為汽車，其中基于計(jì)算機(jī)視覺的系統(tǒng)支持驅(qū)動(dòng)程序或在不同情況下的試驗(yàn)。完全自主的汽車通常使用計(jì)算機(jī)視覺進(jìn)行導(dǎo)航時(shí)，即知道它在哪里，或用于生產(chǎn)的環(huán)境（地圖SLAM）和用于檢測障礙物。它也可以被用于檢測特定任務(wù)的特定事件，例如，一個(gè)UAV尋找森林火災(zāi)。支承系統(tǒng)的例子是障礙物警報(bào)系統(tǒng)中的汽車，以及用于飛行器的自主著陸系統(tǒng)。數(shù)家汽車制造商已經(jīng)證明了系統(tǒng)的汽車自動(dòng)駕駛，但該技術(shù)還沒有達(dá)到一定的水平，就可以投放市場。有軍事自主車型，從先進(jìn)的導(dǎo)彈，無人機(jī)的偵察任務(wù)或?qū)椀闹茖?dǎo)充足的例子。太空探索已經(jīng)正在使用計(jì)算機(jī)視覺，自主車比如，美國宇航局的火星探測漫游者和歐洲航天局的ExoMars火星漫游者。

　　其他應(yīng)用領(lǐng)域包括：

　　（1）支持視覺特效制作的電影和廣播，例如，攝像頭跟蹤（運(yùn)動(dòng)匹配）。

　?。?）監(jiān)視。

異同

　　計(jì)算機(jī)視覺，圖象處理，圖像分析，機(jī)器人視覺和機(jī)器視覺是彼此緊密關(guān)聯(lián)的學(xué)科。如果你翻開帶有上面這些名字的教材，你會發(fā)現(xiàn)在技術(shù)和應(yīng)用領(lǐng)域上他們都有著相當(dāng)大部分的重疊。這表明這些學(xué)科的基礎(chǔ)理論大致是相同的，甚至讓人懷疑他們是同一學(xué)科被冠以不同的名稱。

　　然而，各研究機(jī)構(gòu)，學(xué)術(shù)期刊，會議及公司往往把自己特別的歸為其中某一個(gè)領(lǐng)域，于是各種各樣的用來區(qū)分這些學(xué)科的特征便被提了出來。下面將給出一種區(qū)分方法，盡管并不能說這一區(qū)分方法完全準(zhǔn)確。

　　計(jì)算機(jī)視覺的研究對象主要是映射到單幅或多幅圖像上的三維場景，例如三維場景的重建。計(jì)算機(jī)視覺的研究很大程度上針對圖像的內(nèi)容。

　　圖象處理與圖像分析的研究對象主要是二維圖像，實(shí)現(xiàn)圖像的轉(zhuǎn)化，尤其針對像素級的操作，例如提高圖像對比度，邊緣提取，去噪聲和幾何變換如圖像旋轉(zhuǎn)。這一特征表明無論是圖像處理還是圖像分析其研究內(nèi)容都和圖像的具體內(nèi)容無關(guān)。

　　機(jī)器視覺主要是指工業(yè)領(lǐng)域的視覺研究，例如自主機(jī)器人的視覺，用于檢測和測量的視覺。這表明在這一領(lǐng)域通過軟件硬件，圖像感知與控制理論往往與圖像處理得到緊密結(jié)合來實(shí)現(xiàn)高效的機(jī)器人控制或各種實(shí)時(shí)操作。

　　模式識別使用各種方法從信號中提取信息，主要運(yùn)用統(tǒng)計(jì)學(xué)的理論。此領(lǐng)域的一個(gè)主要方向便是從圖像數(shù)據(jù)中提取信息。

　　還有一個(gè)領(lǐng)域被稱為成像技術(shù)。這一領(lǐng)域最初的研究內(nèi)容主要是制作圖像，但有時(shí)也涉及到圖像分析和處理。例如，醫(yī)學(xué)成像就包含大量的醫(yī)學(xué)領(lǐng)域的圖像分析。

　　對于所有這些領(lǐng)域，一個(gè)可能的過程是你在計(jì)算機(jī)視覺的實(shí)驗(yàn)室工作，工作中從事著圖象處理，最終解決了機(jī)器視覺領(lǐng)域的問題，然后把自己的成果發(fā)表在了模式識別的會議上。

問題

　　幾乎在每個(gè)計(jì)算機(jī)視覺技術(shù)的具體應(yīng)用都要解決一系列相同的問題。這些經(jīng)典的問題包括：

　　識別

　　一個(gè)計(jì)算機(jī)視覺，圖像處理和機(jī)器視覺所共有的經(jīng)典問題便是判定一組圖像數(shù)據(jù)中是否包含某個(gè)特定的物體，圖像特征或運(yùn)動(dòng)狀態(tài)。這一問題通?？梢酝ㄟ^機(jī)器自動(dòng)解決，但是到目前為止，還沒有某個(gè)單一的方法能夠廣泛的對各種情況進(jìn)行判定：在任意環(huán)境中識別任意物體。現(xiàn)有技術(shù)能夠也只能夠很好地解決特定目標(biāo)的識別，比如簡單幾何圖形識別，人臉識別，印刷或手寫文件識別或者車輛識別。而且這些識別需要在特定的環(huán)境中，具有指定的光照，背景和目標(biāo)姿態(tài)要求。

　　廣義的識別在不同的場合又演化成了幾個(gè)略有差異的概念：

　　識別（狹義的）：對一個(gè)或多個(gè)經(jīng)過預(yù)先定義或?qū)W習(xí)的物體或物類進(jìn)行辨識，通常在辨識過程中還要提供他們的二維位置或三維姿態(tài)。

　　鑒別：識別辨認(rèn)單一物體本身。例如：某一人臉的識別，某一指紋的識別。

　　監(jiān)測：從圖像中發(fā)現(xiàn)特定的情況內(nèi)容。例如：醫(yī)學(xué)中對細(xì)胞或組織不正常技能的發(fā)現(xiàn)，交通監(jiān)視儀器對過往車輛的發(fā)現(xiàn)。監(jiān)測往往是通過簡單的圖象處理發(fā)現(xiàn)圖像中的特殊區(qū)域，為后繼更復(fù)雜的操作提供起點(diǎn)。

　　識別的幾個(gè)具體應(yīng)用方向：

　　基于內(nèi)容的圖像提?。涸诰薮蟮膱D像集合中尋找包含指定內(nèi)容的所有圖片。被指定的內(nèi)容可以是多種形式，比如一個(gè)紅色的大致是圓形的圖案，或者一輛自行車。在這里對后一種內(nèi)容的尋找顯然要比前一種更復(fù)雜，因?yàn)榍耙环N描述的是一個(gè)低級直觀的視覺特征，而后者則涉及一個(gè)抽象概念（也可以說是高級的視覺特征），即‘自行車’，顯然的一點(diǎn)就是自行車的外觀并不是固定的。

　　姿態(tài)評估：對某一物體相對于攝像機(jī)的位置或者方向的評估。例如：對機(jī)器臂姿態(tài)和位置的評估。

　　光學(xué)字符識別對圖像中的印刷或手寫文字進(jìn)行識別鑒別，通常的輸出是將之轉(zhuǎn)化成易于編輯的文檔形式。

　　運(yùn)動(dòng)

　　基于序列圖像的對物體運(yùn)動(dòng)的監(jiān)測包含多種類型，諸如：

　　自體運(yùn)動(dòng)：監(jiān)測攝像機(jī)的三維剛性運(yùn)動(dòng)。

　　圖像跟蹤：跟蹤運(yùn)動(dòng)的物體。

　　場景重建

　　給定一個(gè)場景的二或多幅圖像或者一段錄像，場景重建尋求為該場景建立一個(gè)計(jì)算機(jī)模型/三維模型。最簡單的情況便是生成一組三維空間中的點(diǎn)。更復(fù)雜的情況下會建立起完整的三維表面模型。

　　圖像恢復(fù)

　　圖像恢復(fù)的目標(biāo)在于移除圖像中的噪聲，例如儀器噪聲，模糊等。

系統(tǒng)

　　計(jì)算機(jī)視覺系統(tǒng)的結(jié)構(gòu)形式很大程度上依賴于其具體應(yīng)用方向。有些是獨(dú)立工作的，用于解決具體的測量或檢測問題；也有些作為某個(gè)大型復(fù)雜系統(tǒng)的組成部分出現(xiàn)，比如和機(jī)械控制系統(tǒng)，數(shù)據(jù)庫系統(tǒng)，人機(jī)接口設(shè)備協(xié)同工作。計(jì)算機(jī)視覺系統(tǒng)的具體實(shí)現(xiàn)方法同時(shí)也由其功能決定——是預(yù)先固定的抑或是在運(yùn)行過程中自動(dòng)學(xué)習(xí)調(diào)整。盡管如此，有些功能卻幾乎是每個(gè)計(jì)算機(jī)系統(tǒng)都需要具備的：

　　圖像獲取

　　一幅數(shù)字圖像是由一個(gè)或多個(gè)圖像感知器產(chǎn)生，這里的感知器可以是各種光敏攝像機(jī)，包括遙感設(shè)備，X射線斷層攝影儀，雷達(dá)，超聲波接收器等。取決于不同的感知器，產(chǎn)生的圖片可以是普通的二維圖像，三維圖組或者一個(gè)圖像序列。圖片的像素值往往對應(yīng)于光在一個(gè)或多個(gè)光譜段上的強(qiáng)度（灰度圖或彩色圖），但也可以是相關(guān)的各種物理數(shù)據(jù)，如聲波，電磁波或核磁共振的深度，吸收度或反射度。

　　預(yù)處理

　　在對圖像實(shí)施具體的計(jì)算機(jī)視覺方法來提取某種特定的信息前，一種或一些預(yù)處理往往被采用來使圖像滿足后繼方法的要求。例如：

　　二次取樣保證圖像坐標(biāo)的正確；

　　平滑去噪來濾除感知器引入的設(shè)備噪聲；

　　提高對比度來保證實(shí)現(xiàn)相關(guān)信息可以被檢測到；

　　調(diào)整尺度空間使圖像結(jié)構(gòu)適合局部應(yīng)用。

　　特征提取

　　從圖像中提取各種復(fù)雜度的特征。例如：

　　線，邊緣提取；

　　局部化的特征點(diǎn)檢測如邊角檢測，斑點(diǎn)檢測；

更復(fù)雜的特征可能與圖像中的紋理形狀或運(yùn)動(dòng)有關(guān)。

　　檢測分割

　　在圖像處理過程中，有時(shí)會需要對圖像進(jìn)行分割來提取有價(jià)值的用于后繼處理的部分，例如

　　篩選特征點(diǎn)；

　　分割一或多幅圖片中含有特定目標(biāo)的部分。

　　高級處理

　　到了這一步，數(shù)據(jù)往往具有很小的數(shù)量，例如圖像中經(jīng)先前處理被認(rèn)為含有目標(biāo)物體的部分。這時(shí)的處理包括：

　　驗(yàn)證得到的數(shù)據(jù)是否符合前提要求；

　　估測特定系數(shù)，比如目標(biāo)的姿態(tài)，體積；

　　對目標(biāo)進(jìn)行分類。

　　高級處理有理解圖像內(nèi)容的含義，是計(jì)算機(jī)視覺中的高階處理，主要是在圖像分割的基礎(chǔ)上再經(jīng)行對分割出的圖像塊進(jìn)行理解，例如進(jìn)行識別等操作。

要件

　　光源布局影響大需審慎考量。

　　正確的選擇鏡組，考量倍率、空間、尺寸、失真… 。

　　選擇合適的攝影機(jī)(CCD)，考量功能、規(guī)格、穩(wěn)定性、耐用...。

　　視覺軟件開發(fā)需靠經(jīng)驗(yàn)累積，多嘗試、思考問題的解決途徑。

　　以創(chuàng)造精度的不斷提升，縮短處理時(shí)間為最終目標(biāo)。

內(nèi)容來自百科網(wǎng)

計(jì)算機(jī)視覺 又名：ComputerVision

定義

解析

原理

相關(guān)

現(xiàn)狀

應(yīng)用

異同

問題

系統(tǒng)

要件

計(jì)算機(jī)視覺又名：ComputerVision