研究意義
學習是人類具有的一種重要智能行為,但究竟什么是學習,長期以來卻眾說紛紜。社會學家、邏輯學家和心理學家都各有其不同的看法。
比如,Langley(1996) 定義的機器學習是“機器學習是一門人工智能的科學,該領(lǐng)域的主要研究對象是人工智能,特別是如何在經(jīng)驗學習中改善具體算法的性能”。(Machine learning is a science of the artificial. The field's main objects of study are artifacts, specifically algorithms that improve their performance with experience.')
Tom Mitchell的機器學習(1997)對信息論中的一些概念有詳細的解釋,其中定義機器學習時提到,“機器學習是對能通過經(jīng)驗自動改進的計算機算法的研究”。(Machine Learning is the study of computer algorithms that improve automatically through experience.)
Alpaydin(2004)同時提出自己對機器學習的定義,“機器學習是用數(shù)據(jù)或以往的經(jīng)驗,以此優(yōu)化計算機程序的性能標準。”(Machine learning is programming computers to optimize a performance criterion using example data or past experience.)
盡管如此,為了便于進行討論和估計學科的進展,有必要對機器學習給出定義,即使這種定義是不完全的和不充分的。顧名思義, 機器學習是研究如何使用機器來模擬人類學習活動的一門學科。稍為嚴格的提法是:機器學習是一門研究機器獲取新知識和新技能,并識別現(xiàn)有知識的學問。這里所說的“機器”,指的就是計算機,電子計算機,中子計算機、光子計算機或神經(jīng)計算機等等。
機器能否象人類一樣能具有學習能力呢?1959年美國的塞繆爾(Samuel)設(shè)計了一個下棋程序,這個程序具有學習能力,它可以在不斷的對弈中改善自己的棋藝。4年后,這個程序戰(zhàn)勝了設(shè)計者本人。又過了3年,這個程序戰(zhàn)勝了美國一個保持8年之久的常勝不敗的冠軍。這個程序向人們展示了機器學習的能力,提出了許多令人深思的社會問題與哲學問題。
機器的能力是否能超過人的,很多持否定意見的人的一個主要論據(jù)是:機器是人造的,其性能和動作完全是由設(shè)計者規(guī)定的,因此無論如何其能力也不會超過設(shè)計者本人。這種意見對不具備學習能力的機器來說的確是對的,可是對具備學習能力的機器就值得考慮了,因為這種機器的能力在應用中不斷地提高,過一段時間之后,設(shè)計者本人也不知它的能力到了何種水平。
機器學習有下面幾種定義: “機器學習是一門人工智能的科學,該領(lǐng)域的主要研究對象是人工智能,特別是如何在經(jīng)驗學習中改善具體算法的性能”。 “機器學習是對能通過經(jīng)驗自動改進的計算機算法的研究”。 “機器學習是用數(shù)據(jù)或以往的經(jīng)驗,以此優(yōu)化計算機程序的性能標準。” 一種經(jīng)常引用的英文定義是:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
機器學習已經(jīng)有了十分廣泛的應用,例如:數(shù)據(jù)挖掘、計算機視覺、自然語言處理、生物特征識別、搜索引擎、醫(yī)學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰(zhàn)略游戲和機器人運用。
發(fā)展史
機器學習是人工智能研究較為年輕的分支,它的發(fā)展過程大體上可分為4個時期。
第一階段是在20世紀50年代中葉到60年代中葉,屬于熱烈時期。
第二階段是在20世紀60年代中葉至70年代中葉,被稱為機器學習的冷靜時期。
第三階段是從20世紀70年代中葉至80年代中葉,稱為復興時期。
機器學習的最新階段始于1986年。
機器學習進入新階段的重要表現(xiàn)在下列諸方面:
(1) 機器學習已成為新的邊緣學科并在高校形成一門課程。它綜合應用心理學、生物學和神經(jīng)生理學以及數(shù)學、自動化和計算機科學形成機器學習理論基礎(chǔ)。
(2) 結(jié)合各種學習方法,取長補短的多種形式的集成學習系統(tǒng)研究正在興起。特別是連接學習符號學習的耦合可以更好地解決連續(xù)性信號處理中知識與技能的獲取與求精問題而受到重視。
(3) 機器學習與人工智能各種基礎(chǔ)問題的統(tǒng)一性觀點正在形成。例如學習與問題求解結(jié)合進行、知識表達便于學習的觀點產(chǎn)生了通用智能系統(tǒng)SOAR的組塊學習。類比學習與問題求解結(jié)合的基于案例方法已成為經(jīng)驗學習的重要方向。
(4) 各種學習方法的應用范圍不斷擴大,一部分已形成商品。歸納學習的知識獲取工具已在診斷分類型專家系統(tǒng)中廣泛使用。連接學習在聲圖文識別中占優(yōu)勢。分析學習已用于設(shè)計綜合型專家系統(tǒng)。遺傳算法與強化學習在工程控制中有較好的應用前景。與符號系統(tǒng)耦合的神經(jīng)網(wǎng)絡(luò)連接學習將在企業(yè)的智能管理與智能機器人運動規(guī)劃中發(fā)揮作用。
(5) 與機器學習有關(guān)的學術(shù)活動空前活躍。國際上除每年一次的機器學習研討會外,還有計算機學習理論會議以及遺傳算法會議。
主要策略
學習是一項復雜的智能活動,學習過程與推理過程是緊密相連的,按照學習中使用推理的多少,機器學習所采用的策略大體上可分為4種——機械學習、通過傳授學習、類比學習和通過事例學習。學習中所用的推理越多,系統(tǒng)的能力越強。
基本結(jié)構(gòu)
表示學習系統(tǒng)的基本結(jié)構(gòu)。環(huán)境向系統(tǒng)的學習部分提供某些信息,學習部分利用這些信息修改知識庫,以增進系統(tǒng)執(zhí)行部分完成任務(wù)的效能,執(zhí)行部分根據(jù)知識庫完成任務(wù),同時把獲得的信息反饋給學習部分。在具體的應用中,環(huán)境,知識庫和執(zhí)行部分決定了具體的工作內(nèi)容,學習部分所需要解決的問題完全由上述3部分確定。下面我們分別敘述這3部分對設(shè)計學習系統(tǒng)的影響。
影響學習系統(tǒng)設(shè)計的最重要的因素是環(huán)境向系統(tǒng)提供的信息?;蛘吒唧w地說是信息的質(zhì)量。知識庫里存放的是指導執(zhí)行部分動作的一般原則,但環(huán)境向?qū)W習系統(tǒng)提供的信息卻是各種各樣的。如果信息的質(zhì)量比較高,與一般原則的差別比較小,則學習部分比較容易處理。如果向?qū)W習系統(tǒng)提供的是雜亂無章的指導執(zhí)行具體動作的具體信息,則學習系統(tǒng)需要在獲得足夠數(shù)據(jù)之后,刪除不必要的細節(jié),進行總結(jié)推廣,形成指導動作的一般原則,放入知識庫,這樣學習部分的任務(wù)就比較繁重,設(shè)計起來也較為困難。
因為學習系統(tǒng)獲得的信息往往是不完全的,所以學習系統(tǒng)所進行的推理并不完全是可靠的,它總結(jié)出來的規(guī)則可能正確,也可能不正確。這要通過執(zhí)行效果加以檢驗。正確的規(guī)則能使系統(tǒng)的效能提高,應予保留;不正確的規(guī)則應予修改或從數(shù)據(jù)庫中刪除。
知識庫是影響學習系統(tǒng)設(shè)計的第二個因素。知識的表示有多種形式,比如特征向量、一階邏輯語句、產(chǎn)生式規(guī)則、語義網(wǎng)絡(luò)和框架等等。這些表示方式各有其特點,在選擇表示方式時要兼顧以下4個方面:
(1)表達能力強。
(2)易于推理。
(3)容易修改知識庫。
(4)知識表示易于擴展。
對于知識庫最后需要說明的一個問題是學習系統(tǒng)不能在全然沒有任何知識的情況下憑空獲取知識,每一個學習系統(tǒng)都要求具有某些知識理解環(huán)境提供的信息,分析比較,做出假設(shè),檢驗并修改這些假設(shè)。因此,更確切地說,學習系統(tǒng)是對現(xiàn)有知識的擴展和改進。
執(zhí)行部分是整個學習系統(tǒng)的核心,因為執(zhí)行部分的動作就是學習部分力求改進的動作。同執(zhí)行部分有關(guān)的問題有3個:復雜性、反饋和透明性。
分類
基于學習策略的分類
學習策略是指學習過程中系統(tǒng)所采用的推理策略。一個學習系統(tǒng)總是由學習和環(huán)境兩部分組成。由環(huán)境(如書本或教師)提供信息,學習部分則實現(xiàn)信息轉(zhuǎn)換,用能夠理解的形式記憶下來,并從中獲取有用的信息。在學習過程中,學生(學習部分)使用的推理越少,他對教師(環(huán)境)的依賴就越大,教師的負擔也就越重。學習策略的分類標準就是根據(jù)學生實現(xiàn)信息轉(zhuǎn)換所需的推理多少和難易程度來分類的,依從簡單到復雜,從少到多的次序分為以下六種基本類型:
1)機械學習 (Rote learning)
學習者無需任何推理或其它的知識轉(zhuǎn)換,直接吸取環(huán)境所提供的信息。如塞繆爾的跳棋程序,紐厄爾和西蒙的LT系統(tǒng)。這類學習系統(tǒng)主要考慮的是如何索引存貯的知識并加以利用。系統(tǒng)的學習方法是直接通過事先編好、構(gòu)造好的程序來學習,學習者不作任何工作,或者是通過直接接收既定的事實和數(shù)據(jù)進行學習,對輸入信息不作任何的推理。
2)示教學習 (Learning from instruction或Learning by being told)
學生從環(huán)境(教師或其它信息源如教科書等)獲取信息,把知識轉(zhuǎn)換成內(nèi)部可使用的表示形式,并將新的知識和原有知識有機地結(jié)合為一體。所以要求學生有一定程度的推理能力,但環(huán)境仍要做大量的工作。教師以某種形式提出和組織知識,以使學生擁有的知識可以不斷地增加。這種學習方法和人類社會的學校教學方式相似,學習的任務(wù)就是建立一個系統(tǒng),使它能接受教導和建議,并有效地存貯和應用學到的知識。不少專家系統(tǒng)在建立知識庫時使用這種方法去實現(xiàn)知識獲取。示教學習的一個典型應用例是FOO程序。
3)演繹學習 (Learning by deduction)
學生所用的推理形式為演繹推理。推理從公理出發(fā),經(jīng)過邏輯變換推導出結(jié)論。這種推理是"保真"變換和特化(specialization)的過程,使學生在推理過程中可以獲取有用的知識。這種學習方法包含宏操作(macro-operation)學習、知識編輯和組塊(Chunking)技術(shù)。演繹推理的逆過程是歸納推理。
4)類比學習 (Learning by analogy)
利用二個不同領(lǐng)域(源域、目標域)中的知識相似性,可以通過類比,從源域的知識(包括相似的特征和其它性質(zhì))推導出目標域的相應知識,從而實現(xiàn)學習。類比學習系統(tǒng)可以使一個已有的計算機應用系統(tǒng)轉(zhuǎn)變?yōu)檫m應于新的領(lǐng)域,來完成原先沒有設(shè)計的相類似的功能。
類比學習需要比上述三種學習方式更多的推理。它一般要求先從知識源(源域)中檢索出可用的知識,再將其轉(zhuǎn)換成新的形式,用到新的狀況(目標域)中去。類比學習在人類科學技術(shù)發(fā)展史上起著重要作用,許多科學發(fā)現(xiàn)就是通過類比得到的。例如著名的盧瑟福類比就是通過將原子結(jié)構(gòu)(目標域)同太陽系(源域)作類比,揭示了原子結(jié)構(gòu)的奧秘。
5)基于解釋的學習 (Explanation-based learning, EBL)
學生根據(jù)教師提供的目標概念、該概念的一個例子、領(lǐng)域理論及可操作準則,首先構(gòu)造一個解釋來說明為什該例子滿足目標概念,然后將解釋推廣為目標概念的一個滿足可操作準則的充分條件。EBL已被廣泛應用于知識庫求精和改善系統(tǒng)的性能。
著名的EBL系統(tǒng)有迪喬恩(G.DeJong)的GENESIS,米切爾(T.Mitchell)的LEXII和LEAP, 以及明頓(S.Minton)等的PRODIGY。
6)歸納學習 (Learning from induction)
歸納學習是由教師或環(huán)境提供某概念的一些實例或反例,讓學生通過歸納推理得出該概念的一般描述。這種學習的推理工作量遠多于示教學習和演繹學習,因為環(huán)境并不提供一般性概念描述(如公理)。從某種程度上說,歸納學習的推理量也比類比學習大,因為沒有一個類似的概念可以作為"源概念"加以取用。歸納學習是最基本的,發(fā)展也較為成熟的學習方法,在人工智能領(lǐng)域中已經(jīng)得到廣泛的研究和應用。
基于所獲取知識的表示形式分類
學習系統(tǒng)獲取的知識可能有:行為規(guī)則、物理對象的描述、問題求解策略、各種分類及其它用于任務(wù)實現(xiàn)的知識類型。
對于學習中獲取的知識,主要有以下一些表示形式:
1)代數(shù)表達式參數(shù)
學習的目標是調(diào)節(jié)一個固定函數(shù)形式的代數(shù)表達式參數(shù)或系數(shù)來達到一個理想的性能。
2)決策樹
用決策樹來劃分物體的類屬,樹中每一內(nèi)部節(jié)點對應一個物體屬性,而每一邊對應于這些屬性的可選值,樹的葉節(jié)點則對應于物體的每個基本分類。
3)形式文法
在識別一個特定語言的學習中,通過對該語言的一系列表達式進行歸納,形成該語言的形式文法。
4)產(chǎn)生式規(guī)則
產(chǎn)生式規(guī)則表示為條件—動作對,已被極為廣泛地使用。學習系統(tǒng)中的學習行為主要是:生成、泛化、特化(Specialization)或合成產(chǎn)生式規(guī)則。
5)形式邏輯表達式
形式邏輯表達式的基本成分是命題、謂詞、變量、約束變量范圍的語句,及嵌入的邏輯表達式。
6)圖和網(wǎng)絡(luò)
有的系統(tǒng)采用圖匹配和圖轉(zhuǎn)換方案來有效地比較和索引知識。
7)框架和模式(schema)
每個框架包含一組槽,用于描述事物(概念和個體)的各個方面。
8)計算機程序和其它的過程編碼
獲取這種形式的知識,目的在于取得一種能實現(xiàn)特定過程的能力,而不是為了推斷該過程的內(nèi)部結(jié)構(gòu)。
9)神經(jīng)網(wǎng)絡(luò)
這主要用在聯(lián)接學習中。學習所獲取的知識,最后歸納為一個神經(jīng)網(wǎng)絡(luò)。
10)多種表示形式的組合
有時一個學習系統(tǒng)中獲取的知識需要綜合應用上述幾種知識表示形式。
根據(jù)表示的精細程度,可將知識表示形式分為兩大類:泛化程度高的粗粒度符號表示、??泛化程度低的精粒度亞符號(sub-symbolic)表示。像決策樹、形式文法、產(chǎn)生式規(guī)則、形式邏輯表達式、框架和模式等屬于符號表示類;而代數(shù)表達式參數(shù)、圖和網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)等則屬亞符號表示類。
按應用領(lǐng)域分類
最主要的應用領(lǐng)域有:專家系統(tǒng)、認知模擬、規(guī)劃和問題求解、數(shù)據(jù)挖掘、網(wǎng)絡(luò)信息服務(wù)、圖象識別、故障診斷、自然語言理解、機器人和博弈等領(lǐng)域。
從機器學習的執(zhí)行部分所反映的任務(wù)類型上看,大部分的應用研究領(lǐng)域基本上集中于以下兩個范疇:分類和問題求解。
?。?)分類任務(wù)要求系統(tǒng)依據(jù)已知的分類知識對輸入的未知模式(該模式的描述)作分析,以確定輸入模式的類屬。相應的學習目標就是學習用于分類的準則(如分類規(guī)則)。
(2)問題求解任務(wù)要求對于給定的目標狀態(tài),??尋找一個將當前狀態(tài)轉(zhuǎn)換為目標狀態(tài)的動作序列;機器學習在這一領(lǐng)域的研究工作大部分集中于通過學習來獲取能提高問題求解效率的知識(如搜索控制知識,啟發(fā)式知識等)。
綜合分類
綜合考慮各種學習方法出現(xiàn)的歷史淵源、知識表示、推理策略、結(jié)果評估的相似性、研究人員交流的相對集中性以及應用領(lǐng)域等諸因素。將機器學習方法[1] 區(qū)分為以下六類:
1)經(jīng)驗性歸納學習 (empirical inductive learning)
經(jīng)驗性歸納學習采用一些數(shù)據(jù)密集的經(jīng)驗方法(如版本空間法、ID3法,定律發(fā)現(xiàn)方法)對例子進行歸納學習。其例子和學習結(jié)果一般都采用屬性、謂詞、關(guān)系等符號表示。它相當于基于學習策略分類中的歸納學習,但扣除聯(lián)接學習、遺傳算法、加強學習的部分。
2)分析學習(analytic learning)
分析學習方法是從一個或少數(shù)幾個實例出發(fā),運用領(lǐng)域知識進行分析。其主要特征為:
·推理策略主要是演繹,而非歸納;
·使用過去的問題求解經(jīng)驗(實例)指導新的問題求解,或產(chǎn)生能更有效地運用領(lǐng)域知識的搜索控制規(guī)則。
分析學習的目標是改善系統(tǒng)的性能,而不是新的概念描述。分析學習包括應用解釋學習、演繹學習、多級結(jié)構(gòu)組塊以及宏操作學習等技術(shù)。
3)類比學習
它相當于基于學習策略分類中的類比學習。在這一類型的學習中比較引人注目的研究是通過與過去經(jīng)歷的具體事例作類比來學習,稱為基于范例的學習(case_based learning),或簡稱范例學習。
4)遺傳算法(genetic algorithm)
遺傳算法模擬生物繁殖的突變、交換和達爾文的自然選擇(在每一生態(tài)環(huán)境中適者生存)。它把問題可能的解編碼為一個向量,稱為個體,向量的每一個元素稱為基因,并利用目標函數(shù)(相應于自然選擇標準)對群體(個體的集合)中的每一個個體進行評價,根據(jù)評價值(適應度)對個體進行選擇、交換、變異等遺傳操作,從而得到新的群體。遺傳算法適用于非常復雜和困難的環(huán)境,比如,帶有大量噪聲和無關(guān)數(shù)據(jù)、事物不斷更新、問題目標不能明顯和精確地定義,以及通過很長的執(zhí)行過程才能確定當前行為的價值等。同神經(jīng)網(wǎng)絡(luò)一樣,遺傳算法的研究已經(jīng)發(fā)展為人工智能的一個獨立分支,其代表人物為霍勒德(J.H.Holland)。
5)聯(lián)接學習
典型的聯(lián)接模型實現(xiàn)為人工神經(jīng)網(wǎng)絡(luò),其由稱為神經(jīng)元的一些簡單計算單元以及單元間的加權(quán)聯(lián)接組成。
6)增強學習(reinforcement learning)
增強學習的特點是通過與環(huán)境的試探性(trial and error)交互來確定和優(yōu)化動作的選擇,以實現(xiàn)所謂的序列決策任務(wù)。在這種任務(wù)中,學習機制通過選擇并執(zhí)行動作,導致系統(tǒng)狀態(tài)的變化,并有可能得到某種強化信號(立即回報),從而實現(xiàn)與環(huán)境的交互。強化信號就是對系統(tǒng)行為的一種標量化的獎懲。系統(tǒng)學習的目標是尋找一個合適的動作選擇策略,即在任一給定的狀態(tài)下選擇哪種動作的方法,使產(chǎn)生的動作序列可獲得某種最優(yōu)的結(jié)果(如累計立即回報最大)。
在綜合分類中,經(jīng)驗歸納學習、遺傳算法、聯(lián)接學習和增強學習均屬于歸納學習,其中經(jīng)驗歸納學習采用符號表示方式,而遺傳算法、聯(lián)接學習和加強學習則采用亞符號表示方式;分析學習屬于演繹學習。
實際上,類比策略可看成是歸納和演繹策略的綜合。因而最基本的學習策略只有歸納和演繹。
從學習內(nèi)容的角度看,采用歸納策略的學習由于是對輸入進行歸納,所學習的知識顯然超過原有系統(tǒng)知識庫所能蘊涵的范圍,所學結(jié)果改變了系統(tǒng)的知識演繹閉包, 因而這種類型的學習又可稱為知識級學習;而采用演繹策略的學習盡管所學的知識能提高系統(tǒng)的效率,但仍能被原有系統(tǒng)的知識庫所蘊涵,即所學的知識未能改變系統(tǒng)的演繹閉包,因而這種類型的學習又被稱為符號級學習。
學習形式分類
1)監(jiān)督學習(supervised learning)
監(jiān)督學習,即在機械學習過程中提供對錯指示。一般實在是數(shù)據(jù)組中包含最終結(jié)果(0,1)。通過算法讓機器自我減少誤差。這一類學習主要應用于分類和預測 (regression & classify)。監(jiān)督學習從給定的訓練數(shù)據(jù)集中學習出一個函數(shù),當新的數(shù)據(jù)到來時,可以根據(jù)這個函數(shù)預測結(jié)果。監(jiān)督學習的訓練集要求是包括輸入和輸出,也可以說是特征和目標。訓練集中的目標是由人標注的。常見的監(jiān)督學習算法包括回歸分析和統(tǒng)計分類。
2)非監(jiān)督學習(unsupervised learning)
非監(jiān)督學習又稱歸納性學習(clustering)利用K方式(Kmeans),建立中心(centriole),通過循環(huán)和遞減運算(iteration&descent)來減小誤差,達到分類的目的。
研究領(lǐng)域
機器學習領(lǐng)域的研究工作主要圍繞以下三個方面進行:
(1)面向任務(wù)的研究
研究和分析改進一組預定任務(wù)的執(zhí)行性能的學習系統(tǒng)。
?。?)認知模型
研究人類學習過程并進行計算機模擬。
?。?)理論分析
從理論上探索各種可能的學習方法和獨立于應用領(lǐng)域的算法
機器學習是繼專家系統(tǒng)之后人工智能應用的又一重要研究領(lǐng)域,也是人工智能和神經(jīng)計算的核心研究課題之一。現(xiàn)有的計算機系統(tǒng)和人工智能系統(tǒng)沒有什么學習能力,至多也只有非常有限的學習能力,因而不能滿足科技和生產(chǎn)提出的新要求。對機器學習的討論和機器學習研究的進展,必將促使人工智能和整個科學技術(shù)的進一步發(fā)展 。
內(nèi)容來自百科網(wǎng)