
當前位(wei)置:首頁(ye) > 技(ji)術(shu)文章 > 機(ji)器學(xue)習(xi)與(yu)連(lian)續(xu)流連(lian)載系列丨(shu)機器(qi)學(xue)習(xi):人工智能的驅(qu)動(dong)力(li)

摘(zhai)要(yao)
前(qian)期回顧(gu):
機器學(xue)習(xi)與(yu)連(lian)續(xu)流連(lian)載系列丨(shu)使(shi)用康寧(ning)反(fan)應器集(ji)成在線光(guang)譜(pu),通(tong)過(guo)半(ban)監(jian)督機(ji)器(qi)學(xue)習(xi)識(shi)別化學(xue)反(fan)應(ying)式(shi)計(ji)量(liang)和(he)動力(li)學(xue)模(mo)型(xing)
點擊進入(ru)原(yuan)文查(zha)看(kan)
本(ben)期(qi)亮(liang)點(dian)
本(ben)期(qi)將對(dui)機(ji)器(qi)學(xue)習(xi)做(zuo)壹次全(quan)面(mian)感(gan)性認(ren)識(shi):
什麽是(shi)機(ji)器(qi)學(xue)習(xi)?
機(ji)器(qi)學(xue)習(xi)的工作(zuo)流(liu)程(cheng)是(shi)怎(zen)樣(yang)的?
機(ji)器(qi)學(xue)習(xi)有(you)幾種類(lei)型(xing)?
機器(qi)學(xue)習(xi)也(ye)有(you)局(ju)限性?
機(ji)器(qi)學(xue)習(xi)(Machine Learning, ML)作(zuo)為(wei)人工智能(Artificial Intelligence, AI)的壹個分(fen)支(zhi),正(zheng)在(zai)逐(zhu)漸(jian)改變(bian)我們(men)與(yu)技(ji)術(shu)的互(hu)動(dong)方式(shi)。本(ben)文將探(tan)討機(ji)器學(xue)習(xi)的核(he)心(xin)概(gai)念、工作(zuo)流(liu)程(cheng)、類(lei)型(xing)、優勢與(yu)局限。
點擊(ji)關註公眾(zhong)號,我們(men)下期不見(jian)不(bu)散!

在回答(da)機器(qi)學(xue)習(xi)前(qian),先(xian)回(hui)到人類(lei)的學(xue)習(xi),什麽叫(jiao)做(zuo)學(xue)習(xi)或(huo)者(zhe)學(xue)會(hui)了(le)?簡(jian)而(er)言之(zhi)就(jiu)是發現(xian)規律(lv),能根(gen)據(ju)已(yi)有(you)情況,尋(xun)找規律(lv),解決(jue)新(xin)問題。
“過擬(ni)合(he)”,打(da)個(ge)比(bi)方就(jiu)像某(mou)學(xue)生做(zuo)大(da)量(liang)題,他死記硬(ying)背,只(zhi)會(hui)做(zuo)已經(jing)做過(guo)的相同的題,遇到(dao)相同知識(shi)基礎(chu)的新(xin)題(稍微變(bian)化壹下)就(jiu)不(bu)會(hui)解答(da),也就(jiu)是“泛(fan)化能力(li)”差。
比(bi)如某(mou)某(mou)學(xue)生在(zai)模(mo)擬考試中,考(kao)試成績好,到(dao)了(le)正(zheng)式(shi)考(kao)試時,成績不理(li)想(xiang),很(hen)多(duo)家長認為(wei)沒有考試運。當然這個有很(hen)多(duo)原(yuan)因,比(bi)如考(kao)試時緊(jin)張,身(shen)體(ti)出(chu)現(xian)不適(shi)等,但(dan)有個原(yuan)因就(jiu)是其(qi)“泛化能力(li)”差,模擬考是(shi)他做(zuo)過的題,沒有(you)從(cong)中“泛(fan)化(hua)”出規律(lv)去解答(da)新題。
機器(qi)學(xue)習(xi)類(lei)似(si)人類(lei)學(xue)習(xi),根(gen)據(ju)大(da)量(liang)題型總結規律(lv),根據(ju)規律(lv)去解決(jue)新(xin)問題。
人工智能先(xian)驅(qu)Arthur Samuel,在(zai)1950年代(dai)將“機(ji)器學(xue)習(xi)”定義為(wei),“使(shi)計(ji)算機(ji)能夠(gou)在沒有(you)明(ming)確編程(cheng)的情況下(xia)進行(xing)學(xue)習(xi)的研究領域”。
Nvidia認為(wei)“機器學(xue)習(xi)最(zui)基(ji)本(ben)的是(shi)使(shi)用算(suan)法(fa)解析(xi)數據(ju),從(cong)中學(xue)習(xi),然後對(dui)世界(jie)上的事(shi)物(wu)做出決(jue)定或(huo)預測(ce)。”

傳統編程(cheng)

機器學(xue)習(xi)
傳(chuan)統(tong)編程(cheng)需(xu)要(yao)寫(xie)好(hao)嚴格的詳細(xi)的程(cheng)序(xu)指令,根據(ju)輸(shu)入(ru)數據(ju)得到輸出結果(guo)。其難度在於程(cheng)序(xu)的編寫(xie),有(you)時不(bu)能覆(fu)蓋某(mou)些(xie)新(xin)情況。比(bi)如做(zuo)饅(man)頭,寫好買1kg白(bai)面(mian)粉(fen),和(he)面(mian)加(jia)入(ru)X kg水,捏(nie)好形(xing)狀(zhuang),放入(ru)蒸籠(long)蒸(zheng)X分(fen)鐘(zhong)。如果(guo)遇到(dao)了玉米粉,它就(jiu)不(bu)會做玉(yu)米饅頭了(le)。
機(ji)器(qi)學(xue)習(xi)是(shi)通(tong)過(guo)算法(fa)和(he)大(da)量(liang)的做(zuo)饅(man)頭的書(shu)籍(ji)介紹(shao)等,總結出通用規律(lv),這樣(yang)遇到玉米粉也能輸(shu)出相應做(zuo)玉米(mi)饅(man)頭(tou)的步驟(zhou)。所(suo)以(yi)機(ji)器(qi)學(xue)習(xi)難在解析(xi)數據(ju)結(jie)構(gou),發現(xian)規律(lv)。

機器學(xue)習(xi)的工作(zuo)流(liu)程(cheng)包(bao)括以(yi)下(xia)幾個(ge)關鍵(jian)步驟(zhou):
數據(ju)收(shou)集(ji):從(cong)不同(tong)來(lai)源(yuan)收集數據(ju),如音(yin)樂錄(lu)音(yin)、患(huan)者(zhe)病(bing)史或(huo)照(zhao)片(pian)。
數據(ju)準(zhun)備(bei):清洗(xi)數據(ju)、去除(chu)錯誤(wu),並進(jin)行(xing)格式(shi)化,使(shi)其(qi)適(shi)合(he)計(ji)算機(ji)處理。
選(xuan)擇(ze)和訓練模型:根(gen)據(ju)任(ren)務(wu)選擇(ze)合(he)適(shi)的機(ji)器(qi)學(xue)習(xi)模(mo)型(xing),並(bing)開(kai)始訓練過程(cheng)。
模(mo)型(xing)優化:通(tong)過(guo)調整(zheng)參數或(huo)設(she)置來提(ti)高(gao)模(mo)型(xing)的準(zhun)確性。
模(mo)型(xing)評(ping)估(gu):使(shi)用未(wei)包(bao)含在(zai)訓練數據(ju)中的新(xin)數據(ju)來(lai)測(ce)試模(mo)型(xing)的泛(fan)化(hua)能力(li)。
模型部署:將(jiang)訓練和評(ping)估(gu)好(hao)的模(mo)型(xing)用於對(dui)新(xin)數據(ju)進(jin)行(xing)預測(ce)或(huo)識(shi)別模式(shi)。

機器學(xue)習(xi)模(mo)型(xing)主(zhu)要(yao)分(fen)為(wei)四種類(lei)型(xing):
監(jian)督學(xue)習(xi):使(shi)用帶(dai)有明(ming)確描述或(huo)標簽(qian)的訓練數據(ju),算(suan)法(fa)在(zai)“監(jian)督者(zhe)”的幫(bang)助下學(xue)習(xi)。監(jian)督學(xue)習(xi)就(jiu)像做(zuo)題,有答(da)案和目標可以(yi)參(can)照。
無監(jian)督學(xue)習(xi):使(shi)用未(wei)標記的訓練數據(ju),目的是(shi)在(zai)沒有具體指導的情況下(xia)發現(xian)數據(ju)中的模(mo)式(shi)、結構(gou)或(huo)關系。
半(ban)監(jian)督學(xue)習(xi):嚴(yan)格意義上來說(shuo)不(bu)算(suan)獨立(li)分(fen)類(lei),顧(gu)名思義(yi)就是(shi)有(you)壹部分(fen)有(you)明(ming)確描述的數據(ju)來(lai)訓練。例如上(shang)篇(pian)文章提(ti)到(dao)的半(ban)監(jian)督學(xue)習(xi)。就(jiu)是(shi)先(xian)做壹部分(fen)給(gei)答(da)案的題,然後根(gen)據(ju)規律(lv)去做另(ling)壹半(ban)沒有(you)答(da)案的題目。
強(qiang)化(hua)學(xue)習(xi):計(ji)算機(ji)程(cheng)序(xu)通(tong)過(guo)與(yu)環境的交(jiao)互(hu)來(lai)學(xue)習(xi),通(tong)過(guo)試錯(cuo)來(lai)確定在特(te)定情境下(xia)的最(zui)佳行(xing)動。

優勢
數據(ju)處(chu)理(li)能力(li):機器學(xue)習(xi)能夠(gou)處理大(da)量(liang)數據(ju),並(bing)自(zi)行(xing)發現(xian)模式和(he)進(jin)行(xing)預測(ce)。
靈(ling)活性:機(ji)器(qi)學(xue)習(xi)模(mo)型(xing)可(ke)以適(shi)應新數據(ju),並(bing)隨(sui)著時間的推(tui)移(yi)不斷提(ti)高(gao)準(zhun)確性。
自(zi)動(dong)化:機器學(xue)習(xi)模(mo)型(xing)消除(chu)了手(shou)動數據(ju)分(fen)析(xi)和(he)解釋的需(xu)要(yao),實現(xian)了決(jue)策自動化。
局限
過擬(ni)合(he)和(he)泛(fan)化(hua)問題:機器(qi)學(xue)習(xi)模(mo)型(xing)可(ke)能過(guo)於適(shi)應訓練數據(ju),導致(zhi)無法(fa)泛(fan)化(hua)到(dao)未見過的例子。
可解釋性:壹些機(ji)器(qi)學(xue)習(xi)模(mo)型(xing)像“黑(hei)箱”壹樣(yang)運作(zuo),即使(shi)是(shi)專(zhuan)家也無法(fa)解釋它(ta)們(men)的決(jue)策或(huo)預測(ce)。
算(suan)法(fa)偏(pian)差:由於訓練數據(ju)可(ke)能包(bao)含人類(lei)的偏(pian)見,這可能導致(zhi)算法(fa)偏(pian)差,產生不(bu)公平(ping)的結(jie)果(guo)。
電話(hua)
關註公眾(zhong)號