AI並不神秘,不過就是要問一個好問題
 
2018/06/20
 
蔡炎龍 | 政治大學應用數學系教授
 
 

類神經網路是機器的大腦,架構好類神經網路,提供資料訓練它,就可以讓機器去學習,最後機器學會了做一件事情,例如下棋,似乎就產生了「智慧」,我們稱為人工智慧。這中間的運作原理是什麼呢?政治大學應用數學系教授蔡炎龍說:「人工智慧就是學一個『函數』。」

 

從考古題中學會計算

 

你可能玩過一種數學遊戲,給你一堆數字,你要猜出下一個數字是什麼。例如,1、4、9、16,這裡我們很容易就發現,1的平方是1,2的平方是4,依此類推,我們可以預測下一個數字是5的平方,也就是25。我們把這個規則化成函數,輸入x,輸出就是x的平方,函數可以寫成f(x) = x2。在人工智慧系統中,就是根據前面所提供的解答,讓人工智慧學會f(x)函數的計算,然後就能預測下一個數字。

 

函數其實就是一本解答本。我們收集一部份的考古題給機器,讓機器做這些考古題來學會這個函數,之後機器就能夠算出所有可能情況的答案。蔡炎龍把運用人工智慧解決問題的過程,大致拆解如下:

 

第一步是提出問題。例如照片裡的動物是什麼?(這裡以台灣黑熊為例。)

 

第二步是把問題化成函數。輸入是照片上的各種動物,透過函數計算後,輸出是動物的名稱。

 

第三步是準備訓練資料。我們把部份的解答(考古題)收集好,準備餵給機器。例如各種台灣黑熊的照片。

 

第四步是架構類神經網路。目前有標準神經網路、卷積神經網路、遞迴神經網路等三大架構,也可以用增強式學習、對抗式學習等較新的技術。

 

第五步是學習。調整類神經網路的參數,讓它做考古題,接著希望機器做得夠熟後,遇到沒碰過的情況時也能預測答案。例如:輸入一張沒見過的台灣黑熊照片,機器能辨認出是台灣黑熊。

 

問個好問題

 

聽起來很簡單,然而蔡炎龍說:「真正碰到的關卡,其實是我們會不會問一個好問題。」

 

舉例來說,我們可能都很想知道明天股票的收盤價。直覺上,函數的輸入是日期,經過計算後,輸出某股票的收盤價。但你我都知道這是不可能的事情,因為輸入方面根本無法提供任何資料。比較好的問法是,輸入前一週的股市資料,然後輸出未來的價格。

 

蔡炎龍再舉一個例子:某大聯盟球員在下一個球季中可以打幾支全壘打?我們有很多球員的相關資料可以提供,像是過去10年內的打擊率、三振、四壞甚至盜壘等。看起來似乎很合理,但預測結果很慘,因為所需的答案要非常精確,就跟預測彩券號碼一樣,每個數字都要命中,實在太難了。既然無法猜得太精確,那麼就改為預測區間,例如0 ~ 9、10 ~ 19、20 ~ 29、30 ~ 39、40以上各為一個區間,只要機器能猜中區間就算正確。結果正確率就提高了。

 

因此,問對問題就顯得很重要。蔡炎龍說:「這是我們在做人工智慧的過程中,很深的一個感想。」

 

不過,誰來問問題才會問得好?讓問題相關領域的專家來問,如果他沒有深度學習的背景,很可能會很天馬行空、希望工程師做出哆啦A夢;讓人工智慧專家來問,因為熟知架構、參數,問題又可能太局限。或許,跨領域的合作才能讓人工智慧發揮最大的功效。

 

整理|科學人

 

延伸閱讀:機器如何深度學習,《科學人》2016年7月,http://sa.ylib.com/MagArticle.aspx?Unit=featurearticles&id=3098

 
瀏覽人次:148