2017年7月20日 星期四

Why PLA May Work - Step 2

上一篇,Why PLA May Work - Step 1,解釋了 min 的意思。本篇,解釋下面式子左邊的y-w-x涵意。


拿上一篇的圖例解釋:


t的意思,是代某一輪。如t=1,代表第1輪,t=2代表第2輪。
xn(t),代表第t輪所偵測到錯誤的點,而yn(t)代表該點是+1或-1。

下圖是假想第一輪的情況
在第一輪,我們肉眼看到有兩個錯誤的點:x1與x4。因為PLA每輪只取一個錯誤的點,所以我們只取x4來處理。其值y4 = -1。把這兩個值標記為x4(1)和y4(1),括號裡的1代表第1輪。為何說x4是錯誤的點?因為:

w4x4(1) = +1 
y4(1) = -1

sign (w4x4(1)) != y4(1)

x4和x1兩個點,那一個距離最後的那條藍色分割線最近?畫圖:

將x4和x1分別投影到wf向量上,然後比較投影向量的長度,長度愈短,表示離線愈近。我們用「目視」發覺x1離分割線最近。如何用數學式子表達?可以用向量內積。
向量內積的結果是有方向性的,所以各自乘上自己的y值,這樣一來,就確保左右兩邊的值都是正的,就相當於投影向量的長度了。

就像我們程序員,在寫程式時,有一個習慣。明明程式寫好了,跑起來沒問題,但還是想修改,為的是能適用在更多情況,我稱之為抽象化。所以,對上面這個式子抽象化,讓它符合所有x,就成為:


這個式子,除了表達適用於所有的點之外,還表達了兩件事情:
  • 所有的點,離分割線的距離都是大於零
  • 若n=1,就是x1的那一點,套用式子,就是等號。意思就是x1離分割線最近。

我們記得,PLA每輪只取一個錯誤的點處理,所以我們可以把「輪」的概念套用在上面這個式子。這樣一來,這道式子就更能表達出程式在運行PLA時的狀況。


這道式子,講白話一點,就是:
不管是第幾輪,每一輪所挑選的錯誤的那個x,與最終切割線的距離,和離切割線最近的那個x的距離,稱為最小距離相比,有兩種情況:
  • 距離 > 最小距離
  • 距離 = 最小距離
    • 兩個點是同一個點
    • 兩個點不同,但都是最小距離

-Count
這封郵件來自 Evernote。Evernote 是您專屬的工作空間,免費下載 Evernote

沒有留言:

張貼留言