傳統 ML:你先決定模型看哪些欄位,模型再在這些欄位上學對應規則,也就是「先決定欄位,再學公式」。
深度學習:模型不只學答案,還會從原始資料一步步學出中間表示,也就是「不只學答案,也學怎麼看資料」。
Transformer:它屬於深度學習,但特別強在每個 token 都能動態決定要看誰,直接建立全局關係。
ML 重點:先決定特徵,再讓模型學公式。沒放進去的資訊,模型就看不到。
DL 重點:模型會從原始資料自己學中間表示,再用這些表示做判斷。
Transformer 重點:每個 token 都能動態關注其他 token,直接建立全局關係。
先勾選特徵,再調整房屋條件。你會看到:模型只能用你提供的欄位估價。
你沒提供的特徵,對模型來說就像不存在。
傳統 ML 先定義欄位,再學映射規則。模型不會自己從原始資料長出新特徵。
選一個手寫數字。觀察同一份像素經過多層後,如何變成更抽象的表示。
例如:直線、邊緣、轉角、封閉區域
例如:圈圈、直立筆劃、雙圈結構
把前面的表示整合成與任務更相關的概念
模型不只學最後輸出,還在多層網路裡學到「怎麼表示資料比較有用」。這就叫做 representation learning。
切換句子,再點選有歧義的 token。觀察注意力如何隨語境改變。
Transformer 不是「只是更大更深」,而是它讓資料中不同位置之間的關係,變成可以直接、動態、全局地互相參照。