Harness Engineering 系列收尾：AI 焦慮之後，你決定怎麼走？

開始用 Claude Code 那段時間，我注意到一件有點奇怪的事。

幾個月前，大家在討論 Prompt Engineering——怎麼寫 prompt、怎麼設計 instruction。再過幾個月，開始出現 Context Engineering 這個詞，說的是 context window 怎麼管、什麼東西該放進去。又過了幾個月，Harness Engineering 開始在圈子裡流傳，討論的是 agent 框架、工具鏈、可觀測性。

同一個領域，名詞在幾個月內換了三輪。

我的第一個反應是焦慮。這些詞是真的在說不同的東西嗎？還是我剛學完一個，又要開始追下一個？然後更深一層的問題浮出來：這個節奏還會停嗎？

這篇是這個系列的最後一篇。但我想說的不是技術，是那個焦慮之後你怎麼決定自己要走哪條路。

Harness Engineering 系列在說什麼？

這個系列從一張地圖開始：要讓 AI 在特定 domain 穩定落地，系統可以被拆成四層——Model 層負責基礎能力，Knowledge 層管理 RAG 和文件，Harness 層處理 session、loop、memory、skill，Tool 層連接外部行動。

從那張地圖往下走，我們把每一層拆開來看：Agentic Loop 的五個工程關卡、Observability 讓你知道 agent 跑歪了、Memory 和 Identity 怎麼讓 agent 不漂移、Skill 自我強化迴路如何把試錯轉化成 playbook、最後到 Fine-tuning SLM 補上前沿模型看不見的 domain 盲區。

這不是 AI 教學系列，是在問一個問題：讓 AI 在複雜的真實 domain 裡穩定運作，工程師需要懂什麼？

「軟體工程師已死」這個說法，我不完全同意

這個說法的邏輯我理解：AI 能寫 code 了，Vibe Coding 出現了，Cursor 和 Claude Code 讓不懂程式的人也能跑出一個應用程式。所以軟體工程師不值錢了？

我覺得問題問錯了方向。AI 降低的是「寫出能跑的 code」這件事的門檻，但它同時提高了另一件事的要求：知道要解決什麼問題、什麼架構在 production 裡穩定、什麼設計三個月後會後悔。那些判斷力，AI 沒辦法幫你長出來。

原本就會走路的工程師，很多人是直接搭上了火箭。YC 現在有越來越多只有兩三個 founder 的 startup 做出以前需要幾十人的東西，不是因為他們更天才，是工具不一樣了。那些過去沒有資源、沒有機會的 Builder 和 Dreamer，第一次有辦法讓一個沒人做過的 service 真的存在。

另一個面向更值得說：很多以前根本進不了這個行業的人，現在有機會了。一個在醫療行業工作十年的護理師、一個熟悉法規的法律助理、一個在工廠做 QC 的工程師——他們都是自己領域的 Domain Expert，但過去沒辦法把知識打包成產品。現在這件事變得可能了。

這個餅不是被切得更小，是本來就在長大。

Top-Down 學習法：先建 Index，再按需深入

說回那個名詞一直在換的問題。

我後來找到一個對自己比較有效的方式：先建廣度、建 Index，不急著深入。

看到一個新詞或新概念，先問自己兩個問題：這是換湯不換藥的新名詞，還是真正的新賽道？如果是前者，花二十分鐘知道它在說什麼就夠了；如果是後者，再決定要不要往裡走。這個判斷力本身，就是值得投資的能力。

不是所有東西都要學。更多時候，把一些概念當故事聽就好。故事聽久了會在某個時刻突然派上用場，你會發現它讓你想得到一個你過去想不到的解法。

想得到，才做得到。目標是讓自己的知識 Index 夠豐富，讓你在面對一個問題的時候，至少能想到「這個方向有沒有可能」。深度可以在真正需要的時候再去挖。

AI 時代，工程師怎麼選定自己的賽道？

我的背景是 Machine Learning 工程師，從 0 開始 build model、做 feature engineering、上生產環境。那段時間我聽過一個 ML project，要求是瑕疵檢測率要超過工廠現有光學 AOI 機的 99%，那種壓力讓我對「穩定性」這件事有很深的印記。企業真的比你想像的更在意系統穩不穩。一個炸鍋，在 B2B 場景的損失和 B2C 是完全不同的量級。

這段時間探索下來，我決定了 1-2 年的定位：讓 AI 在深度 domain 落地。

具體來說，我不打算再深挖演算法了。我需要保留的是判斷 trade-off 的能力——知道不同 model 的優缺點，知道什麼時候要設計 harness 來幫助模型穩定、知道什麼時候 fine-tuning 才是必要的選擇。但演算法本身不是核心，工程設計才是。

會著重強化的是：Agent System 怎麼設計、怎麼讓 agent 穩定上 prod、可觀測性怎麼做到位。這幾塊和我的 backend 工程經驗高度重疊，是我的底座。加上過去 ML 的背景，在必要的時候可以自己打造 SLM，填上前沿模型看不見的 domain 盲區。

這是我的座標，不是唯一的答案。但如果你也在想「我的 AI 定位是什麼」，建議從自己最紮實的底子出發，往 AI 能放大那塊底子的方向走。

不要被同溫層嚇到

如果你是工程師，Threads 和 Facebook 上一定看到很多 AI 高手。每天都有人在分享新的工具、新的框架、新的突破，你會覺得自己什麼都不懂，根本跟不上。

但有一件事值得停下來想：你身邊的人，真的都在用 AI 嗎？

仔細觀察一下四周——不是你的 tech 同溫層，是你的家人、你的同學、你服務的客戶、你身邊的中小企業。AI 的真實滲透率，遠沒有你的 feed 讓你以為的那麼高。它很大程度上還只存在於你的泡泡裡。

這個現實不是要讓你放鬆，而是要讓你看清楚機會在哪裡。

104 上現在有滿滿的「AI 落地」相關職位，企業真的在找能把 AI 用在業務上的人，不是找會 fine-tuning 的研究員。市場還在被建立，這扇門現在開著。

這個時機的量級，我覺得不輸手機出現的那幾年、電子商務改變購物行為的那幾年。每一次行為模式的大轉變，都有人沒有抓住，也有人就在那個時候飛起來了。Agentic 的行為改變，我覺得就是這個世代的那個時機點。

走過的路不會白費

最後想對那些還在猶豫的人說幾句。

不管你在什麼行業，你都是自己 domain 的 Expert。你知道那個行業的痛點、知道哪些流程是大家忍很久的低效率、知道什麼樣的工具如果存在會真的被用到。這些知識，是外面的人學不走的。

現在你多了一個武器：AI Agent。Domain 知識加上打造 Agent 的能力，就有機會建出新的 service。可以優化的 workflow、值得再造的流程，每個行業裡都藏著超多，大部分還沒人碰。

最近很常看 Kelly 訪問矽谷 startup founder 的 YouTube 系列。那些 founder 的共同點，不是一開始就有完整的計劃，而是找到一個真實的痛點之後，就開始做，精準打擊。他們摸索的過程裡，過去各自走過的路都在某個時刻派上了用場。

接下來我自己想繼續探索的，是 Auto 流派的方向——讓 agent 自己跑 ML 實驗、自己搜集資料、自己產生訓練資料。Karpathy 前陣子提到 AutoResearch 的概念，Meta 也有 AutoData 的探索，HuggingFace 甚至做出了一個能自己跑實驗的 ml-intern。這個方向在問一個我還沒有答案的問題：當 AI 開始可以做 AI 工程師做的事，我們要往哪走？問題本身值得一直盯著。當然落地實作也不會少——光有方向沒有根的東西是空的。

今天隨手在 Threads 上滑到一個詞：Memetic Drift。說的是 Multi-agent 系統跑久了，agent 之間可能發展出自己的內部模式和語言，偏離原本的設計意圖。我停下來想了幾分鐘，發現它直接接上了這個系列裡講過的 Memory Rot 和 Identity Drift——同樣的現象，不同的表述。這就是 Top-Down 學習在發生的樣子：你不需要有計劃地去找，只需要讓 Index 一直在累積。某一天，一個在 Threads 上滑到的詞，突然接上了你三個月前讀過的東西，咔一聲串起來。

所以繼續滑、繼續看、繼續問。這個時代的資訊密度是前所未有的，但能把這些碎片串起來的能力，才是真正值錢的東西。

走過的路不會白費。你現在的起點，不管是什麼背景，都有它的價值。