AI 時代的 Backend Engineer：從會用到能建的完整路線

過去一年，AI 相關的需求開始頻繁出現在我的工作裡。起初是小事：幫某個服務加個 LLM 呼叫、試著把 prompt 包成 API。但越做越覺得，我對這整個領域的理解是碎片的——我知道怎麼打 API，但不知道為什麼這個 prompt 有效、不知道 agent 該怎麼設計、更不知道什麼時候該考慮 fine-tuning。

市面上的資源，不是太學術就是停留在 Hello World。我找不到一條從 Backend Engineer 的起點出發，走到能獨立設計 Agentic System 的路線。所以我自己整理了一條。

這篇是寫給跟我一樣背景的人：熟悉 API 設計、懂資料庫、但還沒有系統性接觸 AI 工程的 Backend Engineer。

走完這條路線，你會能夠：

用 AI Coding Agent 協作，而不只是補全程式碼
獨立 build 一個 LLM-backed 的 REST Service 上 production
設計並開發完整的 Agentic System，包含 RAG、memory、安全層與 eval
理解 fine-tuning 和 local inference 的適用場景與基本架構

在正式進入路線之前，有一件事要先說清楚。

先升級工作方式：從 Vibe Coding 到 Agentic Coding

不要停在 Vibe Coding——那是把 AI 當成隨便問問的工具，生出什麼算什麼。作為工程師，你應該把本來就懂的設計思維帶進來：寫清楚的 spec 再讓 Agent 執行（SDD），或是先定義測試再讓 Agent 實作（TDD）。這兩種方式都讓 AI 的輸出變得可預期、可驗證。

Agentic Coding 不是「用 Copilot 補 code」，而是讓 Claude Code、Codex 這類 AI Agent 直接執行任務——寫 spec、建 scaffold、跑測試、做 refactor。你的角色從「寫程式的人」變成「定義問題、審查決策的人」。

這個轉變有一個意料之外的副作用：你會發現自己對技術廣度的需求變高了。當 AI 幫你寫 code，瓶頸不再是「我會不會寫這段邏輯」，而是「我在 spec 裡做的技術判斷對不對」。System Design 的關注點從語言熟悉度移到了業務邏輯的合理性，你不用在意寫不寫得出來，但你要知道什麼是對的設計。

另一個紅利是 POC 成本大幅降低。以前要試一個想法得先花時間 build；現在可以快速驗證假設、試錯、迭代。這是提升系統設計直覺最快的方式之一，也是我自己覺得最有趣的地方。

Phase 1：LLM Integration 的核心基礎

很多工程師的第一個 LLM task，其實不複雜：針對某個業務場景，處理 input、build 一個 prompt、打 LLM API、拿到結果，包成一個 REST service。

就這樣。但這個看似簡單的任務，能讓你快速感受到 LLM 的強大——以及它的不可預測性。

Prompt Engineering：不只是「寫一段話問 LLM」，而是結構化地設計輸入——system prompt、user prompt、few-shot examples、chain-of-thought。Prompt 的品質直接決定輸出品質，這是這個階段最值得認真對待的基本功。

Structured Output / Function Calling：讓 LLM 回傳 JSON、呼叫 function，而不只是回傳文字。這是從「問 LLM 要答案」到「讓 LLM 驅動行為」的關鍵跳躍，也是進入下一個 Phase 的基礎。

LLM 的基本屬性：token 計算、context window 限制、temperature 的作用、latency 與 cost 的 trade-off。這些不是理論，是你在設計 service 時每天都會碰到的決策因子。

以我自己的觀察，目前很多公司還停留在這個階段，甚至根本還沒開始——掌握這層，應該已經算是業界的敲門磚。不確定大家看到的情況是不是也差不多，歡迎留言聊聊。

Phase 2：如何設計 Agentic Systems

這個 Phase 開始真正有挑戰性。你可能被要求整合既有的 agent framework 進 production，或是從零設計一個 SRE Agent、客服 Agent、內部知識庫系統。

幾個核心概念：

ReAct / Multi-agent 架構：Agent 不只是「一個 prompt loop」，而是有 reasoning、tool use、memory 的系統。Multi-agent 讓不同 agent 負責不同子任務，但協作設計複雜得多。LangGraph 是一個常見的選擇，但這個領域的工具迭代很快，重點是理解 stateful workflow 的設計概念，而不是綁定特定框架。

Context Engineering：管理 context window 是 Agentic System 的核心挑戰。什麼資訊要進 context、什麼要留在外面、怎麼動態組裝，這直接影響 agent 表現和 token 成本。Context Engineering 不是 prompt engineering，而是更上層的資訊架構設計。

Harness Engineering：圍繞 LLM call 的基礎設施，包含 retry logic、fallback、caching、rate limit 處理、logging、cost tracking。這是讓 LLM integration 能上 production 的水電管線，往往比 agent 邏輯本身花更多工程心力。

RAG & Memory：需要 agent 存取外部知識時，RAG 加上 Vector DB 是標準做法。Memory system 讓 agent 能在多輪對話或跨 session 間保留狀態。

Security / Trust Layer：Production 系統裡不能省的一層。Prompt injection 和 jailbreak 不是理論威脅，有人會刻意用輸入來操控 agent 行為。Output validation 確保回應符合預期格式和安全限制。如果系統會處理用戶資料，PII handling 也是必要的設計考量。

Evaluation & Observability：LLM 系統很難用傳統 unit test 覆蓋，需要另外設計 eval framework，定義什麼叫「好的輸出」、怎麼量化、怎麼做 regression test。Observability 讓你在 production 裡能追蹤 agent 行為、找出問題。後續的 LLMOps 讓這個系統能持續被維護和迭代。

能比別人早進入這個 Phase，優勢相當明顯。

Phase 3：Fine-tuning、Local Inference 與 Hybrid 架構

我自己的觀點是：未來的模型架構不會是「全部打外部 API」或「全部自己跑」，而是 Hybrid——Frontier model 負責通用推理，自己維護的垂直領域模型負責深度專業場景。成本考量和落地場景的需求，會讓這個架構越來越普遍。

所以這個 Phase 的能力，比你想像的更值得提早佈局。

LoRA Fine-tuning：對 open-source model（Llama、Mistral 等）做 fine-tuning，讓模型學習你的領域知識或特定輸出格式。LoRA 是目前最 cost-effective 的方式，不需要從頭訓練整個模型。

Model Distillation：用大型 Frontier model 的輸出來訓練一個小型模型，讓小模型在特定任務上逼近大模型的表現，但成本和延遲大幅降低。在 Hybrid 架構裡，distillation 是建立垂直領域輕量模型的關鍵手段。

Local Inference：用 vLLM 或類似框架自己跑 inference endpoint，管理 GPU 資源、設計 KV cache 策略節省 token 成本，以及理解 batching、quantization 等加速推論的技術。

這個 Phase 的工程複雜度和基礎設施成本都高很多，但也是目前市場上最稀缺的能力之一。

這三個 Phase 不一定要線性走完——很多工程師從 Phase 1 開始，做著做著就被需求推進 Phase 2。重要的是知道每個 Phase 在解決什麼問題、自己目前在哪裡、下一步要補什麼。

不要怕這些東西太多、太難。

一個很有效的方式是 Top-Down 學習：不要試圖把每個概念都學透再往下走，而是先快速掃過這些名詞和概念，在腦袋裡建立一個 Index——知道「有這種東西存在」、「它大概解決什麼問題」，就夠了。等到真正要設計系統的時候，你有這個 Index，就知道去哪裡找答案。

更進一步的做法是建立自己的 Knowledge Base，類似 Karpathy 的 llm wiki 的概念——把你讀到的重要概念、tool、paper、設計模式都整理進去。等到要解決一個新問題，可以跟 AI Agent 一起 BrainStorm，請它從你的 knowledge 裡找符合情境的方案，拼湊出一個可行的設計，再針對某個 tool 做一些微調。這套流程的效率遠超過從零開始查資料。

我自己養成了一個習慣：每週掃一次 GitHub Trending。這個領域的 open source 工具出現的速度真的很快，每隔一段時間就有讓你眼睛一亮的東西。說真的很感謝那些無私貢獻的開發者們——正是因為這些人，這條學習路線的成本才能這麼低。

AI Engineer 這個角色還在成形，邊界每幾個月就在移動。但有一件事不會變：能把業務問題跟 AI 系統的設計對得上的工程師，現在和接下來都會很搶手。

最後想說的是，走這條路，技術只是一部分。更重要的是保持好奇心，對每一個「這為什麼這樣運作」都願意多想一下；以及不怕挑戰，看到一個複雜的問題，第一個反應不是「我不會」，而是「這很有趣，來試試看」。

這個時代給了工程師一個很難得的機會：你可以用比以前低得多的成本，真的把一個想法 build 出來。成為一個 Builder，不只是職稱上的轉變，而是一種心態——你不只是在執行需求，你在用 AI 工具把腦袋裡的東西變成真實存在的東西。

這是我覺得現在做工程師最有意思的地方。

最後補一句：如果你真的是頂尖中的頂尖、對自己的研究能力有絕對的自信，當然也可以直接跳進 Frontier Model 的科研行列。但我自己很清楚，那不是我的路。我對 LLM 落地、讓 AI 真正跟真實世界接上的這個方向，反而更有熱情。

上面這幾個 Phase，是我幫自己規劃、想要補足的 roadmap。每個人的職涯背景不一樣，我走的這條路不一定適合你——這也不是什麼教學文或標準答案，單純是一個 Backend Engineer 幫自己整理的學習方向，分享出來給有興趣的人參考。

AI 時代的 Backend Engineer：從會用到能建的完整路線

先升級工作方式：從 Vibe Coding 到 Agentic Coding

Phase 1：LLM Integration 的核心基礎

Phase 2：如何設計 Agentic Systems

Phase 3：Fine-tuning、Local Inference 與 Hybrid 架構

相關文章