LLM
好久不見,這次來玩LLM了!
2025-06-03 · — views
好久沒更新網誌了(有點心虛地偷看上一篇日期),最近終於有個好藉口可以回來寫寫字了。剛好團隊最近有個Project,終於可以名正言順地開始碰LLM這塊神秘又炙手可熱的領域!
所以我想來寫一系列的文章,記錄一下自己在學 LLM的過程。當然,這也是一種自我整理思緒、邊寫邊學的概念啦~內容不會太艱深,畢竟我本人就是 LLM 界的幼幼班,這系列就算是「菜鳥的 LLM 修煉之路」吧!
說真的,現在 LLM 好像已經變成工程師的標配技能了——像是以前大家都會用 Git,現在大家都得懂點 prompt。身為活在這個技術日新月異、變化快得跟股價一樣的時代工程師,我們也只能邊哀號邊進步,痛並快樂地前行(?)
初步規劃一下大綱
本系列不會特別去講 LLM 的背景知識,畢竟網路上已經一堆專業大神寫得比我好太多了(而且我還在邊查邊學的階段)。所以我會直接從實作下手,用程式碼實際跑起來,邊動手邊學!
框架和模型:
-
LangChain:超紅的框架,用來快速建構各種 LLM App(懶人福音)
-
Model:會先用
gpt-4o-mini,不會太貴又有不錯的效果,CP值選手! -
讓LLM說話
-
使用(Chain) 串接物件
-
記憶機制
-
讓LLM使用Tool
-
建立一個簡單的Agent
-
RAG
-
Prompt的額外補充
接下來的文章會慢慢地帶大家走進 LangChain 的奇幻旅程,不會一下就教你建造 AI 大腦,但會一步一步教你怎麼「把 AI 摸熟」。