Skip to content

如何構建智能體應用?

學習 Agentic AI 課程 - 吳恩達教授 | 2025 年

核心設計模式

1. 自我反思機制

LLM 自行執行任務,通過輸出結果(代碼輸出錯誤等)進行反思(reflection),然後自行改進成果。這種循環改進的機制是智能體應用的核心特徵。

2. 雙模型審查系統

一個 LLM 負責執行任務,另一個 LLM 進行審查(review)。這兩個模型甚至可以是同一個模型的不同 session。通過這種分工合作的方式,能夠顯著提升輸出質量。

3. 多重評估策略

當生成兩個結果供模型評估時,會發現有些模型天然傾向於第一個選項,有些則傾向於第二個選項。建立多個二元標準,最後讓 LLM 進行綜合評估,這是一個不錯的評估工作流程(workflow)。

4. 外部反饋整合

外部反饋(external feedback)也是一個重要的提升手段。通過收集用戶反饋、測試結果等外部信號來優化智能體的表現。

高級開發技巧

自我評估循環

LLM 使用工具或其他 LLM 來評估和改進智能體系統本身。通過這種自我評估機制,可以持續優化系統性能。

追蹤與比較

通過收集中間步驟的成果,也就是使用追蹤(trace)來記錄中間輸出,將這些結果與人類專家的進行比較,可以促進改進整個工作流程。使用表格整理輸出結果進行對比分析是一個很好的實踐。

提示詞學習

「通過閱讀大量他人的提示詞(by reading lots of other people's prompts)」

這是提高自己撰寫提示詞能力的有效方法。學習優秀的提示詞範例能夠快速提升 prompt engineering 技能。

成本優化策略

這種先求質量再求效率的方法確保了產品質量優先,同時在需要時可以進行成本控制。

規劃設計模式(Planning Design Pattern

LLM 先制定詳細計劃,並且在提示詞中提供它可用的工具清單。之後按照計劃一步步執行得到最終的成果。這種 plan mode 的設計模式能夠顯著提升執行效率和成功率。

代碼驅動的規劃

使用代碼進行計劃和行動,可以讓表現更加高效。通過結構化的代碼框架來管理複雜的任務流程。

實際應用案例

Claude Code 中的實現

許多核心思想在 Claude Code 這個編程代理中幾乎完全一致:


Share this post on:

Comments


Next Post
怎麼構建一個類 Hacker News 的個人博客?