學習 Agentic AI 課程 - 吳恩達教授 | 2025 年
核心設計模式
1. 自我反思機制
讓 LLM 自行執行任務,通過輸出結果(代碼輸出錯誤等)進行反思(reflection),然後自行改進成果。這種循環改進的機制是智能體應用的核心特徵。
2. 雙模型審查系統
一個 LLM 負責執行任務,另一個 LLM 進行審查(review)。這兩個模型甚至可以是同一個模型的不同 session。通過這種分工合作的方式,能夠顯著提升輸出質量。
3. 多重評估策略
當生成兩個結果供模型評估時,會發現有些模型天然傾向於第一個選項,有些則傾向於第二個選項。建立多個二元標準,最後讓 LLM 進行綜合評估,這是一個不錯的評估工作流程(workflow)。
4. 外部反饋整合
外部反饋(external feedback)也是一個重要的提升手段。通過收集用戶反饋、測試結果等外部信號來優化智能體的表現。
高級開發技巧
自我評估循環
讓 LLM 使用工具或其他 LLM 來評估和改進智能體系統本身。通過這種自我評估機制,可以持續優化系統性能。
追蹤與比較
通過收集中間步驟的成果,也就是使用追蹤(trace)來記錄中間輸出,將這些結果與人類專家的進行比較,可以促進改進整個工作流程。使用表格整理輸出結果進行對比分析是一個很好的實踐。
提示詞學習
「通過閱讀大量他人的提示詞(
by reading lots of other people's prompts)」
這是提高自己撰寫提示詞能力的有效方法。學習優秀的提示詞範例能夠快速提升 prompt engineering 技能。
成本優化策略
- 先把最好的工作成果做出來,等到成本成為問題再去做優化
benchmark the runtime去優化延遲benchmark平均費用 去優化成本
這種先求質量再求效率的方法確保了產品質量優先,同時在需要時可以進行成本控制。
規劃設計模式(Planning Design Pattern)
讓 LLM 先制定詳細計劃,並且在提示詞中提供它可用的工具清單。之後按照計劃一步步執行得到最終的成果。這種 plan mode 的設計模式能夠顯著提升執行效率和成功率。
代碼驅動的規劃
使用代碼進行計劃和行動,可以讓表現更加高效。通過結構化的代碼框架來管理複雜的任務流程。
實際應用案例
Claude Code 中的實現
許多核心思想在 Claude Code 這個編程代理中幾乎完全一致:
- 多
LLM並行執行任務:Claude Code會同時閱讀多個官方文檔 - 自我反思機制:通過讓
LLM自行反思和提供外部反饋來改進工作流程 - 自動代碼審查:在預設規則中,
Claude Code每次修改後會自行審查代碼,並執行程式,使用錯誤輸出自行修復 - 規劃模式:盡量讓
LLM制定計劃,按照計劃執行(Claude Code提供的plan mode就是這個思路)