Claude 記憶外掛 claude-mem 實測:一人公司怎麼用、怎麼避免帳單爆炸
等了半年的「會記憶的 Claude」終於現身
目錄
官方公告在講什麼
Anthropic 在 2024-12-19 把「claude-mem」放上 GitHub,號稱讓 Claude 在 跨 session 也能記得你講過的話。
簡單說:它是一個 Claude Code 的外掛,自動把每次 CLI 對話轉成向量,下次啟動時讓 Claude 自己讀回來。
目前完全免費,之後會按 token 用量計費。
只有 CLI,還沒有網頁版。
只支援 Claude 3.5 Sonnet 以上模型。
拆解:真正新的是什麼、哪些是包裝
真正新的
- 官方第一次提供「記憶」範例程式碼,讓開發者不用再自己串 Pinecone / Supabase。
- 內建 token 壓縮邏輯,用 Claude 的 agent-sdk 把歷史對話壓成摘要,省下 vector storage 的錢。
只是包裝
- 技術本身 = 向量搜尋 + prompt 拼接,坊間已經有十幾套開源方案。
- 所謂「記憶」其實只是把過去對話當作 context 餵回去,不會改變模型權重。
- 免費期是行銷手法,之後價格一定比你自己架向量庫貴。
我的解讀
一人公司(像我)最怕兩件事:
- 維運成本 —— 向量資料庫掛了誰來修?
- 費用不可控 —— 每次查都花錢,月底看到帳單傻眼。
claude-mem 把這兩件事打包成「一鍵安裝」,看似佛心,其實是把帳單轉嫁給我們。
短期內我會裝來測,但會把它當「可拋棄的快取」:
- 重要知識還是丟回我自己的 Supabase 向量庫備份。
- 只在 Claude Code 裡做快速實驗,不讓它變成唯一資料源。
書中 Ch8 提到「Context Window 就像工作記憶體,塞太滿會讓模型開始幻覺」。
claude-mem 的壓縮功能就是為了避免這件事,但如果壓過頭,細節會不見。
我還沒試過極端長度的壓縮,但看得出這是 trade-off:省 token vs. 失真。
3 個馬上可用的 prompt / 操作
1. 安裝並初始化
用途:第一次把 claude-mem 裝進 Claude Code
預期輸出:看到 ✅ Memory enabled
注意事項:需要先登入 Anthropic CLI
npm install -g claude-code
claude auth login
claude plugins install thedotmack/claude-mem
claude mem init
2. 讓 Claude 記住專案規格
用途:把整份 README 存進記憶,下次問功能時不用再貼一次
預期輸出:Claude 回答時會引用 README 內容
注意事項:檔案太大會被壓縮,建議分段儲存
claude mem add README.md --tag project-spec
3. 查詢上次討論的程式碼
用途:昨天寫了一段 CadQuery 腳本,今天忘了檔名
預期輸出:直接列出那段程式碼與檔案路徑
注意事項:如果記憶庫太舊,要先 claude mem sync
claude mem search "cadquery cylinder"
誰適合用、誰還不用急
現在就該用
- 已經天天用 Claude Code 寫程式的人
- 需要反覆查詢「上週討論過的 API 規格」的小團隊
再觀望一個月
- 主力在 n8n / ComfyUI / 本地模型的人(目前不支援)
- 對 token 價格敏感的自由接案者(等官方公布費率再說)
完全不用急
- 只用 Claude 網頁版問問題的使用者
- 已經有自己維護向量庫的工程團隊
延伸閱讀 / 官方文件
- 原始 repo:github.com/thedotmack/claude-mem
- Anthropic 官方計價頁面:console.anthropic.com/settings/billing
- 書中 Ch26 的實測數據:「自己架 Supabase 向量庫,每月 10 萬次查詢約 3 美元」可做對照
下一步你可以:
- 先用上面 3 個指令跑一次小專案,感受壓縮後的記憶是否夠用。
- 把重要資料同時備份到自己的向量庫,避免被平台綁死。
- 追蹤 GitHub issue #15「Pricing model」,官方一公布費率就決定要留要刪。