Claude 記憶外掛 claude-mem 實測:一人公司怎麼用、怎麼避免帳單爆炸

等了半年的「會記憶的 Claude」終於現身

官方公告在講什麼

Anthropic 在 2024-12-19 把「claude-mem」放上 GitHub,號稱讓 Claude 在 跨 session 也能記得你講過的話。
簡單說:它是一個 Claude Code 的外掛,自動把每次 CLI 對話轉成向量,下次啟動時讓 Claude 自己讀回來。
目前完全免費,之後會按 token 用量計費。
只有 CLI,還沒有網頁版。
只支援 Claude 3.5 Sonnet 以上模型。

拆解:真正新的是什麼、哪些是包裝

真正新的

  • 官方第一次提供「記憶」範例程式碼,讓開發者不用再自己串 Pinecone / Supabase。
  • 內建 token 壓縮邏輯,用 Claude 的 agent-sdk 把歷史對話壓成摘要,省下 vector storage 的錢。

只是包裝

  • 技術本身 = 向量搜尋 + prompt 拼接,坊間已經有十幾套開源方案。
  • 所謂「記憶」其實只是把過去對話當作 context 餵回去,不會改變模型權重。
  • 免費期是行銷手法,之後價格一定比你自己架向量庫貴。

我的解讀

一人公司(像我)最怕兩件事:

  1. 維運成本 —— 向量資料庫掛了誰來修?
  2. 費用不可控 —— 每次查都花錢,月底看到帳單傻眼。

claude-mem 把這兩件事打包成「一鍵安裝」,看似佛心,其實是把帳單轉嫁給我們。
短期內我會裝來測,但會把它當「可拋棄的快取」:

  • 重要知識還是丟回我自己的 Supabase 向量庫備份。
  • 只在 Claude Code 裡做快速實驗,不讓它變成唯一資料源。

書中 Ch8 提到「Context Window 就像工作記憶體,塞太滿會讓模型開始幻覺」。
claude-mem 的壓縮功能就是為了避免這件事,但如果壓過頭,細節會不見。
我還沒試過極端長度的壓縮,但看得出這是 trade-off:省 token vs. 失真。

3 個馬上可用的 prompt / 操作

1. 安裝並初始化

用途:第一次把 claude-mem 裝進 Claude Code
預期輸出:看到 ✅ Memory enabled
注意事項:需要先登入 Anthropic CLI

npm install -g claude-code
claude auth login
claude plugins install thedotmack/claude-mem
claude mem init

2. 讓 Claude 記住專案規格

用途:把整份 README 存進記憶,下次問功能時不用再貼一次
預期輸出:Claude 回答時會引用 README 內容
注意事項:檔案太大會被壓縮,建議分段儲存

claude mem add README.md --tag project-spec

3. 查詢上次討論的程式碼

用途:昨天寫了一段 CadQuery 腳本,今天忘了檔名
預期輸出:直接列出那段程式碼與檔案路徑
注意事項:如果記憶庫太舊,要先 claude mem sync

claude mem search "cadquery cylinder"

誰適合用、誰還不用急

現在就該用

  • 已經天天用 Claude Code 寫程式的人
  • 需要反覆查詢「上週討論過的 API 規格」的小團隊

再觀望一個月

  • 主力在 n8n / ComfyUI / 本地模型的人(目前不支援)
  • 對 token 價格敏感的自由接案者(等官方公布費率再說)

完全不用急

  • 只用 Claude 網頁版問問題的使用者
  • 已經有自己維護向量庫的工程團隊

延伸閱讀 / 官方文件

  • 原始 repo:github.com/thedotmack/claude-mem
  • Anthropic 官方計價頁面:console.anthropic.com/settings/billing
  • 書中 Ch26 的實測數據:「自己架 Supabase 向量庫,每月 10 萬次查詢約 3 美元」可做對照

下一步你可以:

  1. 先用上面 3 個指令跑一次小專案,感受壓縮後的記憶是否夠用。
  2. 把重要資料同時備份到自己的向量庫,避免被平台綁死。
  3. 追蹤 GitHub issue #15「Pricing model」,官方一公布費率就決定要留要刪。