心境札記 2026/04/16

Claude 記憶外掛 claude-mem 實測：一人公司怎麼用、怎麼避免帳單爆炸

等了半年的「會記憶的 Claude」終於現身

官方公告在講什麼

Anthropic 在 2024-12-19 把「claude-mem」放上 GitHub，號稱讓 Claude 在 跨 session 也能記得你講過的話。
簡單說：它是一個 Claude Code 的外掛，自動把每次 CLI 對話轉成向量，下次啟動時讓 Claude 自己讀回來。
目前完全免費，之後會按 token 用量計費。
只有 CLI，還沒有網頁版。
只支援 Claude 3.5 Sonnet 以上模型。

拆解：真正新的是什麼、哪些是包裝

真正新的

官方第一次提供「記憶」範例程式碼，讓開發者不用再自己串 Pinecone / Supabase。
內建 token 壓縮邏輯，用 Claude 的 agent-sdk 把歷史對話壓成摘要，省下 vector storage 的錢。

只是包裝

技術本身 = 向量搜尋 + prompt 拼接，坊間已經有十幾套開源方案。
所謂「記憶」其實只是把過去對話當作 context 餵回去，不會改變模型權重。
免費期是行銷手法，之後價格一定比你自己架向量庫貴。

我的解讀

一人公司（像我）最怕兩件事：

維運成本 —— 向量資料庫掛了誰來修？
費用不可控 —— 每次查都花錢，月底看到帳單傻眼。

claude-mem 把這兩件事打包成「一鍵安裝」，看似佛心，其實是把帳單轉嫁給我們。
短期內我會裝來測，但會把它當「可拋棄的快取」：

重要知識還是丟回我自己的 Supabase 向量庫備份。
只在 Claude Code 裡做快速實驗，不讓它變成唯一資料源。

書中 Ch8 提到「Context Window 就像工作記憶體，塞太滿會讓模型開始幻覺」。
claude-mem 的壓縮功能就是為了避免這件事，但如果壓過頭，細節會不見。
我還沒試過極端長度的壓縮，但看得出這是 trade-off：省 token vs. 失真。

3 個馬上可用的 prompt / 操作

1. 安裝並初始化

用途：第一次把 claude-mem 裝進 Claude Code
預期輸出：看到 ✅ Memory enabled
注意事項：需要先登入 Anthropic CLI

npm install -g claude-code
claude auth login
claude plugins install thedotmack/claude-mem
claude mem init

2. 讓 Claude 記住專案規格

用途：把整份 README 存進記憶，下次問功能時不用再貼一次
預期輸出：Claude 回答時會引用 README 內容
注意事項：檔案太大會被壓縮，建議分段儲存

claude mem add README.md --tag project-spec

3. 查詢上次討論的程式碼

用途：昨天寫了一段 CadQuery 腳本，今天忘了檔名
預期輸出：直接列出那段程式碼與檔案路徑
注意事項：如果記憶庫太舊，要先 claude mem sync

claude mem search "cadquery cylinder"

誰適合用、誰還不用急

現在就該用

已經天天用 Claude Code 寫程式的人
需要反覆查詢「上週討論過的 API 規格」的小團隊

再觀望一個月

主力在 n8n / ComfyUI / 本地模型的人（目前不支援）
對 token 價格敏感的自由接案者（等官方公布費率再說）

完全不用急

只用 Claude 網頁版問問題的使用者
已經有自己維護向量庫的工程團隊

Claude 記憶外掛 claude-mem 實測：一人公司怎麼用、怎麼避免帳單爆炸

官方公告在講什麼

拆解：真正新的是什麼、哪些是包裝

我的解讀

3 個馬上可用的 prompt / 操作

1. 安裝並初始化

2. 讓 Claude 記住專案規格

3. 查詢上次討論的程式碼

誰適合用、誰還不用急

延伸閱讀 / 官方文件

相關文章

RooCodeInc/Roo-Code

AI 落地師：一人公司怎麼把 AI 翻譯成各行各業每天用得到的工具

[HN] Claude Opus 4.7