[HN] Our eighth generation TPUs: two chips for the agentic era

TPU 拆成 8t/8i 這一步我等了一年半

去年 Ironwood 出來的時候我就說過單顆晶片要同時 cover training 跟 inference 最終只會兩頭落空 Google 現在總算承認這件事直接給兩條獨立產品線

8t 吃帶寬 8i 吃併發這對應的就是「我要一次餵十億 token」跟「我要一百個 agent 同時醒著」

我在自己的工地伺服器用 n8n 跑報價 agent 目前卡在 5070Ti 只能同時開 12 個 session 再多就 OOM 如果 8i 真如官方講的針對高併發 inference 優化那我的 CrewAI 影片工廠就能把字幕 TTS 全部搬上去

但這裡有個前提：價格表還沒出 Google 歷來 TPU 都是先放消息再鎖高端客戶我不會傻傻預約等配額沒看到 hourly rate 前一切觀望

真正讓我心動的是 8i 的推理優化方向跟我去年踩的坑完全一致本地 9B 工具調用再快也頂不住百個 agent 並發這顆晶片如果真能落地我第一個就把 blog.one-wall.art 的靜態生成搬到雲端

有誰已經申請 early access？實測併發到底能撐幾隻 agent？

相關文章