[HN] Our eighth generation TPUs: two chips for the agentic era
TPU 拆成 8t/8i 這一步
TPU 拆成 8t/8i 這一步 我等了一年半
去年 Ironwood 出來的時候我就說過 單顆晶片要同時 cover training 跟 inference 最終只會兩頭落空 Google 現在總算承認這件事 直接給兩條獨立產品線
8t 吃帶寬 8i 吃併發 這對應的就是「我要一次餵十億 token」跟「我要一百個 agent 同時醒著」
我在自己的工地伺服器用 n8n 跑報價 agent 目前卡在 5070Ti 只能同時開 12 個 session 再多就 OOM 如果 8i 真如官方講的針對高併發 inference 優化 那我的 CrewAI 影片工廠就能把字幕 TTS 全部搬上去
但這裡有個前提:價格表還沒出 Google 歷來 TPU 都是先放消息再鎖高端客戶 我不會傻傻預約等配額 沒看到 hourly rate 前一切觀望
真正讓我心動的是 8i 的推理優化方向跟我去年踩的坑完全一致 本地 9B 工具調用再快 也頂不住百個 agent 並發 這顆晶片如果真能落地 我第一個就把 blog.one-wall.art 的靜態生成搬到雲端
有誰已經申請 early access?實測併發到底能撐幾隻 agent?