🔥 WCTC S8 全球交易賽正式開賽!
8,000,000 USDT 超級獎池解鎖開啟
🏆 團隊賽:上半場正式開啟,預報名階段 5,500+ 戰隊現已集結
交易量收益額雙重比拼,解鎖上半場 1,800,000 USDT 獎池
🏆 個人賽:現貨、合約、TradFi、ETF、閃兌、跟單齊上陣
全場交易量比拼,瓜分 2,000,000 USDT 獎池
🏆 王者 PK 賽:零門檻參與,實時匹配享受戰鬥快感
收益率即時 PK,瓜分 1,600,000 USDT 獎池
活動時間:2026 年 4 月 23 日 16:00:00 - 2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即參與:https://www.gate.com/competition/wctc-s8
#WCTCS8
AI 時代,Token 供需戰爭的終極推演
編者按:在 AI 模型能力持續躍進、Claude Code、Cursor 等工具被企業大規模接入的背景下,行業討論正從「模型有多強」轉向「模型如何進入生產」。但當 AI 編程、自動化分析和數據建模逐漸成為新的共識,一個更底層的問題開始浮現:當執行成本被快速壓低,真正稀缺的究竟是人力、資本,還是對前沿模型和 token 的使用權?
本文整理自 Patrick O’Shaughnessy 與 SemiAnalysis 創始人 Dylan Patel 的一場對談。Dylan 長期關注 AI 基礎設施、半導體供應鏈與模型經濟學,在這場對話中,他從自身公司 Claude Code 支出暴漲出發,討論了 AI 如何改變企業組織、信息服務、token 需求、算力供應鏈以及社會情緒。
這場對談最值得關注的,不是某個模型又一次刷新 benchmark,而是它提供了一種理解 AI 經濟的方式——把 AI 看作一種正在重新分配執行能力、組織效率和產業利潤的生產系統,而不只是一次軟體工具升級。
這場對談大致可以從五個角度理解。
首先,是執行成本被打穿。 過去,想法並不稀缺,真正困難的是把想法變成產品、系統和可交付服務。現在,Claude Code 讓非技術人員也能寫代碼、搭應用、做數據分析,原本需要一個團隊長期維護的工作,開始由少數人借助模型完成。SemiAnalysis 的 Claude Code 年化支出已經達到 700 萬美元,超過其薪資支出的四分之一,這說明 AI 不再只是提效工具,而正在變成企業新的生產資本。
其次,是信息服務行業最先被重寫。 Dylan 所在的業務本質上是出售分析、諮詢和數據集,而這正是最容易被 AI 商品化的領域。芯片逆向分析、能源電網建模、宏觀經濟指標搭建,過去可能需要一個團隊長期投入,現在可以由少數人在幾周內搭出可用產品。這意味著,AI 對信息服務公司的壓力不是「是否會取代人」,而是「誰能更快重做同行的產品」。不採用 AI 的公司會被更快的公司商品化,而採用 AI 的公司也必須持續提高標準,避免被下一批更高效的競爭者反向取代。
更深一層,是 token 正在變成新的生產資料。 過去企業購買軟體訂閱,核心問題是工具是否好用;現在,前沿模型的訪問權、rate limit、企業合同和 token 預算,開始直接決定生產能力。越強的模型並不一定意味著更高成本,因為更聰明的 token 可能用更少步驟完成更高價值的任務。真正的競爭,正在從「誰使用 AI」轉向「誰能拿到最強模型,並把最昂貴的 token 用在最高價值的場景」。
這種需求還會繼續傳導到整條供應鏈。 token 使用量暴漲,最終會變成對 GPU、CPU、內存、FPGA、PCB、銅箔、半導體設備和晶圓廠資本開支的持續壓力。文中提到的「牛鞭效應」正是這一邏輯:下游看似只是模型調用需求增加,傳到上游卻可能變成數倍放大的訂單、擴產和漲價。AI 產業的利潤分配因此不會只停留在模型公司和 NVIDIA,而會沿著半導體與數據中心供應鏈繼續外溢。
最後,是 AI 的社會反彈可能提前到來。 當 AI 真正進入工作流程,公眾對崗位替代、能源消耗、數據中心擴張和權力集中的擔憂也會同步上升。Dylan 甚至預測,三個月內可能出現針對 AI 的大規模抗議。對模型公司來說,繼續強調「AI 將改變世界」未必能緩解焦慮,反而可能強化普通人對失控感的想像。AI 行業接下來需要證明的,不只是技術能力,而是它如何在當下創造具體、可感知的公共價值。
如今,AI 的核心問題,正在從「模型能做什麼」轉向「誰能獲得模型、如何使用模型,以及誰能捕獲模型創造的價值」。在這個意義上,本文討論的對象已經不只是 Claude Code、Anthropic 或某一家 AI 公司,而是一場圍繞生產力、資本開支、組織效率和社會接受度展開的結構性重排。
以下為原文內容(為便於閱讀理解,原內容有所整編):
TL; DR
· AI 的核心變數正在從「能不能做」轉向「值不值得做」,執行成本驟降後,真正稀缺的是能被模型放大的高價值想法。
· Claude Code 支出占薪資成本 25% 只是開始,AI 正從軟體工具變成企業新的生產資本。
· 前沿模型的競爭不再只是能力競爭,而是 token 取得權競爭;誰能更早、更穩定地拿到最強模型,誰就可能形成新的商業壁壘。
· 信息服務行業會最先被 AI 重構,因為數據、分析和研究的生產成本正在快速下降,慢公司會被更快的公司商品化。
· Token 需求不會因為舊模型降價而放緩,因為每一次模型變強,都会釋放新的高價值用例,並把用戶推向更貴的前沿模型。
· AI 帶來的最大變化不是讓人少工作,而是讓少數人用同樣時間完成數倍產出;不能創造並捕獲 token 價值的人,會被鎖在「永久底層」。
· 算力短缺正在向整個半導體供應鏈擴散,從 GPU、CPU、內存到 PCB、銅箔和設備廠商,AI 需求已經變成全產業鏈的價格推力。
· AI 的經濟價值很難被傳統 GDP 捕捉,真正的問題不只是模型公司賺了多少錢,而是 token 生成的決策、效率和連鎖影響究竟創造了多少「幽靈 GDP」。
訪談原文:
Claude Code 成了新勞動力
Patrick O’Shaughnessy(主持人):
你之前跟我講過一個很精彩的故事,是關於你們團隊今年在 token 使用量上的巨大變化。你能再講一遍嗎?它讓你對這個世界正在發生什麼有了什麼理解?
Dylan Patel(SemiAnalysis 創始人):
去年,我們以為自己已經是 AI 的重度用戶了。每個人都在用 ChatGPT,每個人都在用 Claude,我也給團隊提供他們想要的各種訂閱。那時候,公司在這方面的支出大概是幾萬美元級別。
但今年,支出開始飆升。真正的起點大概是在去年 12 月底,隨著 Opus 的出現。這裡面也包括 Doug,也就是我們的總裁 Douglas Lawler。他基本上是在帶頭推動非技術人員用 AI 寫代碼。可以說,他一點點把整個公司都帶進去了。當然,工程師本來就在用,但從今年 1 月開始,我們的支出明顯拐頭向上,然後迅速爆發。
我們後來和 Anthropic 簽了企業合同。上次我跟你聊的時候,我們的年化支出大概是 500 萬美元;現在已經到了 700 萬美元。
Patrick O’Shaughnessy:
而且那還是上周的數字。
Dylan Patel:
對,其中很大一部分就是使用量本身。真正有意思的是,以前從來沒寫過代碼的人,現在也在用 Claude Code,而且有些人一天就能花掉幾千美元。但從公司整體來看,我們現在每年在 Claude Code 上的支出已經到了 700 萬美元,而我們的薪資支出大概是 2500 萬美元。也就是說,Claude Code 的支出已經超過薪資支出的 25%。
如果這個趨勢繼續下去,到年底它甚至可能超過薪資總額的 100%。這有點嚇人。幸運的是,我現在並不需要在「人」和「AI」之間二選一,因為公司增長很快。更像是:我不需要那麼快招人,但可以在 AI 上花更多錢,而且它確實有效,公司也能增長得更快。
但我覺得,其他公司遲早也會開始面對這個問題:如果一個人用 Claude Code 就能完成 5 個、10 個、甚至 15 個人的工作,那接下來怎麼辦?第一,可能確實應該裁人;第二,目前這些使用場景又非常廣泛。
舉個例子,我們在俄勒岡有一個逆向工程實驗室,已經建設了一年半。裡面有很多高端設備,比如顯微鏡、掃描電子顯微鏡。這個實驗室的核心用途是逆向分析芯片,提取芯片架構,分析其製造所使用的材料。這些也是我們出售的數據之一。
但分析這類數據過去是一個非常緩慢的過程。現在,我們團隊裡有一個人,只花了幾千美元的 Claude token,就做出了一個應用。這個應用可以進行 GPU 加速,跑在我們放在 CoreWeave 的伺服器上。我們只要發給它一張芯片圖片,它就能自動在圖像上標出每一種材料的位置:這裡是銅,這裡是钽,這裡是鍺,這裡是钴。然後你就可以非常快速地對整個芯片堆疊結構進行有限元分析,而且是可視化的,還有完整的圖形界面和儀表盤。
這個人以前在英特爾工作過,他說,在過去,這本來是一個完整團隊要做和維護的事情。現在類似的事情放到整個公司來看,簡直不可思議。
還有一個我覺得特別有意思的例子,是 Malcolm。他以前是一家大銀行的經濟學家。那家銀行的經濟學部門可能有 100 到 200 人。他現在做出來的東西非常驚人。
他把各種數據都接了進來,包括 FRED 數據、就業報告,以及其他來自不同 API 的數據集。我們也和一些數據供應商簽了合同,拿到了 API 訪問權限。然後他把所有數據拉進來,開始跑回歸,分析不同經濟變化對經濟的通脹或通縮影響。
美國勞工統計局有一整套任務分類,大概有 2000 項任務。Malcolm 用 AI 去評估:哪些任務現在可以由 AI 完成,哪些不能,並按照一套 rubric 給它們打分。結果顯示,大概有 3% 的任務現在已經可以用 AI 完成。
於是他創造了一個指標,用來衡量哪些事情可以被 AI 完成,以及當這些事情被 AI 完成時,會帶來多大的通縮效應。產出可能會上升,但因為成本下降得太厲害,理論上 GDP 反而可能收縮。他把這個叫作「幽靈 GDP」(Phantom GDP)。
他基於這個概念做了一整套分析,還建立了一個全新的語言模型 benchmark,包含大約 2000 個 eval。
Patrick O’Shaughnessy:
這些都是他一個人做的?
Dylan Patel:
對,全部是他一個人做的。他跟我說:「兄弟,這在以前得是一個 200 人的經濟學家團隊花一年時間才能完成的事。」他現在完全沉浸在 Claude 里,說一切都變了。
Patrick O’Shaughnessy:
作為一個企業經營者,你怎麼理解這件事?你們從幾乎沒有這項支出,變成現在它已經接近薪資支出的 25%,而且還在繼續上升。到了什麼節點你會覺得:等等,我是不是該踩刹車了?是不是該控制一下支出?也許我們不需要總是用今天剛發布的最前沿模型,比如 Opus 4.7,而是可以換成更便宜一點的模型?
Dylan Patel:
歸根結底,我做的是信息生意。我們賣的是分析,做諮詢,也創建數據集。我看不到有什麼理由認為這些東西不會在相當快的速度下被完全商品化。
如果我不持續改進,我最早賣的第一個數據產品,現在已經有更多人開始做類似的事情了。我們之所以還能賣出去,是因為我們不斷把它做得更好、更細。但我們在 2023 年做這件事的方式,其實和現在其他人正在做的方式已經沒有特別大的區別了。如果我不繼續提高標準,我就會被商品化。如果我動作不夠快,我也會失去優勢。
所以問題是:是的,AI 會商品化很多東西,就像它正在商品化軟體一樣。但那些行動足夠快、能掌握客戶關係、持續提供優秀服務並不斷改進服務的人,不會萎縮,反而會增長得更快。那些無能、什麼都不做的人會輸。
所以這其實有點像一個生存問題:如果我不採用 AI,別人就會採用,然後他們會打敗我。
另一個很簡單的例子是能源領域。我們過去一年左右一直有幾位能源分析師,試圖搭建一個能源模型。這個模型非常複雜,而能源數據服務市場大概有 9 億美元規模,所以它顯然是一個我很想進入的巨大市場。但儘管我們團隊已經有人做了一年,我們其實並沒有真正切入能源數據服務業務。
然後,「Claude Code 精神病」來了。我們有一位負責數據中心能源與工業業務的人,叫 Jeremy。他開始使用 Claude Code 之後,情況突然變了。三周時間裡,他花了很多錢,一天大概能花 6000 美元,確實非常誇張。但他抓取了美國每一座發電廠、每一條高於某個電壓等級的輸電線路,並從各種公開數據源裡建立了整個美國電網的地圖,同時還接入了很多需求側數據。
我們把它做成了一個儀表盤,可以查看和分析美國各個微區域的電力短缺和過剩情況,以及很多細節。這個東西幾周之內就搭起來了。
後來我們把它展示給一些已經購買我們數據中心數據集的客戶,其中也包括能源交易員。他們看完之後說:「哇,這個做了多久?這很不錯,比某某公司還好。」然後我們進一步了解,發現那個「某某公司」有 100 人,已經在這件事上做了十年。
當然,我們現在的產品還沒有他們那麼完整、那麼穩健,但在某些方面,它已經更好了。所以我現在是在商品化這些能源數據服務公司。但反過來,如果我不跑得更快,誰又會來商品化我?
所以,從企業主的角度看,問題不是「我是不是花了很多錢」。是的,我確實花了很多錢。但問題是,這些錢給我帶來了什麼?它有沒有帶來更多收入?如果答案是有,那這筆錢就是值得的。
Patrick O’Shaughnessy:
你會不會擔心,到最後,那些控制資本、負責投資資本的人,也就是那些經常因為你們做的事情而雇用你們的人會說:「我們自己也有分析師,而且他們也很聰明,我們乾脆自己做不就好了?」如果這件事變得這麼容易,那麼在什麼節點上,它會不會全部回流到投資機構內部?畢竟它們最有可能從這些數據和洞察中獲得最大槓桿。
Dylan Patel:
首先,任何信息服務業務本質上都是這樣:我從一條信息中獲得的價值,顯然沒有客戶從這條信息中獲得的價值大。
如果我以 1 美元的價格把信息賣給你,你之所以願意花這 1 美元買,是因為你知道這條信息能幫助你做出一個決策,而這個決策能讓你賺到超過 1 美元。也就是說,你獲得了套利機會。你從我這裡賺到的錢,比我通過賣這條信息賺到的錢更多。
投資基金本身當然也有自己的信息服務能力。尤其是像 Jane Street、Citadel 這類機構,它們在數據方面非常細,非常深入。但這些機構依然會購買我們的數據,而且還在繼續購買,並且和我們的合作還在增長。
我覺得這裡面有某種「it factor」。我們行動更快,更靈活,團隊更小,而且專注在一個非常具體的領域:AI 基礎設施,以及它所引發的巨大變革,包括 AI、token 經濟和相關的一整套東西。我們能更早看到方向,也能更快搭建東西。
所以,投資專業人士當然會嘗試自己做一些我們做的事情。但更多時候,他們會直接購買我們的數據,然後在此基礎上繼續構建。對他們來說,買我們的數據再往上做,通常比自己從零開始搭建更便宜。當然,最終肯定也會有人嘗試自己做。
Token 變成新的生產資料
Patrick O’Shaughnessy:
我覺得每次和你聊天,我最後都會回到同一個問題:token 的供給和需求。現在世界上最讓我感興趣的就是這個。你自己的這些經歷,讓你對需求側有什麼新的理解嗎?當你自己非常切身地感受到這一點之後,你對 token 需求這件事的判斷有變化嗎?
Dylan Patel:
如果我們退一步,從宏觀角度看,Anthropic 的 ARR 可能已經從 90 億美元增長到 350 億、400 億美元左右。等這期節目播出時,也許已經到了 400 億到 450 億美元。
但它們的算力增長並沒有達到同樣的幅度。如果你算一下,並且假設它們沒有減少研發算力——它們顯然沒有減少,因為它們還在發布新模型,比如 Metis、Opus 4、Opus 4.7——那就說明一件事:它們新增的算力,即使全部都投向推理,它們的毛利率下限也在 72% 左右。
現實中,一部分新增算力很可能也進入了研發,所以它們實際毛利率可能還高於 72%。要知道,今年年初有人泄露過它們融資文件中的一部分信息,當時顯示的毛利率大概只有 30% 多。
一個業務到底怎麼才能在這麼短時間裡把毛利率提升到這種程度?原則上,是因為需求太高了。它們可以收緊使用額度、速率限制以及各種限制。真正重要的是,你要有 Anthropic 的客戶經理,要有企業合同,並且能獲得你需要的 rate limit 提升。否則,token 最終一定會變得極度搶手。
誰付得起,誰就能拿到。Anthropic 面對的也是同樣的問題——當然這不算問題,這只是資本主義運作方式的現實。是的,客戶每年可能會向它們支付 400 億美元的 token 費用,但這些 token 在客戶那裡創造的價值,遠遠超過 400 億美元。
不同企業每個 token 所創造的價值不同。但隨著模型越來越智能,真正重要的就變成了:誰能獲得這些最智能的 token,並把它們用在最有價值的事情上。
作為一個人,你要決定的是:怎樣使用這些 token,才能增長業務、創造價值。很多人都會想要 token,也會消耗 token。但那些在舊金山用 Claude 生成軟體產品的普通 SaaS 創業公司,未必真的創造了巨大價值。所以遲早,它們會被 token 價格擠出去。
Patrick O’Shaughnessy:
我今天在飛來的路上就遇到了這個情況。Opus 4.7 一發布,我立刻就想用 4.7,而且是馬上用。結果我被限流了,根本用不了。我甚至已經沒法再想像繼續用 4.6 了,雖然過去幾周我一直很滿意 4.6,它明明已經很強了。
你會驚訝於人們這麼執著地想使用最貴、最前沿的模型嗎?
Dylan Patel:
完全不驚訝。我過去一個半月裡最搞笑的記憶之一,就是我和我的朋友 Leopold 一起,幾乎跪在 Anthropic 聯合創始人面前,求他給我們 Metis 的訪問權限。
我們知道它存在,所以我們就說:「拜託,讓我們用一下吧。」然後他說:「我不知道你們在說什麼。」
Patrick O’Shaughnessy:
當那個價格表,或者說 eval card 出來的時候,你是什麼反應?
Dylan Patel:
其實在灣區之前就有傳聞,我們大概知道它應該會非常強。如果你看 benchmark,當然 benchmark 會不斷變化,但 Mephisto / Metis 很可能是過去兩年裡模型能力最大的一次躍升。
我覺得這一點非常重要:它強到 Anthropic 甚至不想完全發布它。儘管它們已經向部分客戶公布了價格,並且進行了選擇性發布,比如面向網路安全相關場景。它的 token 成本可能是 5 倍甚至 10 倍,但它們仍然不想全面放出來,因為擔心它對現實世界造成的影響。
所以現在放給我們的,是一個更差、更弱的版本,也就是 Opus 4.7。而且它們在模型卡裡明確說了:我們實際上在網路安全能力上有意做了更差的預優化。不知道你有沒有讀到那部分。
所以我想說的是:無論你是誰,只要你有足夠資本,你就應該去買 Anthropic 的企業訂閱,按 token 付費,而不是用那些普通訂閱。因為這樣你就不會那麼容易被限流。
然後你必須想清楚:怎樣把這些 token 用在最高價值的任務上,並從中賺錢。因為從根本上說,也許一年後、兩年後,很多生意本質上就是在做 token 套利。token 很強大,但關鍵是你要知道把它們指向哪裡。
再往後三四年,模型自己可能就會知道應該如何使用 token,如何創造最大價值。
如果你回頭看任何一個 benchmark,就會發現:過去達到某個能力層級需要的成本是 X,現在可能只需要原來的百分之一,甚至千分之一。比如 DeepSeek 達到 GPT-4 級別能力時,成本大概是 GPT-4 的六百分之一。此後,GPT-4 級模型的成本還在繼續下降。
當然,現在已經沒有人真的在乎 GPT-4 級模型了。大家想要的是前沿模型,因為前沿模型才能創造真正有經濟價值的東西。不過,GPT-4 級模型仍然可以被用於一些場景,只是那些場景通常更小。
所以真正推動需求的,不是舊能力變便宜了,而是新用例不斷出現。你現在用的是 Opus 4.6 或 Opus 4.7 這一層級的模型。一年後,如果我要獲得今天同等質量的模型能力,我的支出可能只有 7 萬美元,也許會便宜 100 倍。
但這不重要。因為到時候,我一定會使用一個更強的模型,去做更有價值的事情。
Anthropic 的 Metis 作為模型本身更貴,但它完成同一件事所消耗的 token 少得多。所以在大多數任務上,它實際上比 Opus 4.6 更便宜。
Dylan Patel:
因為它效率高得多。即使每一個 token 本身更「聰明」、更貴,它完成任務所需要的 token 數量更少。
Patrick O’Shaughnessy:
上次見你的時候,Metis 可能剛剛發布,或者說模型卡剛剛出來。你當時說,它強到讓你有點害怕。你這句話是什麼意思?
Dylan Patel:
Anthropic 在 2025 年的目標,甚至從 2024 年開始,就是:到 2025 年底,他們希望模型裡能有一個 L4 水平的軟體工程師。整體來說,他們用 Opus 4.6 基本做到了。
但他們沒有說的是,如果你看 Metis,再對比 benchmark,它更像是一個 L6 工程師。L4 大概是相對初級的軟體工程師,而 L6 已經是經驗相當豐富的工程師了。
我記得 Anthropic 說過,這個模型在內部大概從 2 月就可用了。也就是說,兩個月時間裡,它們就從 L4 工程師躍升到了 L6 工程師。那接下來會發生什麼?
當你思考模型進步時,會發現它其實還在加速。Anthropic 的發布節奏在壓縮,OpenAI 的發布節奏也在壓縮。為什麼?因為通常來說,要做出更好的模型,你需要幾個東西。
首先,你需要強大的算力。算力非常昂貴,而且有它自己的時間尺度。我們會跟蹤這些東西,它確實在增長,但短期內基本是已經確定的。你已經簽下來的算力,大體上已經定了。當然,中間會有延遲和調整,也可能想辦法再多弄一點,但整體上是比較固定的。
其次,你需要非常優秀的研究人員。現在公司願意為這些人支付數千萬美元。
最後,是實現能力。歷史上,實現一直非常困難。如果我有一個想法,我還得把它實現出來,而實現是很難的。但現在,想法到處都是,實現變得非常容易。它很貴,但非常容易。
所以問題變成了:一個人要如何決定該實現哪些想法?結果是,當實現變得太容易時,你就可以實現更多想法,在這個跑步機上跑得更快。
這可以發生在 AI 模型研究裡,所以模型發布節奏從過去的六個月縮短到兩個月。也可以發生在其他領域。比如我想把美國每一座發電廠、每一條輸電線路都建模出來,跑回歸,分析微觀區域的供需關係——現在我也可以做。
想法本身是便宜的。關鍵是,哪個想法有意義?哪個想法值得你投入資本,去購買 token,把它實現出來?因為實現能力已經在那裡了。這是最關鍵的變化。
如果實現成本繼續下降——而它確實正在下降——我們甚至還沒有真正拿到 Metis。Opus 4.7 才剛剛發布幾個小時,但我們團隊內部已經非常興奮了。
接下來,這會給世界帶來什麼?我認為它會重新排序經濟運行方式。
過去,執行非常重要,因為執行很難;想法則很便宜。現在,想法不僅便宜,而且非常充足,但執行也變得非常容易。因此,真正值得做的,只剩下那些足夠好的想法——它們能證明,哪怕實現已經極其便宜,你仍然值得為它花錢。
Patrick O’Shaughnessy:
所以你是真的害怕嗎?還是說,它只是引入了一種很難把握的不確定性?
Dylan Patel:
不確定性肯定存在。但我確實覺得,這會帶來某種恐懼。問題在於,社會要如何重組自己?
當你生活在一個「實現某件事的能力」本身已經沒那麼重要的世界裡,什麼才重要?重要的是,你能否為 AI 選擇正確的想法,讓它去實現;你能否把這個想法賣出去,或者把 AI 實現出來的東西賣出去;你能否為這個方向籌集資本。這些才會變得重要。
這也回到前面那個問題:永遠擁有最新模型非常重要。那誰能獲得最新模型?
Anthropic 有一個項目,我知道它不叫 Earwig,但我喜歡故意叫它 Earwig,來調侃 Anthropic 的人。它們只把 Metis 提供給某些公司,用於網路安全場景。我認為這種事情會持續發生:模型的部署範圍會越來越窄,越來越不面向大眾。
我知道 OpenAI、Anthropic 以及其他公司都會說,他們希望讓所有人都擁有強大的 AI。但 AI 非常昂貴。誰來為數萬億美元的基礎設施買單?是那些有錢,並且能用 AI 構建有用東西的人。
而且,你也不希望別人蒸餾你的模型,所以你不會大範圍發布它。你會把它提供給越來越少的一批客戶。然後,這些客戶之間也會開始爭奪 token。
除非 Anthropic 大幅漲價。它們完全可以把 Opus 的價格翻倍,而我還是會繼續付錢。我敢說,大多數用戶也會繼續付。但我認為,這甚至不能解決它們巨大的產能問題。
所以問題就變成了:這個循環會在哪裡結束?當 token 使用量,以及這些 token 所帶來的額外價值,越來越集中在少數公司手裡,會發生什麼?
我現在沒有 Metis。但誰有?頂級銀行有。現在它們可能只是在網路安全裡使用它,但我能想像一個世界:因為我有 Anthropic 的企業合同,也因為 Anthropic 的人還算喜歡我,所以他們可能願意給我們稍微更早一點的訪問權限,或者稍微更高一點的 rate limit。我當然希望這種事發生。
然後我的競爭對手沒有這些訪問權限,我就可以擊敗他們。
也可能是另一種情況。比如 Citadel 的 Ken Griffin,他人脈極強,也非常有錢。他可能去和 OpenAI 或 Anthropic 簽一個協議,說:「我每年先買 100 億美元的 token。你們每次發布新模型,我先把前 100 億美元的 token 買走,然後其他人再用。」
那會發生什麼?他就可能在市場裡碾壓所有人。
這只是一個例