2026-04-24 15:50:23
4月24日,在OpenAI發(fā)布GPT-5.5幾小時(shí)后,DeepSeek-V4(預(yù)覽版)發(fā)布。其用雙版本配置推進(jìn)大模型價(jià)格戰(zhàn),V4-Flash輸出價(jià)僅為GPT-5.5 Pro的1.55‰,Pro版性能比肩頂級(jí)閉源模型。V4通過新注意力機(jī)制和同策略蒸餾技術(shù)降低成本,針對(duì)Agent場(chǎng)景優(yōu)化,Pro版增強(qiáng)Agent能力,F(xiàn)lash版經(jīng)濟(jì)高效,為Agent規(guī)?;涞靥峁┏杀窘鉀Q方案。
每經(jīng)記者|蘭素英 每經(jīng)編輯|王嘉琦
等了15個(gè)月,今天(4月24日),DeepSeek-V4(預(yù)覽版本)終于發(fā)布了,而且是在OpenAI發(fā)布GPT-5.5幾個(gè)小時(shí)后。
在約1000字的DeepSeek-V4產(chǎn)品介紹文章中,Agent(智能體)一詞出現(xiàn)了多達(dá)11次。
DeepSeek-V4用專家模式(Pro)和快速模式(Flash)雙版本配置,將大模型價(jià)格戰(zhàn)從“聊天便宜”推進(jìn)“Agent便宜”時(shí)代。

DeepSeek-V4憑借全新稀疏注意力與同策略蒸餾技術(shù),把推理成本壓到新低,V4-Flash版輸出價(jià)僅為GPT-5.5 Pro的1.55‰,V4-Pro版性能比肩全球頂級(jí)閉源模型。
“低價(jià)快模型 + 高價(jià)強(qiáng)模型”組合,讓DeepSeek-V4打通了Agent規(guī)?;涞氐某杀举~。
DeepSeek-V4發(fā)布后不久,全球最大AI模型應(yīng)用程序編程接口聚合平臺(tái)OpenRouter上,就已經(jīng)有用戶進(jìn)行了調(diào)用。截至4月24日15點(diǎn),OpenRouter平臺(tái)上DeepSeek-V4-Pro的調(diào)用量達(dá)到2.99億Token,V4-Flash調(diào)用量達(dá)到3.99億Token。

DeepSeek延續(xù)了一貫的“普惠”風(fēng)格。
V4-Flash:緩存命中輸入0.2元/百萬Token,緩存未命中輸入1元/百萬Token,輸出2元/百萬Token。
V4-Pro:緩存命中輸入1元/百萬Token,緩存未命中輸入12元/百萬Token,輸出24元/百萬Token。

然而,不同于公司官方的API定價(jià),OpenRouter平臺(tái)會(huì)綜合不同服務(wù)商渠道報(bào)價(jià),按照各渠道實(shí)際調(diào)用流量加權(quán)計(jì)算得出的市場(chǎng)綜合均價(jià),也就是實(shí)際使用價(jià)格,該價(jià)格也會(huì)隨時(shí)變動(dòng)。
《每日經(jīng)濟(jì)新聞》記者統(tǒng)計(jì)OpenRouter數(shù)據(jù)發(fā)現(xiàn),截至4月24日13:30,本周調(diào)用量領(lǐng)先的國(guó)內(nèi)外主流AI大模型中,DeepSeek-V4-Flash的成本優(yōu)勢(shì)突出,每百萬Token的平均輸出價(jià)低至0.279美元,僅為OpenAI新發(fā)布的GPT-5.5 Pro(180美元)的1.55‰。
Anthropic Claude Opus系列、OpenAI GPT-5.4,以及谷歌Gemini 3.1 Pro Preview等大模型的輸出價(jià)格均在12~25美元區(qū)間,是DeepSeek-V4-Flash的數(shù)十倍。


在輸入端,DeepSeek-V4-Flash每百萬Token平均輸入價(jià)僅為0.07美元,只略高于階躍星辰Step 3.5 Flash的0.031美元,顯著低于其他國(guó)內(nèi)外主流大模型。
值得一提的是,業(yè)界一直在關(guān)注DeepSeek-V4是否會(huì)使用國(guó)產(chǎn)算力。DeepSeek在產(chǎn)品介紹文章中用小字表示,受限于高端算力,目前V4-Pro的服務(wù)吞吐十分有限,預(yù)計(jì)下半年昇騰950超節(jié)點(diǎn)批量上市后,V4-Pro的價(jià)格會(huì)大幅下調(diào)。
DeepSeek-V4是如何實(shí)現(xiàn)低價(jià)的?
DeepSeek在58頁(yè)的技術(shù)報(bào)告《DeepSeek V4:邁向高效的百萬Token上下文智能》提到,V4開創(chuàng)了一種全新的注意力機(jī)制,在Token維度進(jìn)行壓縮,結(jié)合DSA稀疏注意力(DeepSeek Sparse Attention),相比于傳統(tǒng)方法大幅降低了對(duì)計(jì)算和顯存的需求。
這條路線和V3.2是一脈相承的。V3.2-Exp去年9月第一次引入DSA時(shí),就把推理成本腰斬過一次。
真正讓V4和V3.2在方法論上分岔的,是post-training(后訓(xùn)練)。技術(shù)報(bào)告中提到,V3.2的mixed RL(混合強(qiáng)化學(xué)習(xí))階段在V4被整體替換成了 On-Policy Distillation(同策略蒸餾)。
新的流水線分兩段。先分別訓(xùn)練幾十個(gè)領(lǐng)域?qū)<夷P?,覆蓋數(shù)學(xué)、代碼、Agent、指令跟隨,產(chǎn)出一個(gè)在各個(gè)領(lǐng)域內(nèi)極強(qiáng)的“偏科生”。
在第二階段,把十幾個(gè)“教師模型”蒸餾到一個(gè)“學(xué)生模型”里。這種“先分頭培養(yǎng)專家、再合并成通才”的路線,DeepSeek在報(bào)告里直接點(diǎn)名參考了思維機(jī)器實(shí)驗(yàn)室去年10月的on-policy distillation工作。
AI的使用場(chǎng)景已經(jīng)從對(duì)話進(jìn)入Agent。
OpenRouter與a16z聯(lián)合發(fā)布的《2025 AI使用報(bào)告》覆蓋超100萬億Token的匿名元數(shù)據(jù),里面有一組數(shù)據(jù)極其關(guān)鍵——編程任務(wù)的Token占比從2025年初的11%飆到了50%以上,成為平臺(tái)最大的單一使用品類。同時(shí),Agent驅(qū)動(dòng)的工作流產(chǎn)生的輸出Token已超過平臺(tái)總輸出的一半。
過去的問答式AI,一輪對(duì)話消耗幾百到幾千Token,用戶不再提問,Token就不會(huì)再消耗。Agent模式下,機(jī)器可以持續(xù)在后臺(tái)跑流程。極端假設(shè)Agent全天候運(yùn)行,每天吞掉數(shù)十億Token。
因此,中國(guó)開源模型陣營(yíng)幾乎所有頭部玩家都把Agent作為主攻方向,從架構(gòu)到訓(xùn)練全鏈路為Agent場(chǎng)景做原生適配。
但光便宜不夠,在這一輪真正拉開差距的,要在Agent場(chǎng)景下“跑得好”。
在此背景下,DeepSeek-V4似乎正是為Agent而研發(fā)的。DeepSeek在1000字的V4產(chǎn)品介紹文章中,Agent一詞出現(xiàn)了多達(dá)11次。
價(jià)格較高但能力強(qiáng)的V4-Pro與快捷高效且價(jià)格便宜的V4-Flash的組合拳,恰好符合Agent的場(chǎng)景。
DeepSeek稱,V4-Pro性能比肩頂級(jí)閉源模型,而V4-Flash是更快捷高效的經(jīng)濟(jì)之選。

● Agent能力:相比前代模型,DeepSeek-V4-Pro的Agent能力顯著增強(qiáng)。在Agentic Coding評(píng)測(cè)中,V4-Pro已達(dá)到當(dāng)前開源模型最佳水平,并在其他Agent相關(guān)評(píng)測(cè)中同樣表現(xiàn)優(yōu)異。目前DeepSeek-V4已成為公司內(nèi)部員工使用的Agentic Coding模型。
● 世界知識(shí):DeepSeek-V4-Pro在世界知識(shí)測(cè)評(píng)中,大幅領(lǐng)先其他開源模型。
● 推理性能:在數(shù)學(xué)、STEM、競(jìng)賽型代碼的測(cè)評(píng)中,DeepSeek-V4-Pro超越當(dāng)前所有已公開評(píng)測(cè)的開源模型,取得了比肩世界頂級(jí)閉源模型的優(yōu)異成績(jī)。
相比V4-Pro,V4-Flash在世界知識(shí)儲(chǔ)備方面稍遜一籌,但展現(xiàn)出了接近的推理能力。而由于模型參數(shù)和激活更小,相較之下V4-Flash能夠提供更加快捷、經(jīng)濟(jì)的API服務(wù)。
在Agent測(cè)評(píng)中,DeepSeek-V4-Flash在簡(jiǎn)單任務(wù)上與DeepSeek-V4-Pro旗鼓相當(dāng),但在高難度任務(wù)上仍有差距。
普通任務(wù)調(diào)用V4-Flash等低價(jià)模型,高難任務(wù)才調(diào)用V4-Pro。對(duì)DeepSeek來說,未來不是單純比誰最強(qiáng),而是比綜合任務(wù)成本。
所以,V4-Flash的意義不是“便宜一點(diǎn)”,而是把Agent場(chǎng)景,變成可以算賬的生意。
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
封面圖片來源:蘭素英
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP