3 月 1 日,在貫串五天開源日之后,DeepSeek 又來了一個" One More Thing ",并扔下一枚"核彈"——在共享了其基礎門徑里極為重要的 EP(多各人并行)組件代碼的同期,也初次公開了它的利潤率。憑證 DeepSeek 公開的信息盤算,它表面上一天的總收入為 562027 好意思元,老本利潤率高達 545%。
這是 DeepSeek 對它的"盈利才氣"的最徑直的一次文書。自從 DeepSeek R1 成了現象級的話題后,對它模子才氣的質疑徐徐湮滅,但對它的高性價比和模子背后的老本,以及由此帶來的"燒錢"問題,依然有不少質疑。有硅谷從業者稱,這次公布的數據會再次讓英偉達們一夜難眠,讓從業者驅動新的反想。
而在國內 AI 鴻溝,這次蹙迫的開源帶來的影響則以另一種愈加重烈的花式呈現了出來——它激勉了一場兩家中國 AI Infra 公司之間的"血案"。
尤洋與袁進輝的爭論
事件的兩個主角,一方是尤洋過甚創辦的潞晨科技,另一方是袁進輝過甚創立的硅基流動。
先是 DeepSeek 的這篇時期共享在知乎發布后,不少用戶驅動 @尤洋,讓他點評。這是因為此前在 DeepSeek 被各家作事商爭相部署的飛揚里,他是最積極的反對聲息之一。此前尤洋曾在酬酢平臺上盤算過部署 DeepSeek 的老本和收益,并得出論斷,部署 DeepSeek 并提供作事的 AI Infra 公司,齊是在虧錢,況且是"月虧四億"。
他提到:短期內,中國的 MaaS(模子即作事)模式可能是最差的營業模式,大廠互相卷廉價和免費,滿血版 DeepSeek R1 每百萬 token(輸出)只收 16 元。如果逐日輸出 1000 億 token,基于 DeepSeek 的作事每月的機器老本是 4.5 億元,失掉 4 億元;用 AMD 芯片月收入 4500 萬元,月機器老本 2.7 億元,這意味著失掉也跨越 2 億元。
這次 DeepSeek 的開源周并非要文書某個具體質疑,但其公布的利潤率之高,顯著與這個盤算實足違犯。東談主們率先意象了尤洋。尤洋也在四個小時后發文文書,稱 DeepSeek 官方這一盤算模范不行用于 MaaS 盈虧評估。在詮釋注解中,他賡續了"基于大模子的 Mass 作事不收獲"的態度。
緊接著,他的潞晨科技告示將在一周后停供 DeepSeek API。
而另一家 AI Infra 公司硅基流動的首創東談主袁進輝也在商討中被許多東談主提到。在 DeepSeek 春節時代絕對出圈走紅后,硅基流動是國內最早一批活動起來提供部署作事,聯絡住 DeepSeek 帶來的需求的公司之一。而流量之大,讓這家公司不僅進展出圈,也在經由中出現一些爭議,包括它此前提供的保舉"反傭"式的優惠被快速薅羊毛,收費作事與免費作事的轉換等。但骨子上,袁進輝和硅基流動是治服快速跟進并提供 DeepSeek 的 MaaS 作事是此刻最正確的決策。
因此尤洋當初的品評也就指向了這家同業公司。彼時,袁進輝與尤洋就如故有過一輪"交鋒",前者合計失掉 4 億的盤算模范有誤,因為使用了謬妄的架構進行忖度。而尤洋徑直文書:"弄 400 臺機器,望望逐日能否輸出 1000 億滿血 DeepSeek R1 token,讓我望望。"
而這次 DeepSeek 官方徑直"讓東談主看到"了這是可行的。袁進輝也在 DeepSeek 著作發布一小時后就火速指摘談,"又顛覆了許多東談主的證據",他合計"許多供應商作念不到這個水平"," MaaS 能否凱旋,重要在于時期實力和用戶基礎。"
"誰作念不到,誰即是技不如東談主"的含義,盡在不言中。
而緊接著更戲劇化的隔空對決驅動了。尤洋隨后徑直發了一篇徑直品評硅基流動這家公司的著作。《坑東談主的硅基流動》(現已刪除)一文將炮火從時期爭論轉向徑直對對方的襲擊。此時話題中樞也從 DeepSeek 的利潤,轉向了兩家公司之間的恩仇情仇。袁進輝也第一時候文書,一方面強調了硅基流動一系列動作背后的想路,另一方面徑直抖出"潞晨代碼抄襲"的舊案。但這兩個顯得齊有些沖動的爭論,后齊已刪除。
這些爭論也在知乎等時期東談主員連合的平臺上激勉了世俗的延展商討,AI Infra 公司貧困的我方釀成了行業熱議話題的主角。
到底誰算的對?
在這場爭論中,到底奈何盤算,以及由不同盤算模范而得出的 AI Infra 是否是巨虧的生意,是第一個中樞議題。
在上周的貫串五天,DeepSeek 剛剛發布了五項中樞時期,涵蓋盤算優化、通訊加快和存儲架構等鴻溝,簡直將我方的中樞 AI Infra 時期全部公布開來,大幅緩助了大模子訓推硬件后果。而在 DeepSeek 的這篇《DeepSeek-V3/R1 推理系統概覽》著作里,又進一步揭示了這些時期和部分是奈何拼裝聯系在一齊的,十分于一個串聯式的追想內容。據先容,DeepSeek 使用了大限制跨節點各人并行(EP)的模范,并通過一系列時期計謀,最猛進度地優化了大模子推理系統,結束了驚東談主的性能和后果。
在著作的末尾,DeepSeek 以表面老本和利潤盤作為為句號,為這次以開源降本為中樞方針的開源周,畫下了一個無缺的句號:假設 GPU 租借老本為 2 好意思元 / 小時,總老本為 87072 好意思元 / 天;如果統統 tokens 全部按照 DeepSeek R1 的訂價盤算,表面上一天的總收入為 562027 好意思元 / 天,老本利潤率為 545%。
其中,DeepSeek 的盤算方式如下:
這里 DeepSeek 說的很知道:
一老本只核算了等量租用 GPU 的用度,硬盤、存儲、內存 CPU、東談主力運維齊被莫得被盤算;
二收入卻將 APP、網頁、API 破費的統統 Token(to C 和 to B 的總破費量)加在了一齊,均按照 API(to B)的價錢盤算,表面上一天老本利潤率是 545%。
事實上,這真是是一個典型的量化格調的"最大可能性"推算,咱們齊知談,DeepSeek 的 APP 和網頁是實足免費的,同期也并不保證調換的用戶體驗。然則假如 DeepSeek 向用戶按照 API 的價錢收費,他的收入后勁不錯達到上述金額。
也即是說,DeepSeek 盤算的是"我作為一個大模子廠商,我若是想,我不錯賺到這樣錢。"
是以,從這個角度來看,自后尤洋合計"這篇著作中的數據對盤算 MaaS 老本莫得任何參考價值",也不不測旨。
畢竟 MaaS 是典型的企業作事,而企業的第一準求并不是性能而是雄厚,而為了保證雄厚性,云廠商的特色即是彈性伸縮、按需取用,是以必須準備實足大冗余。
DeepSeek 算的是一筆"昔時的賬",而 MaaS 平臺如果要保證異日的雄厚,尤洋也給出了談論比例,必須時時刻刻有 5 倍的機器迥殊為了饜足客戶的需求,這里咱們需要研討一朝部署的集群過大、使用后果、運腳、用電的老本將指數級的高潮。
尤其在如今各家 MaaS 平臺用戶的使用數目齊珍稀,莫得方針作念到削峰填谷資源高效愚弄的前提下,MaaS 廠商是很有可能虧本的。
追想一下,表面上(相稱遐想化,一東談主吃飽全家不餓的前提下),DeepSeek 的利潤率不錯達到,但研討到實踐的使用情況和大限制之后的優化老本,就很有可能虧錢了。
那么問題又來了,為什么部署 DeepSeek 虧本,而 DeepSeek 我方的推理卻收獲?
這個問題的謎底藏在袁進輝的回復中:目下許多供應商作念不到這個水平,主若是 V3/R1 架構和其他主流模子的離別太大了,MaaS 廠商需要按照 DeepSeek 的文書調,才能達到最佳的后果。
這里需要補充一個前提是,昔時的云廠商所締造的 IaaS 層是以 CPU 為中樞的作事器集群,而高效的推理需要以 GPU 為中樞完成并行盤算。原來的 MaaS 用來生成問題不大,但 R1/V3 所吸收的疏淡架構,對云來說是一個新的挑戰,需要特調以進行適配。
MaaS 廠商們低估了 DeepSeek 模子架構的復雜性,用老一套來復古新模子,顯著出現了性能不及的陣痛。而大模子一體機由于不錯徑直轉變到硬件層,大略憑證 DeepSeek 來迥殊定制型號,因此比 MaaS 提供的模子的性能和雄厚性齊更高,近期,硅基流動也與華為昆侖伸開了融合,推出 DeepSeek 一體機,嘗試處置推感性能不及的問題。
但 DeepSeek 不僅深諳我方的模子架構,作念了軟件算法層的調優,以至將算力壓縮到了優化芯片層,以"榨干"每一滴性能。
幸而在剛剛昔時的開源周里,DeepSeek 開源了奈何提高推理后果的 5 個模塊,表面上惟有隨著作念,接下來其他 MaaS 廠商也能復現出來。
是以,AI Infra 公司們的異日在那兒?
這些爭論背后,AI Infra 公司們再次被群眾真貴到。作為提供底層基礎門徑作事的公司,它們此前從來不是外界見原的焦點,但 DeepSeek 后,由于海量的需求無法由 DeepSeek 我方來饜足,AI Infra 公司獲得了一次徑直面向海量世俗用戶的契機,也因此出圈。
但隨著 DeepSeek 在它我方 AI Infra 估量上的貫串開源,許多東談主深切到,寂然的 AI Infra 公司似乎再次遭遇了嚴重的"存在感危險"。
當 DeepSeek 不僅造出了最強的模子,同期也有最強的基礎門徑時期時,它似乎就釀成了一個新的規章制定者:如果寂然的公司想要提供部署 DeepSeek 模子的 AI Infra 生意,你就要使用 DeepSeek 的時期決議,不僅需要卷到極致,來快速復現 DeepSeek 作念出的東西,還要在此基礎上,去作念些 DeepSeek 不作念的諸如匡助開采者、匡助企業一雙一的作念落地作事等,進而來承載它作事不到,或目下莫得作為重心去作事的用戶們,從中盡可能的作念大用戶限制,來攤薄老本,讓我方的利潤率也無盡接近 DeepSeek 官方算出來的那天花板的比例,這才有可能"存活"下去。
這種" DeepSeek 吃肉,其他全球比賽誰能作念喝到最多湯的那一個"的花式是否即是 AI Infra 的異日?這可能才是這場爭論背后對行業確切蹙迫的話題。
袁進輝也就此話題回復了硅星東談主,他合計這樣的異日是否會發生,重要的一個變量即是開源。"如果模子一家獨大,而模子廠商又想吃這塊蛋糕,真是其它各方就有壓力,尤其如果模子是閉源的,就像 OpenAI 這樣,就會更是如斯。"他說。
"但當模子開源后,就要看外界有莫得契機把 infra 或芯片的才氣作念的跨越模子廠。"
而另一個變量則是這個劇烈變革的時期周期自身,它事實上讓也曾單干比擬澄瑩的不同時期扮裝的公司,競爭界限變得拖沓。從 DeepSeek 的部署飛揚里就能體會到——從 AI Infra 公司,到模子公司再到芯片公司,齊參與了進來,提供著相似的作事,搶奪不異的市集。
"今天模子,芯片,infra 其實齊是半制品,相互的關系是又融合又競爭,最終全球齊要角逐訪佛 cloud 的位置。"袁進輝對硅星東談主說。
在這場競爭里,AI Infra 不是最有上風的那一個,但另一方面,它事實上也領有了一次從莫得過的契機,從一個不太被真貴的邊緣終于釀成了焦點。在今天這個節點,是否壓上"身家性命"和對我方時期工程才氣的信心去賭一把異日"下一代云"的契機,會釀成永訣這些公司的重要決定。
硅星東談主也向尤洋提議對于 AI Infra 的異日走向的問題開云體育(中國)官方網站,他回復稱,目下先不接受訪談了。