硅基流動(dòng)大模型走通國(guó)產(chǎn)芯片部署DeepSeek模型

集號(hào)吧丨發(fā)表時(shí)間：2025-02-18丨訪問量：274

[摘要]硅基流動(dòng)大模型云服務(wù)平臺(tái)SiliconCloud首發(fā)上線了基于昇騰算力的滿血版DeepSeek R1/V3模型，率先走通了在國(guó)產(chǎn)芯片部署DeepSeek模型的

2月14日，大模型云服務(wù)商硅基流動(dòng)（SilliconFlow）宣布聯(lián)合北京昇騰人工智能計(jì)算中.心，全面支持基于昇騰算力的DeepSeek系列模型的私有化集群部署。

DeepSeek模型

此前，硅基流動(dòng)大模型云服務(wù)平臺(tái)SiliconCloud首發(fā)上線了基于昇騰算力的滿血版DeepSeek R1/V3模型，率先走通了在國(guó)產(chǎn)芯片部署DeepSeek模型的路徑。

時(shí)間倒回至春節(jié)假期的2月1日，華為云宣布聯(lián)合硅基流動(dòng)推出基于昇騰云服務(wù)的DeepSeek R1/V3推理服務(wù)。彼時(shí)，華為云、硅基流動(dòng)的官方公眾號(hào)相隔一分鐘官宣，標(biāo)題均突出“首發(fā)”二字，內(nèi)文用“連日攻堅(jiān)”概括了團(tuán)隊(duì)的努力。

硅基流動(dòng)創(chuàng)始人袁進(jìn)輝曾總結(jié)，硅基流動(dòng)的技術(shù)核心是提供一個(gè)推理引擎，主要向企業(yè)提供高性能LLM推理和訓(xùn)練解決方案,幫助企業(yè)高效地部署AI應(yīng)用。DeepSeek V3是震驚全球科技圈的開源、推理大模型，硅基流動(dòng)與之適配提供服務(wù)尤其對(duì)口。

在DeepSeek V3大模型發(fā)布前，DeepSeek創(chuàng)始人梁文鋒就曾問袁進(jìn)輝，硅基流動(dòng)要不要部署？彼時(shí)，梁文鋒甚至給出了建議：zui少20臺(tái)H800（英偉達(dá)GPU芯片），80臺(tái)zui好，10臺(tái)也可以，就是有點(diǎn)慢。

袁進(jìn)輝算了一筆賬：一個(gè)月80臺(tái)服務(wù)器的凈花費(fèi)就得五六百萬，“還不一定能用滿，風(fēng)險(xiǎn)太大了”。他沒有下注。

看到DeepSeek創(chuàng)造一個(gè)又一個(gè)奇跡，袁進(jìn)輝焦急且苦于沒有充沛的算力資源，直到一位同事突發(fā)奇想，“國(guó)產(chǎn)卡多，用國(guó)產(chǎn)卡吧”。

硅基流動(dòng)向華為云主動(dòng)提出了合作想法。

華為采用自研的達(dá)芬奇架構(gòu)，開發(fā)了昇騰910和昇騰310兩款A(yù)I處理器芯片，而華為云又上線了昇騰AI云服務(wù)，至今約一年半時(shí)間，面向企業(yè)提供一鍵接入獲取AI算力的服務(wù)。

華為昇騰AI云服務(wù)有一個(gè)“百模千態(tài)”專區(qū)，其中除了華為自家的盤古大模型外，還能適配業(yè)界主流的上百個(gè)開源大模型，從而支撐企業(yè)和開發(fā)者更快速地創(chuàng)建自己的大模型應(yīng)用。

開源的DeepSeek何其火爆，接入想法讓硅基流動(dòng)和華為云一拍即合。華為云負(fù)責(zé)調(diào)配算力資源，硅基流動(dòng)負(fù)責(zé)讓模型在GPU上可以運(yùn)行并具備問答能力，同時(shí)確保模型運(yùn)行穩(wěn)定、不損失精度，且運(yùn)行速度盡可能快。

2025年春節(jié)，硅基流動(dòng)團(tuán)隊(duì)和華為云各業(yè)務(wù)團(tuán)隊(duì)幾乎無休，DeepSeek團(tuán)隊(duì)也在全程提供了很多經(jīng)驗(yàn)。

2月1日凌晨1點(diǎn)多，距離官宣基于華為昇騰的DeepSeek R1/V3推理服務(wù)上線還有10個(gè)多小時(shí)，硅基流動(dòng)的一位高管發(fā)了一條朋友圈：平臺(tái)接入了DeepSeek系列模型，且API服務(wù)價(jià)格與DeepSeek官網(wǎng)同價(jià)。

2月1日當(dāng)天，“硅基流動(dòng)”的微信指數(shù)從過去的幾乎為0環(huán)比飆升了8831.35%。當(dāng)時(shí)，硅基流動(dòng)是DeepSeek官方之外，第一個(gè)提供基于國(guó)產(chǎn)芯片的671B滿血模型MaaS云服務(wù)的平臺(tái)。

趁著熱度，硅基流動(dòng)也發(fā)布了一波招聘計(jì)劃，其中開放的視覺生成推理引擎工程師、異構(gòu)硬件適配工程師、交付研發(fā)工程師等全職崗位有15個(gè)，還有與生成式AI相關(guān)的算法、平臺(tái)前端、平臺(tái)后端等方向的實(shí)習(xí)工程師職位8個(gè)。

API服務(wù)競(jìng)爭(zhēng)暗涌

“要考慮并發(fā)，以及后續(xù)并發(fā)是否有限制。”一位與華為云合作接入DeepSeek-R1的AI應(yīng)用廠商負(fù)責(zé)人稱，這是所有要接入的平臺(tái)企業(yè)或者應(yīng)用產(chǎn)品都會(huì)考慮的事情，背后的難題主要由華為云方面在解決。

布局DeepSeek API服務(wù)，不只是騰訊、阿里、百度等巨頭爭(zhēng)搶的生意，不少模型創(chuàng)新企業(yè)也參與其中。

提供模型云服務(wù)的供應(yīng)商雖多，但上述硅基流動(dòng)高管看到，已經(jīng)有模型測(cè)試相關(guān)人士給用戶提供了一些判斷的依據(jù)，比如供應(yīng)商提供的是否為原版的671B參數(shù)規(guī)模？供應(yīng)商提供服務(wù)的上下文窗口（語言模型在進(jìn)行預(yù)測(cè)或生成文本時(shí)，所考慮的前一個(gè)詞元即Token或文本片段的大小范圍）大小是否為正常的64K+？zui后還有AI輔助編程請(qǐng)求的通過情況，供應(yīng)商對(duì)AI模型技術(shù)的應(yīng)用是否受TPM（設(shè)備管理，一般在10W臺(tái)以上）的限制。

陳天楚在浙江大學(xué)ARClab負(fù)責(zé)大模型相關(guān)研究，他看到，接入DeepSeek的各個(gè)云廠商，面向的客戶、官宣的成本控制和定價(jià)計(jì)劃有區(qū)別。例如，有的廠商提供滿血版，有的則是量化壓縮版，還有提供蒸餾后的小模型。

陳天楚認(rèn)為，除了提供標(biāo)準(zhǔn)化的模型API服務(wù)外，云廠商間的較量主要集中在能否提供個(gè)性化服務(wù)。像硅基流動(dòng)就在上線671B的DeepSeek V3/R1旗艦?zāi)Ｐ秃螅稚暇€了6款DeepSeek R1蒸餾版模型，其中的8B、7B、1.5B模型免費(fèi)，企業(yè)或個(gè)人用戶、開發(fā)者使用模型或基于模型開發(fā)AI應(yīng)用時(shí)，能直接調(diào)用硅基流動(dòng)的SiliconCloud平臺(tái)上的API，簡(jiǎn)單易用。

截至2月13日，有來自模型測(cè)試人士的結(jié)果反饋，在提供DeepSeek API服務(wù)的主流供應(yīng)商中，和華為云深度合作的硅基流動(dòng)，其AI服務(wù)響應(yīng)的推理、生成以及平均速度，不僅優(yōu)于承載壓力過大的DeepSeek官方，更與騰訊云、阿里云等廠商拉開了距離。

“+DeepSeek”效果待定

得益于春節(jié)假期的突擊作戰(zhàn)，年后上班第一天（2月5日），華為推出了基于原生鴻蒙操作系統(tǒng)的小藝助手App，既接入了DeepSeek模型推理能力，還在“智能體”選項(xiàng)中上架了DeepSeek-R1的Beta版。

短短5天后，華為智能手機(jī)純血鴻蒙版小藝App的DeepSeek-R1智能體升級(jí)為正式版，新增“聯(lián)網(wǎng)搜索”功能，知識(shí)庫(kù)變得更豐富，時(shí)效性也更強(qiáng)。

2月13日，記者在廣州一家華為手機(jī)線下銷售門店體驗(yàn)。所有更新為純血鴻蒙系統(tǒng)的手機(jī)上，小藝從過去在系統(tǒng)內(nèi)可被喚醒的智慧語音助手服務(wù)，變成一個(gè)獨(dú)立的應(yīng)用產(chǎn)品。進(jìn)入小藝App，便可以與“她”問答對(duì)話，也能在第三方智能體中直接點(diǎn)擊DeepSeek-R1，進(jìn)入深度思考對(duì)話，不用下載第三方App。

華為擁有自研的盤古AI大模型，小藝就是通過盤古大模型訓(xùn)練出來的。純血鴻蒙中的小藝，在成為一個(gè)獨(dú)立應(yīng)用后，其使用界面中有突出DeepSeek的方面。

記者看到，門店銷售人員手中的參考資料上，除了有“怎么說”“怎么做”來體驗(yàn)小藝，還有盤古大模型區(qū)別普通數(shù)據(jù)模型的一些對(duì)比，會(huì)強(qiáng)調(diào)盤古大模型擁有扎根中文的獨(dú)特優(yōu)勢(shì)。對(duì)DeepSeek，材料并未提及。

上述AI應(yīng)用廠商負(fù)責(zé)人在接受經(jīng)濟(jì)觀察網(wǎng)記者采訪時(shí)，給出了產(chǎn)品接入DeepSeek模型能力后關(guān)鍵指標(biāo)的變化。

“大模型幻覺變少，任務(wù)成功率變高。”該負(fù)責(zé)人透露，其團(tuán)隊(duì)在用DeepSeek的模型執(zhí)行某項(xiàng)任務(wù)時(shí)，失敗率基本為0。接入這一明星大模型后，模型幻覺有所減少，但他指出，大模型幻覺作為共性問題，仍有待解決。

其實(shí)，該負(fù)責(zé)人所在的AI企業(yè)也有巨額投入創(chuàng)新自研的通用大模型以及針對(duì)行業(yè)應(yīng)用的專屬大模型。他告訴記者，目前業(yè)內(nèi)集體涌向DeepSeek，普遍做法并非是用DeepSeek系列模型與自身現(xiàn)有模型融合，而是用DeepSeek的模型來開拓新的應(yīng)用場(chǎng)景。

這位負(fù)責(zé)人與陳天楚有共識(shí)，DeepSeek是推理模型，實(shí)效性并非其的優(yōu)勢(shì)，但卻可以通過模型云服務(wù)商等AI基礎(chǔ)設(shè)施賦能。

一位平臺(tái)高管跟很多主流大模型廠商討論過智能體在各個(gè)硬件終端上打通的問題，在她看來，這也是DeepSeek未來技術(shù)落地以及當(dāng)前業(yè)內(nèi)“+DeepSeek”風(fēng)潮后的發(fā)展方向，“每個(gè)硬件都可能成為智能體的入口，通過執(zhí)行人類的任務(wù)來訓(xùn)練專屬個(gè)人的智能體”。

為什么是硅基流動(dòng)

硅基流動(dòng)創(chuàng)始人袁進(jìn)輝是一名連續(xù)創(chuàng)業(yè)者，他在2017年成立的一流科技（OneFlow），在國(guó)內(nèi)2023年涌起AI大模型風(fēng)潮后，估值一度超數(shù)億美元。

同年，美團(tuán)聯(lián)合創(chuàng)始人王慧文創(chuàng)業(yè)了大模型公司光年之外，他提出通過并購(gòu)OneFlow的方式，邀請(qǐng)?jiān)M(jìn)輝加入光年之外成為聯(lián)合創(chuàng)始人。光年之外后被美團(tuán)收購(gòu)，袁進(jìn)輝在2023年8月宣布回歸到AI基礎(chǔ)設(shè)施領(lǐng)域繼續(xù)創(chuàng)業(yè)，創(chuàng)立了硅基流動(dòng)。

硅基即芯片，而流動(dòng)有軟件之意，這一名稱也與袁進(jìn)輝此前創(chuàng)立的一流科技形成呼應(yīng)，讓芯片的算力在軟件基礎(chǔ)上跑起來。

加速AGI普惠人類，是硅基流動(dòng)官方公眾號(hào)上的簡(jiǎn)介，袁進(jìn)輝不止一次在公開場(chǎng)合表示，其目標(biāo)是為廣大的開發(fā)者提供基于AI模型進(jìn)行應(yīng)用創(chuàng)新的關(guān)鍵“鏟子”，讓開發(fā)者實(shí)現(xiàn)Token自由。

硅基流動(dòng)去年年中推出SiliconCloud后，不僅日均調(diào)用量超千億Token，針對(duì)多個(gè)主流模型的服務(wù)還提出了永久免費(fèi)。

“面向C端用戶的大模型App，以后都全面免費(fèi)了。”袁進(jìn)輝2月14日表示，國(guó)內(nèi)模型廠商很難對(duì)C端用戶收取訂閱費(fèi)，多是廠商自己負(fù)擔(dān)算力成本。

在袁進(jìn)輝看來，模型廠商只有獲取用戶后才有辦法去變現(xiàn)。

數(shù)據(jù)顯示，DeepSeek的應(yīng)用訪問使用量正呈現(xiàn)指數(shù)級(jí)上升，成為目前zui快突破3000萬日活躍用戶量的應(yīng)用程序。

贊(274)