2月14日,大模型云服務(wù)商硅基流動(dòng)(SilliconFlow)宣布聯(lián)合北京昇騰人工智能計(jì)算中.心,全面支持基于昇騰算力的DeepSeek系列模型的私有化集群部署。
此前,硅基流動(dòng)大模型云服務(wù)平臺SiliconCloud首 發(fā)上線了基于昇騰算力的滿血版DeepSeek R1/V3模型,率先走通了在國產(chǎn)芯片部署DeepSeek模型的路徑。
時(shí)間倒回至春節(jié)假期的2月1日,華為云宣布聯(lián)合硅基流動(dòng)推出基于昇騰云服務(wù)的DeepSeek R1/V3推理服務(wù)。彼時(shí),華為云、硅基流動(dòng)的官方公眾號相隔一分鐘官宣,標(biāo)題均突出“首 發(fā)”二字,內(nèi)文用“連日攻堅(jiān)”概括了團(tuán)隊(duì)的努力。
硅基流動(dòng)創(chuàng)始人袁進(jìn)輝曾總結(jié),硅基流動(dòng)的技術(shù)核心是提供一個(gè)推理引擎,主要向企業(yè)提供高性能LLM推理和訓(xùn)練解決方案,幫助企業(yè)高效地部署AI應(yīng)用。DeepSeek V3是震驚全球科技圈的開源、推理大模型,硅基流動(dòng)與之適配提供服務(wù)尤其對口。
在DeepSeek V3大模型發(fā)布前,DeepSeek創(chuàng)始人梁文鋒就曾問袁進(jìn)輝,硅基流動(dòng)要不要部署?彼時(shí),梁文鋒甚至給出了建議:zui少20臺H800(英偉達(dá)GPU芯片),80臺zui好,10臺也可以,就是有點(diǎn)慢。
袁進(jìn)輝算了一筆賬:一個(gè)月80臺服務(wù)器的凈花費(fèi)就得五六百萬,“還不一定能用滿,風(fēng)險(xiǎn)太大了”。他沒有下注。
看到DeepSeek創(chuàng)造一個(gè)又一個(gè)奇跡,袁進(jìn)輝焦急且苦于沒有充沛的算力資源,直到一位同事突發(fā)奇想,“國產(chǎn)卡多,用國產(chǎn)卡吧”。
硅基流動(dòng)向華為云主動(dòng)提出了合作想法。
華為采用自研的達(dá)芬奇架構(gòu),開發(fā)了昇騰910和昇騰310兩款A(yù)I處理器芯片,而華為云又上線了昇騰AI云服務(wù),至今約一年半時(shí)間,面向企業(yè)提供一鍵接入獲取AI算力的服務(wù)。
華為昇騰AI云服務(wù)有一個(gè)“百模千態(tài)”專區(qū),其中除了華為自家的盤古大模型外,還能適配業(yè)界主流的上百個(gè)開源大模型,從而支撐企業(yè)和開發(fā)者更快速地創(chuàng)建自己的大模型應(yīng)用。
開源的DeepSeek何其火爆,接入想法讓硅基流動(dòng)和華為云一拍即合。華為云負(fù)責(zé)調(diào)配算力資源,硅基流動(dòng)負(fù)責(zé)讓模型在GPU上可以運(yùn)行并具備問答能力,同時(shí)確保模型運(yùn)行穩(wěn)定、不損失精度,且運(yùn)行速度盡可能快。
2025年春節(jié),硅基流動(dòng)團(tuán)隊(duì)和華為云各業(yè)務(wù)團(tuán)隊(duì)幾乎無休,DeepSeek團(tuán)隊(duì)也在全程提供了很多經(jīng)驗(yàn)。
2月1日凌晨1點(diǎn)多,距離官宣基于華為昇騰的DeepSeek R1/V3推理服務(wù)上線還有10個(gè)多小時(shí),硅基流動(dòng)的一位高管發(fā)了一條朋友圈:平臺接入了DeepSeek系列模型,且API服務(wù)價(jià)格與DeepSeek官網(wǎng)同價(jià)。
2月1日當(dāng)天,“硅基流動(dòng)”的微信指數(shù)從過去的幾乎為0環(huán)比飆升了8831.35%。當(dāng)時(shí),硅基流動(dòng)是DeepSeek官方之外,第 一個(gè)提供基于國產(chǎn)芯片的671B滿血模型MaaS云服務(wù)的平臺。
趁著熱度,硅基流動(dòng)也發(fā)布了一波招聘計(jì)劃,其中開放的視覺生成推理引擎工程師、異構(gòu)硬件適配工程師、交付研發(fā)工程師等全職崗位有15個(gè),還有與生成式AI相關(guān)的算法、平臺前端、平臺后端等方向的實(shí)習(xí)工程師職位8個(gè)。
API服務(wù)競爭暗涌
“要考慮并發(fā),以及后續(xù)并發(fā)是否有限制。”一位與華為云合作接入DeepSeek-R1的AI應(yīng)用廠商負(fù)責(zé)人稱,這是所有要接入的平臺企業(yè)或者應(yīng)用產(chǎn)品都會考慮的事情,背后的難題主要由華為云方面在解決。
布局DeepSeek API服務(wù),不只是騰訊、阿里、百度等巨頭爭搶的生意,不少模型創(chuàng)新企業(yè)也參與其中。
提供模型云服務(wù)的供應(yīng)商雖多,但上述硅基流動(dòng)高管看到,已經(jīng)有模型測試相關(guān)人士給用戶提供了一些判斷的依據(jù),比如供應(yīng)商提供的是否為原版的671B參數(shù)規(guī)模?供應(yīng)商提供服務(wù)的上下文窗口(語言模型在進(jìn)行預(yù)測或生成文本時(shí),所考慮的前一個(gè)詞元即Token或文本片段的大小范圍)大小是否為正常的64K+?zui后還有AI輔助編程請求的通過情況,供應(yīng)商對AI模型技術(shù)的應(yīng)用是否受TPM(設(shè)備管理,一般在10W臺以上)的限制。
陳天楚在浙江大學(xué)ARClab負(fù)責(zé)大模型相關(guān)研究,他看到,接入DeepSeek的各個(gè)云廠商,面向的客戶、官宣的成本控制和定價(jià)計(jì)劃有區(qū)別。例如,有的廠商提供滿血版,有的則是量化壓縮版,還有提供蒸餾后的小模型。
陳天楚認(rèn)為,除了提供標(biāo)準(zhǔn)化的模型API服務(wù)外,云廠商間的較量主要集中在能否提供個(gè)性化服務(wù)。像硅基流動(dòng)就在上線671B的DeepSeek V3/R1旗艦?zāi)P秃螅稚暇€了6款DeepSeek R1蒸餾版模型,其中的8B、7B、1.5B模型免 費(fèi),企業(yè)或個(gè)人用戶、開發(fā)者使用模型或基于模型開發(fā)AI應(yīng)用時(shí),能直接調(diào)用硅基流動(dòng)的SiliconCloud平臺上的API,簡單易用。
截至2月13日,有來自模型測試人士的結(jié)果反饋,在提供DeepSeek API服務(wù)的主流供應(yīng)商中,和華為云深度合作的硅基流動(dòng),其AI服務(wù)響應(yīng)的推理、生成以及平均速度,不僅優(yōu)于承載壓力過大的DeepSeek官方,更與騰訊云、阿里云等廠商拉開了距離。
“+DeepSeek”效果待定
得益于春節(jié)假期的突擊作戰(zhàn),年后上班第 一天(2月5日),華為推出了基于原生鴻蒙操作系統(tǒng)的小藝助手App,既接入了DeepSeek模型推理能力,還在“智能體”選項(xiàng)中上架了DeepSeek-R1的Beta版。
短短5天后,華為智能手機(jī)純血鴻蒙版小藝App的DeepSeek-R1智能體升級為正式版,新增“聯(lián)網(wǎng)搜索”功能,知識庫變得更豐富,時(shí)效性也更強(qiáng)。
2月13日,記者在廣州一家華為手機(jī)線下銷售門店體驗(yàn)。所有更新為純血鴻蒙系統(tǒng)的手機(jī)上,小藝從過去在系統(tǒng)內(nèi)可被喚醒的智慧語音助手服務(wù),變成一個(gè)獨(dú)立的應(yīng)用產(chǎn)品。進(jìn)入小藝App,便可以與“她”問答對話,也能在第三方智能體中直接點(diǎn)擊DeepSeek-R1,進(jìn)入深度思考對話,不用下載第三方App。
華為擁有自研的盤古AI大模型,小藝就是通過盤古大模型訓(xùn)練出來的。純血鴻蒙中的小藝,在成為一個(gè)獨(dú)立應(yīng)用后,其使用界面中有突出DeepSeek的方面。
記者看到,門店銷售人員手中的參考資料上,除了有“怎么說”“怎么做”來體驗(yàn)小藝,還有盤古大模型區(qū)別普通數(shù)據(jù)模型的一些對比,會強(qiáng)調(diào)盤古大模型擁有扎根中文的獨(dú)特優(yōu)勢。對DeepSeek,材料并未提及。
上述AI應(yīng)用廠商負(fù)責(zé)人在接受經(jīng)濟(jì)觀察網(wǎng)記者采訪時(shí),給出了產(chǎn)品接入DeepSeek模型能力后關(guān)鍵指標(biāo)的變化。
“大模型幻覺變少,任務(wù)成功率變高。”該負(fù)責(zé)人透露,其團(tuán)隊(duì)在用DeepSeek的模型執(zhí)行某項(xiàng)任務(wù)時(shí),失敗率基本為0。接入這一明星大模型后,模型幻覺有所減少,但他指出,大模型幻覺作為共性問題,仍有待解決。
其實(shí),該負(fù)責(zé)人所在的AI企業(yè)也有巨額投入創(chuàng)新自研的通用大模型以及針對行業(yè)應(yīng)用的專屬大模型。他告訴記者,目前業(yè)內(nèi)集體涌向DeepSeek,普遍做法并非是用DeepSeek系列模型與自身現(xiàn)有模型融合,而是用DeepSeek的模型來開拓新的應(yīng)用場景。
這位負(fù)責(zé)人與陳天楚有共識,DeepSeek是推理模型,實(shí)效性并非其的優(yōu)勢,但卻可以通過模型云服務(wù)商等AI基礎(chǔ)設(shè)施賦能。
一位平臺高管跟很多主流大模型廠商討論過智能體在各個(gè)硬件終端上打通的問題,在她看來,這也是DeepSeek未來技術(shù)落地以及當(dāng)前業(yè)內(nèi)“+DeepSeek”風(fēng)潮后的發(fā)展方向,“每個(gè)硬件都可能成為智能體的入口,通過執(zhí)行人類的任務(wù)來訓(xùn)練專屬個(gè)人的智能體”。
為什么是硅基流動(dòng)
硅基流動(dòng)創(chuàng)始人袁進(jìn)輝是一名連續(xù)創(chuàng)業(yè)者,他在2017年成立的一 流科技(OneFlow),在國內(nèi)2023年涌起AI大模型風(fēng)潮后,估值一度超數(shù)億美元。
同年,美團(tuán)聯(lián)合創(chuàng)始人王慧文創(chuàng)業(yè)了大模型公司光年之外,他提出通過并購OneFlow的方式,邀請?jiān)M(jìn)輝加入光年之外成為聯(lián)合創(chuàng)始人。光年之外后被美團(tuán)收購,袁進(jìn)輝在2023年8月宣布回歸到AI基礎(chǔ)設(shè)施領(lǐng)域繼續(xù)創(chuàng)業(yè),創(chuàng)立了硅基流動(dòng)。
硅基即芯片,而流動(dòng)有軟件之意,這一名稱也與袁進(jìn)輝此前創(chuàng)立的一 流科技形成呼應(yīng),讓芯片的算力在軟件基礎(chǔ)上跑起來。
加速AGI普惠人類,是硅基流動(dòng)官方公眾號上的簡介,袁進(jìn)輝不止一次在公開場合表示,其目標(biāo)是為廣大的開發(fā)者提供基于AI模型進(jìn)行應(yīng)用創(chuàng)新的關(guān)鍵“鏟子”,讓開發(fā)者實(shí)現(xiàn)Token自由。
硅基流動(dòng)去年年中推出SiliconCloud后,不僅日均調(diào)用量超千億Token,針對多個(gè)主流模型的服務(wù)還提出了永 久免 費(fèi)。
“面向C端用戶的大模型App,以后都全面免 費(fèi)了。”袁進(jìn)輝2月14日表示,國內(nèi)模型廠商很難對C端用戶收取訂閱費(fèi),多是廠商自己負(fù)擔(dān)算力成本。
在袁進(jìn)輝看來,模型廠商只有獲取用戶后才有辦法去變現(xiàn)。
數(shù)據(jù)顯示,DeepSeek的應(yīng)用訪問使用量正呈現(xiàn)指數(shù)級上升,成為目前zui快突破3000萬日活躍用戶量的應(yīng)用程序。
(AM 8:00-12:00 PM 14:00-18:00)