■中國(guó)工業(yè)報(bào) 耿鵬飛
2025年1月20日,DeepSeek發(fā)布新一代推理大模型DeepSeek-R1,以極致的“性價(jià)比”在全球AI競(jìng)技場(chǎng)投下“技術(shù)普惠”的深水炸彈。
這不僅是算法對(duì)算力的逆襲,更是開源生態(tài)對(duì)閉源生態(tài)的降維打擊……隨后全球47萬個(gè)衍生模型在20天內(nèi)破土而出,昇騰、騰訊云等200多家生態(tài)伙伴構(gòu)建起自主可控的AI產(chǎn)業(yè)鏈,甚至倒逼OpenAI宣布GPT-5免費(fèi)開放。
如今,DeepSeek的神話還在續(xù)寫……深度適配、開源、差異化競(jìng)爭(zhēng)成為當(dāng)下熱點(diǎn)。
成本重構(gòu)改寫行業(yè)規(guī)則
“高性能+低成本”組合,直接推動(dòng)全球AI服務(wù)價(jià)格體系重構(gòu),迫使頭部廠商加速技術(shù)迭代。
從陽春白雪到下里巴人,DeepSeek讓AI真正飛入尋常百姓家。無論是專業(yè)人士的復(fù)雜工作場(chǎng)景,還是普通用戶日常娛樂、學(xué)習(xí),都能輕松駕馭,極大降低了大眾運(yùn)用AI技術(shù)的門檻。
性能是衡量一個(gè)模型優(yōu)劣的關(guān)鍵指標(biāo)。在性能層面,DeepSeek其獨(dú)創(chuàng)的專家混合架構(gòu)(MoE)通過任務(wù)分解與多專家協(xié)同,顯著提升數(shù)學(xué)推理效率,數(shù)學(xué)推理能力超過OpenAIo1;基于2000億Token訓(xùn)練量的代碼生成模型,在數(shù)學(xué)推理和代碼任務(wù)上已超越GPT-3.5。
成本控制則成為DeepSeek顛覆行業(yè)的關(guān)鍵。DeepSeekR1以557.6萬美元的訓(xùn)練成本(僅為Gpt-4的1/10)和API調(diào)用價(jià)格(OpenAI的1/30),徹底打破“算力軍備競(jìng)賽”的行業(yè)困局。這種“高性能+低成本”組合,直接推動(dòng)全球AI服務(wù)價(jià)格體系重構(gòu),迫使頭部廠商加速技術(shù)迭代。
正因如此,DeepSeek吸引了國(guó)內(nèi)眾多企業(yè)的目光。國(guó)家超算互聯(lián)網(wǎng)平臺(tái)相關(guān)負(fù)責(zé)人向中國(guó)工業(yè)報(bào)表示,根據(jù)杰文斯悖論(杰文斯悖論:技術(shù)進(jìn)步提高了資源使用效率,但最終會(huì)導(dǎo)致該資源的總消耗量不降反增),像DeepSeek這樣由技術(shù)創(chuàng)新提升效率的工具,其廣泛應(yīng)用將大規(guī)模帶動(dòng)算力需求的增加。
因此,社會(huì)迫切需要打造能夠應(yīng)對(duì)高峰值的大規(guī)模算力中心,也需要類似超算互聯(lián)網(wǎng)的全國(guó)一體化算力網(wǎng)絡(luò),將全國(guó)各地的算力中心連接起來,形成面向全國(guó)算力資源池,實(shí)現(xiàn)全國(guó)算力資源的統(tǒng)一管理。此外,還要建立“算力+應(yīng)用”的一體化交付體系,促進(jìn)供需雙方的高效對(duì)接。
中國(guó)工業(yè)報(bào)了解到,作為國(guó)家級(jí)綜合算力服務(wù)平臺(tái),目前超算互聯(lián)網(wǎng)已連接國(guó)內(nèi)14個(gè)省區(qū)市的20多家超算和智算中心。目前,平臺(tái)上已有各類算力商品超6500款,其中AI模型服務(wù)近240款,既有DeepSeek、Qwen等國(guó)內(nèi)開源模型,也有Llama、StableDiffusion、Gemma等國(guó)外AI開源模型。
國(guó)家超算互聯(lián)網(wǎng)平臺(tái)相關(guān)負(fù)責(zé)人向中國(guó)工業(yè)報(bào)表示,當(dāng)前各類用戶使用AI模型熱情高漲,DeepSeekChatbot可視化界面僅上線首日,訪問量就突破了百萬量級(jí),用戶紛紛表達(dá)出對(duì)DeepSeek最新版本與多模態(tài)(支持多種信息輸入方式,如文本、圖像、語音等)的期待。資深開發(fā)者和企業(yè)用戶,對(duì)AIWeb應(yīng)用、私有化API調(diào)用提出更多需求。接下來,超算互聯(lián)網(wǎng)平臺(tái)將積極響應(yīng)用戶需求,上線更多版本和功能。
開源生態(tài)引爆產(chǎn)業(yè)協(xié)同
DeepSeek打破了算力桎梏,為國(guó)產(chǎn)化算力帶來新機(jī)遇。
DeepSeek的開源策略被視為國(guó)產(chǎn)AI生態(tài)的“催化劑”,它基于MIT許可證(一種非常寬松的開源軟件許可證),將算法、模型及訓(xùn)練細(xì)節(jié)向全球開發(fā)者開放。DeepSeek的開源策略帶來的“飛輪效應(yīng)”顯著:上線20天日活突破2000萬,全球開發(fā)者創(chuàng)建47萬個(gè)衍生模型(即通過對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行處理、清洗、轉(zhuǎn)換和聚合等操作后得到的數(shù)據(jù)模型),形成最活躍的開發(fā)生態(tài)。
開源不僅降低技術(shù)門檻,更激活產(chǎn)業(yè)鏈協(xié)同效應(yīng)。DeepSeek性能強(qiáng)大的另一方面,也對(duì)芯片性能提出了多元且高要求的挑戰(zhàn)。如今,昇騰、沐曦等18家廠商已完成適配。
據(jù)中國(guó)工業(yè)報(bào)了解,芯片企業(yè)江原科技已可單卡支持DeepSeek-R11.5B/7B/8B/14B/32B/70B全部6個(gè)蒸餾模型(一種將復(fù)雜大型模型的知識(shí)遷移到更小、更簡(jiǎn)單模型的技術(shù))。
“我們?cè)谶m配DeepSeek-R1這些蒸餾模型的時(shí)候并沒有碰到什么技術(shù)難題,基本上達(dá)到了開箱即用的適配速度。”江原科技副總裁楊麗慧向中國(guó)工業(yè)報(bào)表示,開源框架使產(chǎn)業(yè)鏈各環(huán)節(jié)能“專注所長(zhǎng)”,這次適配和優(yōu)化能夠達(dá)到很高的效率,很大程度上要?dú)w功于開源。DeepSeek是開源大模型的代表,首次實(shí)現(xiàn)了開源模型性能追平閉源模型的性能,這對(duì)整個(gè)產(chǎn)業(yè)鏈,特別是國(guó)產(chǎn)化產(chǎn)業(yè)鏈來說都是非常正向的激勵(lì)。
昇騰相關(guān)專家向中國(guó)工業(yè)報(bào)表示:“大模型將從技術(shù)摸高走向‘技術(shù)摸高+工程創(chuàng)新’并行,訓(xùn)練需求持續(xù)增長(zhǎng)。頭部玩家將戰(zhàn)略堅(jiān)定投入預(yù)訓(xùn)練基礎(chǔ)模型創(chuàng)新,豐富模型組合,加速探索AGI(通用人工智能)。”
據(jù)中國(guó)工業(yè)報(bào)了解,昇騰擁有強(qiáng)大的AI計(jì)算能力和先進(jìn)的集群技術(shù),上述專家表示,雙方合作能讓DeepSeek充分利用昇騰的算力優(yōu)勢(shì),進(jìn)一步優(yōu)化模型訓(xùn)練和推理過程,從而提升大模型的性能、效率和準(zhǔn)確性。比如在處理復(fù)雜的自然語言理解、圖像識(shí)別等任務(wù)時(shí)表現(xiàn)得更加出色,推動(dòng)國(guó)產(chǎn)大模型技術(shù)達(dá)到新高度。
中國(guó)電信研究院戰(zhàn)略發(fā)展研究所副主任分析師魏玥向中國(guó)工業(yè)報(bào)分析說道,之前由于AI大模型對(duì)算力要求較高,國(guó)產(chǎn)化芯片在性能和成本方面基本沒有優(yōu)勢(shì),AI大模型主要依賴進(jìn)口高端芯片,國(guó)產(chǎn)化算力的目標(biāo)客戶和市場(chǎng)空間有限,對(duì)智算基礎(chǔ)設(shè)施的建設(shè)和運(yùn)營(yíng)等造成影響。DeepSeek打破了算力桎梏,為國(guó)產(chǎn)化算力帶來新機(jī)遇。
場(chǎng)景落地多點(diǎn)開花
隨著大模型向著多模態(tài)融合深入、推理需求逐漸爆發(fā)的趨勢(shì)發(fā)展,會(huì)誕生更多、更專業(yè)、更精準(zhǔn)的大模型。大模型一定會(huì)向垂直領(lǐng)域深度滲透,與實(shí)體經(jīng)濟(jì)加速融合。
DeepSeek的高效推理與多模態(tài)擴(kuò)展能力,使其在云、邊、端及多行業(yè)場(chǎng)景中快速滲透。據(jù)中國(guó)工業(yè)報(bào)了解,目前各大云服務(wù)商如阿里云、騰訊云等十大平臺(tái)已全面支持DeepSeek模型;垂類應(yīng)用中,吉利汽車融合DeepSeekR1優(yōu)化智能座艙交互,浪潮海岳大模型則借其復(fù)雜推理能力切入高門檻場(chǎng)景。
近日,寧夏交建交通科技研究院聯(lián)合北京中關(guān)村科金研發(fā)的“靈筑”行業(yè)大模型應(yīng)用平臺(tái)正式接入DeepSeek模型,通過更專業(yè)的行業(yè)知識(shí)問答、技術(shù)文檔撰寫、投標(biāo)文件輔助生成、Excel表格自動(dòng)生成等眾多場(chǎng)景,借助大模型技術(shù)變革行業(yè)工作方式。
“定位于企業(yè)服務(wù)垂域大模型的海岳大模型差異化優(yōu)勢(shì)顯著,在接入DeepSeek之后更是解鎖了企業(yè)智能化新高度。”浪潮通用軟件有限公司海岳大模型研發(fā)負(fù)責(zé)人、首席技術(shù)架構(gòu)師周祥國(guó)和中國(guó)工業(yè)報(bào)談到,海岳大模型接入DeepSeek后,一方面,海岳大模型應(yīng)用場(chǎng)景可以進(jìn)一步向?qū)I(yè)垂直領(lǐng)域縱深滲透,利用DeepSeek-671B的復(fù)雜推理能力,分析預(yù)測(cè)、科學(xué)計(jì)算、長(zhǎng)文本生成等能力,可以使處理專業(yè)型、知識(shí)密集型任務(wù)的能力大幅提升,更好地切入高門檻場(chǎng)景應(yīng)用;另一方面,它也為海岳大模型橫向擴(kuò)展應(yīng)用領(lǐng)域、應(yīng)用行業(yè),提供了一種相對(duì)低成本高效率的垂域大模型訓(xùn)練范式。
最為關(guān)鍵的是,基于DeepSeek的長(zhǎng)思維鏈和多層邏輯拆分能力,海岳大模型智能應(yīng)用的準(zhǔn)確性得到顯著提升。如,在通用問答場(chǎng)景中,海岳智能問答助手基于DeepSeek,能夠精準(zhǔn)定位并回答復(fù)雜問題,有效解決大模型的“幻覺”問題。
根據(jù)第三方國(guó)際咨詢機(jī)構(gòu)Gartner預(yù)測(cè),DeepSeek將推動(dòng)AI服務(wù)成本年均下降90%,到2027年70%企業(yè)將采用“大模型+微調(diào)”混合架構(gòu)。青云科技市場(chǎng)總監(jiān)王玉圓向中國(guó)工業(yè)報(bào)介紹說,DeepSeek帶來的不僅是推理成本的降低,更多的是給大模型公司一種新的思路。隨著大模型向著多模態(tài)融合深入、推理需求逐漸爆發(fā)的趨勢(shì)發(fā)展,會(huì)誕生更多、更專業(yè)、更精準(zhǔn)的大模型,大模型一定會(huì)向垂直領(lǐng)域深度滲透,與實(shí)體經(jīng)濟(jì)加速融合。
早在2023年青云就推出了AI算力云服務(wù),王玉圓表示:“目前使用中的客戶都肯定了青云提供的DeepSeek服務(wù)。其中不少客戶還要對(duì)外提供企業(yè)級(jí)服務(wù)。”
為加速人工智能大模型技術(shù)在企業(yè)級(jí)場(chǎng)景中的規(guī)模化落地,2月14日寧暢信息產(chǎn)業(yè)(北京)有限公司(以下簡(jiǎn)稱“寧暢”)正式發(fā)布DeepSeek大模型一體機(jī)解決方案,搭載業(yè)界領(lǐng)先的DeepSeekR1/V3滿血版模型和蒸餾版模型,通過軟硬件深度協(xié)同優(yōu)化,為企業(yè)提供從部署到場(chǎng)景定制的全棧交付能力,幫助制造、金融、醫(yī)療、科研等行業(yè)突破AI應(yīng)用瓶頸。
普惠化、差異化成落地關(guān)鍵
未來,如何在普惠性與專業(yè)性、開源共享與商業(yè)回報(bào)間找到平衡點(diǎn),將決定這場(chǎng)AI產(chǎn)業(yè)變革的最終深度。
DeepSeek的成功源于技術(shù)突破與成本控制的平衡、開源生態(tài)的快速擴(kuò)張,以及對(duì)市場(chǎng)需求的前瞻性把握。
國(guó)家超算互聯(lián)網(wǎng)平臺(tái)相關(guān)負(fù)責(zé)人表示,其帶動(dòng)了包括強(qiáng)化學(xué)習(xí)、蒸餾技術(shù)(大模型知識(shí)轉(zhuǎn)移給小模型模式)等發(fā)展,它不僅挑戰(zhàn)了傳統(tǒng)AI研發(fā)路徑,更推動(dòng)了AI技術(shù)的普惠化進(jìn)程,AI行業(yè)應(yīng)用企業(yè)將迎來全面爆發(fā),中國(guó)的大市場(chǎng)將孕育出一批類似互聯(lián)網(wǎng)時(shí)代的超級(jí)平臺(tái)型和應(yīng)用型企業(yè)。
眾所周知,AI與互聯(lián)網(wǎng)不同,它具有去中心化和廣泛滲透的特點(diǎn)。AI的行業(yè)和個(gè)人應(yīng)用將更加多樣化。對(duì)算力需求增加,二次開發(fā)和創(chuàng)新的需要,也會(huì)同時(shí)增加。
盡管DeepSeek推動(dòng)國(guó)產(chǎn)AI跨越式發(fā)展,挑戰(zhàn)亦隨之顯現(xiàn)。近年來,國(guó)內(nèi)三大電信運(yùn)營(yíng)商面臨同質(zhì)化壓力。中國(guó)電信率先于2月1日成為國(guó)內(nèi)首家實(shí)現(xiàn)DeepSeek模型落地的運(yùn)營(yíng)商級(jí)云平臺(tái)。
魏玥向中國(guó)工業(yè)報(bào)分析,智算云服務(wù)是以大模型為牽引的,而DeepSeek將各廠商能提供的大模型的能力統(tǒng)一到了一個(gè)水平,如何形成差異化優(yōu)勢(shì)就成為主要挑戰(zhàn)和競(jìng)爭(zhēng)關(guān)鍵。
在魏玥看來,云服務(wù)的商業(yè)模式簡(jiǎn)單來說是以服務(wù)的形式向客戶提供IT硬件和軟件,AI大模型則是云服務(wù)商可以提供的軟件之一。在眾多IT硬件和軟件中,云服務(wù)商選擇哪些作為重點(diǎn)展開資源布局、技術(shù)創(chuàng)新、產(chǎn)品研發(fā)和市場(chǎng)營(yíng)銷等,很大程度上由客戶需求驅(qū)動(dòng)。“中國(guó)電信在DeepSeek推出后,緊鑼密鼓地推進(jìn)模型接入和全場(chǎng)景上架,也是因?yàn)椴蹲降搅苏蠛凸娍蛻魧?duì)DeepSeek高漲的興趣和需求。”魏玥說道。
對(duì)于行業(yè)中質(zhì)疑“接入DeepSeek是對(duì)企業(yè)自研大模型否認(rèn)”的聲音,魏玥給出解釋:“中國(guó)電信自研的星辰大模型,將走出與DeepSeek互補(bǔ)的發(fā)展路徑,將更多資源投入中國(guó)電信更有優(yōu)勢(shì)和積累的領(lǐng)域,比如目前已支持?jǐn)?shù)十種方言的語音大模型,需要深度理解行業(yè)知識(shí)和客戶需求的各個(gè)行業(yè)大模型,以及利用DeepSeek蒸餾形成高性能輕量級(jí)模型并與終端結(jié)合等。”
在魏玥看來,DeepSeek迅速出圈再一次證實(shí),普惠對(duì)于科學(xué)技術(shù)的規(guī)模應(yīng)用至關(guān)重要。云服務(wù)依托資源共享和規(guī)模效應(yīng)等,可以促進(jìn)IT普惠化,是實(shí)現(xiàn)AI大模型普惠的關(guān)鍵途徑。
未來,如何在普惠性與專業(yè)性、開源共享與商業(yè)回報(bào)間找到平衡點(diǎn),將決定這場(chǎng)AI產(chǎn)業(yè)變革的最終深度。正如周祥國(guó)所言,在數(shù)字經(jīng)濟(jì)中,無論是數(shù)字產(chǎn)業(yè)化還是產(chǎn)業(yè)數(shù)字化,技術(shù)都只是手段,真正發(fā)揮價(jià)值的還在于應(yīng)用。
請(qǐng)輸入驗(yàn)證碼