進入AIGC新時代,人工智能應用需要不斷夯實算力底座。面對新的科技革命與產業變革,新質生產力是一種更高效、更先進的生產發展模式。它關注的不僅僅是“新”,更重要的是實現“生產力”的躍升與結構的優化。高性能計算為人工智能、云計算、大數據、物聯網等提供了強大的計算能力,為新質生產力的打造鋪就了一條“高速路”。
在9月24日到26日召開的第20屆CCF全國高性能計算學術年會(CCFHPCChina2024)(以下簡稱“HPC2024大會”)和9月27日至29日召開的2024中國算力大會(以下簡稱“算力大會”)上,CCF理事長、中國科學院計算技術研究所學術委員會主任、中國工程院院士孫凝暉,中國工程院院士、中國科學院計算技術研究所研究員李國杰,北京并行科技股份有限公司董事長陳健等行業專家分享了各自的觀點。同時在中國信息通信研究院發布的《中國綜合算力指數報告(2024)》中明確提到,AI是推動我國算力發展的重要驅動力,反之高性能計算在加速推動AI向各行業融合深入。
我國算力位居世界第二
9月28日,工業和信息化部總工程師趙志國在算力大會上表示,截至2024年6月底,全國在用算力中心機架總規模超過830萬標準機架,算力總規模達246EFLOPS(2460萬億次浮點運算),位居世界前列。算力產業發展不斷提質、增效、向新。工業、教育、醫療、能源等多個領域的算力應用項目超過了1.3萬個,有力支撐了人工智能的快速發展,為在更大范圍、更高水平上共享數字化發展的成果奠定了堅實的基礎。
“打造典型應用場景,加快推進算力賦能新型工業化建設應用,在工業企業研發設計、生產制造、倉儲物流、營銷服務等重點環節,培養一批典型的應用場景和解決方案,打造算力服務體系,重點面向中小企業培育一批算力應用解決方案提供商,建設一批集成多方資源、開放多項能力的服務平臺,在工業、教育、交通、能源等重點領域形成可復制、可推廣的發展模式。”趙志國強調。
據中國信息通信研究院發布的《中國綜合算力指數報告(2024)》顯示,近年來,全球算力規模持續提升。截至2023年底,全球算力基礎設施總規模達到910EFLOPS,同比增長40%。美國、中國位列前兩名。從人工智能的角度,2003-2023年的20年間,智能算力需求增長百億倍。截至2023年底,我國智能算力規模同比增長65%。人工智能是目前算力增長最主要的驅動力。
“大模型預訓練是目前對算力的主要需求,但廣域分布式計算并不適合做大模型的訓練,依靠多個小的智算中心,通過分布式計算來訓練大模型未必是出路。”李國杰院士在HPC2024大會上表示。
高性能計算發揮“火車頭"作用
孫凝暉院士在HPC2024大會上表示,“20年來,中國高性能計算產業取得了長足進步,已經達到世界一流水平。展望未來,高性能計算要繼續發揮“火車頭”的作用,通過不斷加強學術與產業交流,持續提升技術水平,促進對外合作與交流,引領智算時代未來技術的發展。”
中國工程院院士、華中科技大學教授、國家數字建造技術創新中心首席科學家丁烈云表示,Al將為建筑產業的轉型升級帶來革命性的變化。建筑設計并不是靠畫出來的,而是由模型算出來的,這就要求必須實現數理邏輯與形式邏輯的統一。
未來,建筑生產不再是粗放式的建筑施工,而是可以像造汽車那樣造房子,即通過模塊化、一體化、自動化、智能化,在工廠實現提前預裝。據悉,在實踐過程中,丁烈云院士不僅將智能技術用于建筑設計領域,還在醫療健康甚至體育等領域進行廣泛嘗試,并且都取得了非常好的效果。
陳健告訴中國工業報,大模型訓練是超算應用,而超算系統設計需要考慮計算、訪存、高速互連等協同設計,避免出現“木桶”短板,這樣才能更好地為大模型訓練提供高效的算力支撐。同時,受參數規模、并行方法
等多種因素影響,不同的算力模型訓練應用運行特征不盡相同,這就要求基于具體的應用運行特征進行設計,選擇與之相適應的超算架構算力產品平臺,從而更精確、更高效地提升大模型的訓練性能。
騰訊云副總裁、智能制造和智慧能源解決方案負責人蔡毅告訴中國工業報,產業場景是AI與大模型技術應用的主戰場,隨著大模型的加速落地,企業將面臨前所未有的發展機遇。
據蔡毅介紹,三峽能源借助騰訊云TI平臺,打造了云邊協同的人工智能體系架構,集合了紅外感知識別、風機葉片異常識別、聲紋故障識別等30余種算法,實現了偏遠地區風機的自動化巡檢,讓檢修人員不必冒著嚴寒酷暑外出,可以把精力更多地放在創新性工作上,通過平臺使得整體效率提升了27%,成本降低30%。
聯想對于大模型未來的應用前景持樂觀態度。聯想中國基礎設施業務群戰略管理總監黃山說,我國新型算力建設正走向規模化和多元異構,在此過程中面臨的最大挑戰主要表現在軟硬件兼容性不足、互操作性設計復雜,智算算力利用率低,故障診斷與恢復是提升SLA(服務等級協議)的制約因素,制冷技術還需要持續升級等。
專家建言應對算力發展挑戰
然而,算力基礎設施高速發展的同時也面臨一些挑戰。
例如在算力優化布局方面,中國信息通信研究院院長余曉暉分析表示,除了通算、智算、超算、東數西算以外,還有很多與需求相匹配的算力部署,但是我國算力芯片生態比較碎片化,以及需求與供給有很多錯位,不能完全精準適配,因此算力互聯成網,是下一步要重點推動的工作。
中國工程院院士,國家數字交換系統工程技術研究中心主任,復旦大學大數據研究院院長,教授、博士生導師鄔江興指出,當前先進計算面臨的主要挑戰,主要是在數據處理、存儲、搬移等方面的瓶頸,以及計算系統整體效率低下、能耗不可持續和計算安全問題日益突出的現狀。面對全球數據量的指數級增長和對計算性能的需求,傳統單一架構已經很難滿足多樣化的需求,而用電力拼算力的范式也具有不可持續性。
為有效解決上述問題,鄔江興提出了基于“必要多樣性定律”的變革性策略,強調“通過多樣性應對多樣性”,同時提升系統的適應能力。具體來說,就是通過引入領域專用軟硬件協同計算(擬態計算)和軟件定義晶上系統(SDSow)的創新路徑,同時兼顧高效能、高靈活性和高性能的計算需求;通過軟硬件協同與資源池化的動態聚合,實現對多任務、多算法、多資源的動態響應,最終提供一種能夠應對未來智能時代需求的綠色、智能和安全的計算新范式。這一創新路徑為智能計算時代的系統優化、資源利用和計算安全提供了新的思路與方向。
當前,制造業企業對于人工智能、深度學習以及大模型都十分關注。但是,制造業企業面臨的最大挑戰是缺少對基礎性問題的深入探究和認知。中國工程院院士、華中科技大學李培根指出,下一代智能制造需要關注以下五個重要問題:第一,明確數據是基礎,打造以數據為中心的人工智能,并且企業要增強從海量數據中獲取有價值信息的能力;第二,從歷史數據中挖掘洞見,不要忽視那些看似影響不大的特征數據,只有這樣才能根據各種微弱信號,更好地理解制造的高維空間;第三,在數字智能時代,制造的“匠心”體現在數據上面,即對數據的敏感、對數據背后本質問題的體悟等;第四,物理空間(車間)需要實現IT與OT的融合;第五,大模型應用的關鍵之一就是需要智能代理,它有可能顛覆軟件開發和應用的模式,從為工程師、管理者建立個人智能代理,到實現工業元宇宙,基于智能代理建立人機協同模式至關重要。
清華大學計算機系陳文光教授認為:“實踐證明,國產超算和智能算力平臺可以支持大模型的訓練,但也存在局限性,最大瓶頸在于單芯片的峰值算力,雖然通過軟件優化可以在一定程度得到緩解,但并不能完全彌補差距。國產平臺還需要再接再厲,更上一層樓。”
請輸入驗證碼