5月20日,由深度學習技術與應用國家工程研究中心主辦、飛槳承辦的WAVE SUMMIT 2022深度學習開發(fā)者峰會在線上舉辦。百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜發(fā)布飛槳文心最新全景圖,提出支撐大模型產(chǎn)業(yè)落地的3個關鍵路徑,并在業(yè)內首發(fā)行業(yè)大模型。
(百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜)
大模型助力普惠AI 三大關鍵落地路徑發(fā)布
近年來,深度學習作為人工智能時代的通用型基礎技術,推動了工業(yè)革命進入爆發(fā)式增長期。百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰在演講中表示,人工智能越來越普惠,賦能千行百業(yè),惠及千家萬戶。
AI大模型進一步增強了AI技術的通用性,也讓廣大開發(fā)者可以更低成本、低門檻,面向場景研發(fā)更好用的AI模型,助力普惠AI。百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜表示,今年是大模型產(chǎn)業(yè)落地的關鍵年。她指出,大模型技術與真實場景需求的有效匹配是落地要解決的關鍵問題,并給出支撐大模型產(chǎn)業(yè)落地的3個關鍵路徑:建設更適配場景需求的大模型體系,提供全流程支持應用落地的工具和方法,營造激發(fā)創(chuàng)新的開放生態(tài)。
基于產(chǎn)業(yè)實踐大模型落地的關鍵解法,飛槳文心全景圖全面升級。在模型層,一次性發(fā)布10個大模型,形成了涵蓋基礎大模型、任務大模型、行業(yè)大模型的三級體系,全面滿足產(chǎn)業(yè)應用需求;配套工具與平臺層,發(fā)布大模型開發(fā)套件、API和內置了文心大模型能力的EasyDL和BML開發(fā)平臺,全方位降低應用門檻;共創(chuàng)共享飛槳生態(tài),同時建設大模型創(chuàng)意和探索社區(qū)旸谷,讓更多人零距離接觸到最先進的AI大模型技術,激發(fā)創(chuàng)新與創(chuàng)意。
文心大模型迎來十大新成員 業(yè)界首發(fā)行業(yè)大模型
本次峰會上,吳甜帶來了文心大模型發(fā)布以來的最大一次升級,其中最值得關注的是,業(yè)界首發(fā)的文心·行業(yè)大模型。
文心·行業(yè)大模型基于通用數(shù)據(jù)訓練的文心大模型,加上行業(yè)應用場景中大量存在著行業(yè)特有的大數(shù)據(jù)和知識,結合行業(yè)相關的創(chuàng)新算法設計,將進一步提升大模型對行業(yè)應用的適配性。吳甜介紹,在能源電力和金融領域,文心聯(lián)合國家電網(wǎng)研發(fā)了知識增強的能源行業(yè)NLP大模型國網(wǎng)-百度·文心,聯(lián)合浦發(fā)銀行研發(fā)了知識增強的金融行業(yè)NLP大模型浦發(fā)-百度·文心,目前已在電力、金融相關任務上取得顯著的效果提升。
國家電網(wǎng)有限公司數(shù)字化工作部人工智能工作負責人蔣煒博士表示,作為中央企業(yè)數(shù)字化轉型的排頭兵,國家電網(wǎng)公司聯(lián)合百度公司共同打造行業(yè)級人工智能基礎設施,探索研發(fā)電力人工智能聯(lián)合大模型,不僅提升了傳統(tǒng)電力專用模型的精度,而且大幅降低了研發(fā)門檻,實現(xiàn)了算力、數(shù)據(jù)、技術等資源的統(tǒng)籌優(yōu)化。下一步,國家電網(wǎng)公司將繼續(xù)深化雙方技術合作,推動人工智能大模型在電力領域的技術攻關及應用探索,面向更典型的電力業(yè)務場景,構建更具電力特色的人工智能大模型。
上海浦東發(fā)展銀行總行信息科技部副總經(jīng)理萬化表示,浦發(fā)銀行與百度在AI的多個方面實現(xiàn)優(yōu)勢互補,聯(lián)合研發(fā)了面向金融行業(yè)的大模型「浦發(fā)-百度·文心」,并且已在金融行業(yè)各類智能場景進行驗證。未來,浦發(fā)銀行將與百度繼續(xù)深入合作,在現(xiàn)有金融行業(yè)大模型的基礎上不斷迭代,持續(xù)地降低金融AI應用落地的門檻。
除行業(yè)大模型外,此次還發(fā)布文心基礎大模型和任務大模型共八個,包括:融合任務相關知識的千億大模型ERNIE 3.0 Zeus,多任務視覺表征學習VIMER-UFO 2.0、商品圖文搜索表征學習VIMER-UMS、文檔圖像表征學習VIMER-StrucTexT 2.0,語音-語言跨模態(tài)大模型ERNIE-SAT、地理-語言跨模態(tài)大模型ERNIE-GeoL,以及面向生物計算領域的化合物表征學習HELIX-GEM和蛋白質結構分析HELIX-Fold。
以基礎NLP大模型為例,ERNIE家族增添新成員,融合任務相關知識的千億大模型ERNIE 3.0 Zeus全新發(fā)布,在學習海量數(shù)據(jù)和知識的基礎上,進一步學習百余種不同形式的任務知識,增強了模型的效果;通過融合層次化提示的預訓練,更好地建模不同任務的共性與特性;再通過將不同的任務組織成統(tǒng)一的自然語言形式,統(tǒng)一建模增強模型的泛化能力。相對其他模型,ERNIE 3.0 Zeus在各類NLP任務上表現(xiàn)出了更強的零樣本和小樣本學習能力。
飛槳全面支撐文心大模型生產(chǎn)及應用
文心大模型作為“產(chǎn)業(yè)級知識增強”大模型,在飛槳訓練推理一體化技術的有力支撐下,實現(xiàn)了高效生產(chǎn)并真正為產(chǎn)業(yè)所用。飛槳作為我國首個自主研發(fā)、功能豐富、開源開放的產(chǎn)業(yè)級深度學習平臺,在訓練層面自主研發(fā)了端到端自適應分布式架構,既包含了并行訓練策略的創(chuàng)新,也包含針對異構硬件的自適應并行訓練支持,打造了框架與算力、算法相結合三位一體的大模型訓練解決方案,實現(xiàn)了端到端的極致性能優(yōu)化;在推理層面,飛槳推出了針對大模型的壓縮、推理、服務化全流程部署方案,擁有業(yè)內領先性能,并已支撐自然語言理解、對話、跨模態(tài)生成等各類大模型的在線應用。
為了讓開發(fā)者更加方便、快速地使用文心大模型,飛槳發(fā)布了一系列大模型開發(fā)套件、大模型API和集成文心大模型的飛槳企業(yè)版EasyDL和BML開發(fā)平臺,面向不同類型的開發(fā)者,全面釋放大模型的使用效能,進一步降低應用門檻。目前,EasyDL和BML平臺已有累計超過1萬名開發(fā)者基于文心大模型開發(fā),創(chuàng)建了超過3萬個任務,并應用到輸電通路巡檢、零部件瑕疵檢測、農業(yè)病蟲害識別、新聞資訊創(chuàng)作等大量場景中。
此外,文心大模型將共創(chuàng)飛槳生態(tài),并通過全新推出的基于文心大模型的創(chuàng)意社區(qū)——文心·旸谷社區(qū),讓更多用戶零距離感受到文心大模型的魅力和應用創(chuàng)新潛力,迸發(fā)出更多富有想象力的新事物。
目前飛槳已構建了業(yè)內布局最全、最適宜產(chǎn)業(yè)應用的模型庫體系,大模型作為人工智能 “基礎設施”的一部分,進一步拓寬了人工智能技術落地的場景覆蓋廣度,更加深了產(chǎn)業(yè)應用的深度。文心大模型將持續(xù)降低應用門檻,推動產(chǎn)業(yè)智能化升級,讓人工智能技術惠及每一個人。
請輸入驗證碼