大模型發(fā)展已經(jīng)進(jìn)入多模態(tài)融合階段,作為人工智能學(xué)習(xí)、訓(xùn)練和驗(yàn)證的“燃料”基礎(chǔ),大規(guī)模、高質(zhì)量、多模態(tài)數(shù)據(jù)集對(duì)于多模態(tài)大模型能力提升愈加重要,以數(shù)據(jù)為中心的人工智能時(shí)代正在加速到來。
日前,中國(guó)工程院院士劉合在中國(guó)石油和化工行業(yè)數(shù)字化轉(zhuǎn)型發(fā)展大會(huì)中提出,AI系統(tǒng)的核心是訓(xùn)練的框架加上數(shù)據(jù),在實(shí)際過程中我們發(fā)現(xiàn),AI系統(tǒng)落地效果的好壞只有20%,這取決于算法,但80%還是取決于數(shù)據(jù)的質(zhì)量。從現(xiàn)在來看,參數(shù)越來越大,發(fā)展的腳步也越來越快。隨著模型參數(shù)的逐步增加,數(shù)據(jù)規(guī)模也在同步擴(kuò)大,整個(gè)精度越來越高。
劉合認(rèn)為仍需要探索,因?yàn)閿?shù)據(jù)質(zhì)量的問題,在參數(shù)量越大的情況下,面臨的挑戰(zhàn)是更多的。(徐如玉)
請(qǐng)輸入驗(yàn)證碼