數(shù)據(jù)是人工智能的基礎(chǔ)。小到智能手機人臉解鎖,大到智慧城市的智能安防;從車輛自動駕駛到AI聊天機器人,從醫(yī)學(xué)成像與診斷到農(nóng)作物監(jiān)測。AI需要依據(jù)大量有效數(shù)據(jù)總結(jié)規(guī)律形成“智能”,進而在不同場景下落地應(yīng)用。
“其實AI數(shù)據(jù)作為生產(chǎn)資料,是推動整個AI行業(yè)發(fā)展的必要一環(huán),也是人工智能商業(yè)化的主要驅(qū)動力之一,說高質(zhì)量的數(shù)據(jù)決定了AI的落地程度也不為過。”云測數(shù)據(jù)總經(jīng)理賈宇航表示。
目前,場景化AI數(shù)據(jù)是人工智能現(xiàn)階段發(fā)展和商業(yè)化落地的關(guān)鍵點。但機器并不能理解人類所能識別的原始數(shù)據(jù),這些原始數(shù)據(jù)需要人為的“標(biāo)簽化”以后,才可以被用于模型訓(xùn)練。這些“標(biāo)簽化”的數(shù)據(jù)越多越精準(zhǔn),其獲得的結(jié)果就越準(zhǔn)確。例如,自動駕駛的算法模型經(jīng)過大量場景AI數(shù)據(jù)的訓(xùn)練,不斷的學(xué)習(xí)和優(yōu)化,進而讓系統(tǒng)的智能化程度逐漸提高。
如何“標(biāo)簽化”就涉及“數(shù)據(jù)標(biāo)注”這一環(huán)節(jié),即針對語音、圖像、文本等數(shù)據(jù),通過貼標(biāo)簽、做記號、標(biāo)顏色或劃重點的方式,來標(biāo)注出其中目標(biāo)數(shù)據(jù)的不同點、相似點或類別。
數(shù)據(jù)標(biāo)注,是將數(shù)據(jù)轉(zhuǎn)化為AI商業(yè)價值的重要一環(huán)。數(shù)據(jù)標(biāo)注的精準(zhǔn)度越高,AI學(xué)習(xí)和產(chǎn)出的結(jié)果越精確,AI也就越智能。
在場景化落地中,意味數(shù)據(jù)標(biāo)注行業(yè)要滿足多樣化應(yīng)用場景標(biāo)注需求。例如,金融行業(yè),早期對AI客服機器人的要求只停留在“用戶提問后,對其中的關(guān)鍵詞進行提取,并按照既定話術(shù)回答”。但在互聯(lián)網(wǎng)金融業(yè)務(wù)競爭異常激烈的今天,越來越多的用戶習(xí)慣在網(wǎng)上辦理業(yè)務(wù),AI客服機器人正在大規(guī)模地取代人工客服,AI問答的準(zhǔn)確性將直接決定業(yè)務(wù)的效率和成本,并影響用戶體驗,很大程度上決定了金融機構(gòu)的競爭力。(王雨陽)
請輸入驗證碼