中商情報(bào)網(wǎng)訊:數(shù)據(jù)標(biāo)注是對(duì)未經(jīng)處理的語(yǔ)音、圖片、文本、視頻等數(shù)據(jù)進(jìn)行轉(zhuǎn)義、打點(diǎn)、拉線、拉框等操作,將這些數(shù)據(jù)標(biāo)注為電腦可以識(shí)別的信息,然后上傳到數(shù)據(jù)庫(kù),以供人工智能使用。隨著人工智能技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的拓展,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)將迎來(lái)更加廣闊的發(fā)展空間和市場(chǎng)機(jī)遇。
一、數(shù)據(jù)標(biāo)注的定義
數(shù)據(jù)標(biāo)注,也被稱為數(shù)據(jù)標(biāo)定、數(shù)據(jù)注釋,是指對(duì)文本、圖像、語(yǔ)音、視頻等待標(biāo)注數(shù)據(jù)進(jìn)行歸類、整理、編輯、糾錯(cuò)、標(biāo)記和批注等操作,為機(jī)器學(xué)習(xí)和人工智能算法提供訓(xùn)練樣本。由于數(shù)據(jù)的質(zhì)量和數(shù)量直接影響大模型的智能水平,因此數(shù)據(jù)標(biāo)注也被視作人工智能的基石。數(shù)據(jù)標(biāo)注的方法和類型多種多樣,包括但不限于以下幾種:
資料來(lái)源:中商產(chǎn)業(yè)研究院整理
二、數(shù)據(jù)標(biāo)注行業(yè)發(fā)展政策
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)是對(duì)數(shù)據(jù)進(jìn)行篩選、清洗、分類、注釋、標(biāo)記和質(zhì)量檢驗(yàn)等加工處理的新興產(chǎn)業(yè)。培育壯大數(shù)據(jù)標(biāo)注產(chǎn)業(yè)對(duì)于提升數(shù)據(jù)供給質(zhì)量,推動(dòng)人工智能創(chuàng)新發(fā)展具有重要支撐作用。為促進(jìn)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展,發(fā)展改革委等四部門發(fā)布了《關(guān)于促進(jìn)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展的實(shí)施意見(jiàn)》,提出到2027年,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)規(guī)模大幅躍升,培育一批具有影響力的科技型數(shù)據(jù)標(biāo)注企業(yè),形成相對(duì)完善的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)生態(tài)。
資料來(lái)源:中商產(chǎn)業(yè)研究院整理