“當(dāng)下,人工智能發(fā)展首先需要攻克的是數(shù)據(jù)量不足的問題?!比涨芭e行的2023大灣區(qū)科學(xué)論壇上,中國(guó)工程院院士、鵬城實(shí)驗(yàn)室主任高文直言,雖然企業(yè)可通過公開渠道相對(duì)容易地購買數(shù)據(jù),但“仍不解渴”。
如果把發(fā)展人工智能比喻成烹飪,我們不僅在算力大模型這個(gè)動(dòng)力端上差點(diǎn)“火候”,還要加點(diǎn)“料”,即數(shù)據(jù)?!叭斯ぶ悄艿母?jìng)爭(zhēng),本質(zhì)上是數(shù)據(jù)創(chuàng)造權(quán)、數(shù)據(jù)所有權(quán)的競(jìng)爭(zhēng)。”香港科技大學(xué)(廣州)協(xié)理副校長(zhǎng)熊輝說。
廣東有著完備的制造業(yè)體系,多年來沉淀了海量的制造業(yè)數(shù)據(jù)。同時(shí),作為數(shù)字經(jīng)濟(jì)大省,廣東擁有的數(shù)據(jù)量也位居全國(guó)之首。如何借助人工智能技術(shù)挖點(diǎn)“好料”,做出數(shù)據(jù)的“好菜”,讓資源越用越多、越用越好,是廣東發(fā)展人工智能產(chǎn)業(yè)的重要課題。
藍(lán)海待挖
隨著ChatGPT的火爆,未來有可能會(huì)導(dǎo)致一部分人員的失業(yè),但同時(shí)也會(huì)孕育出一批新職業(yè)。目前其中最吸人眼球的,就是被稱為“AI喂養(yǎng)員”的數(shù)據(jù)標(biāo)注員。
給AI喂數(shù)據(jù)成了專業(yè)工作。這也從側(cè)面反映出,在AI時(shí)代,數(shù)據(jù)擁有的重要價(jià)值。
5月23日,國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布的《數(shù)字中國(guó)發(fā)展報(bào)告(2022年)》顯示,2022年我國(guó)數(shù)據(jù)產(chǎn)量達(dá)8.1ZB,同比增長(zhǎng)22.7%,全球占比達(dá)10.5%,位居世界第二。
“海量的數(shù)據(jù)正在改變現(xiàn)有的商業(yè)模式?!贝髷?shù)據(jù)專家、科技作家涂子沛舉例說,微信每日步數(shù)成為保險(xiǎn)公司保費(fèi)定價(jià)參考,步數(shù)多的人保費(fèi)可能更低?!皵?shù)據(jù)會(huì)成為我們的通行語言,每一家企業(yè)都會(huì)變成數(shù)據(jù)公司?!?/p>
對(duì)于工業(yè)大省廣東來說,其制造業(yè)體系豐富,沉淀了海量的制造業(yè)數(shù)據(jù)。這些貫穿在生產(chǎn)、設(shè)計(jì)、營(yíng)銷等全鏈條的數(shù)據(jù),在人工智能技術(shù)的加持下,正在為制造業(yè)發(fā)展注入更大動(dòng)能、打開更大空間。
用AI“提煉”數(shù)據(jù),可以讓數(shù)據(jù)變成資本。近日,在廣州數(shù)據(jù)交易所,廣州首個(gè)公共數(shù)據(jù)運(yùn)營(yíng)產(chǎn)品“企業(yè)經(jīng)營(yíng)健康指數(shù)”順利完成交易。通過人工智能手段,用經(jīng)營(yíng)數(shù)據(jù)給企業(yè)畫像,以數(shù)據(jù)資產(chǎn)化作為新型融資方式,將破解中小企業(yè)融資難問題。截至當(dāng)前,廣州數(shù)據(jù)交易所累計(jì)交易金額突破10億元。
數(shù)據(jù)價(jià)值的不斷挖掘,也在反向催生如何獲取更多有用數(shù)據(jù)的市場(chǎng)需求。在深圳數(shù)據(jù)交易所,可信數(shù)據(jù)空間技術(shù)正式實(shí)現(xiàn)國(guó)產(chǎn)商業(yè)化落地,實(shí)現(xiàn)了“數(shù)據(jù)為我所用,但不一定為我所有”,直擊行業(yè)痛點(diǎn)。
該技術(shù)通過人工智能隱私計(jì)算等方式,可實(shí)現(xiàn)消費(fèi)電子產(chǎn)品、新能源鋰電池等生產(chǎn)全過程質(zhì)量數(shù)據(jù)的可信共享,打消企業(yè)數(shù)據(jù)流通的顧慮。
“該技術(shù)未來還可以進(jìn)一步擴(kuò)展到制造業(yè)、物流等泛工業(yè)行業(yè),服務(wù)于企業(yè)研發(fā)、生產(chǎn)、銷售、供應(yīng)、物流等全過程,提升產(chǎn)業(yè)鏈競(jìng)爭(zhēng)力。”深圳數(shù)據(jù)交易所董事長(zhǎng)李紅光說。
在廣東數(shù)字政府研究院副院長(zhǎng)傅建平看來,廣東擁有中國(guó)制造業(yè)全部31個(gè)國(guó)民經(jīng)濟(jì)行業(yè)大類,其中15個(gè)大類的規(guī)模更是居全國(guó)之首。挖掘利用好海量的制造業(yè)數(shù)據(jù),可以推動(dòng)傳統(tǒng)制造業(yè)智能化升級(jí),支撐構(gòu)建虛擬產(chǎn)業(yè)集群,催生新產(chǎn)品、新模式、新業(yè)態(tài),加快制造業(yè)與服務(wù)業(yè)深度融合,推動(dòng)人工智能產(chǎn)業(yè)加快發(fā)展。
仍不解渴
豐富的數(shù)據(jù),就如同待開采的金礦,但如何“掘金”仍是一個(gè)問題。
“數(shù)據(jù)之于AI大模型就像原油之于汽車,汽車是無法直接使用原油的,原油要經(jīng)過一系列復(fù)雜的煉化過程?!冰i城實(shí)驗(yàn)室云腦使能研究所所長(zhǎng)張偉說。
同樣的,海量原始數(shù)據(jù)需要經(jīng)過“煉化”構(gòu)建成數(shù)據(jù)集,才能真正有效地提供給AI大模型訓(xùn)練。
“國(guó)內(nèi)數(shù)據(jù)流通存在供給不足的問題,尤其是高質(zhì)量數(shù)據(jù)不足,限制了國(guó)內(nèi)AI大模型發(fā)展?!崩罴t光注意到,國(guó)內(nèi)大模型語音聊天機(jī)器人在表達(dá)上,中文反饋結(jié)果往往不如英文準(zhǔn)確,除了中文更難理解、搜索難度更大之外,一個(gè)關(guān)鍵因素是數(shù)據(jù)支撐不足。
如何獲取量足、質(zhì)優(yōu)的數(shù)據(jù),成為人工智能產(chǎn)業(yè)向前發(fā)展繞不開的問題。
“數(shù)據(jù)分散在不同的地方,碎片化比較嚴(yán)重。同時(shí),沒有經(jīng)過整理的數(shù)據(jù),存在字段缺失、信息不準(zhǔn)等問題,影響了數(shù)據(jù)價(jià)值的發(fā)揮?!崩罴t光說。
但是,如果數(shù)據(jù)類型太過豐富,也會(huì)進(jìn)一步分散數(shù)據(jù)價(jià)值。興森科技PCB事業(yè)部(廣州)總經(jīng)理杜子良說,除了文本等結(jié)構(gòu)化數(shù)據(jù),工廠還經(jīng)常留存圖像、音頻、視頻等多樣的非結(jié)構(gòu)化數(shù)據(jù),處理起來更加困難。隨著業(yè)務(wù)擴(kuò)張,這家企業(yè)在深圳、江蘇宜興等地新建了多個(gè)生產(chǎn)基地,這些生產(chǎn)基地之間也面臨數(shù)據(jù)資源高效共享、協(xié)同、流動(dòng)的挑戰(zhàn)。
“數(shù)據(jù)挖掘的痛點(diǎn)是‘孤島效應(yīng)’突出,難點(diǎn)是數(shù)據(jù)利用和保護(hù)機(jī)制不健全?!迸弥迣?shí)驗(yàn)室戰(zhàn)略研究中心林韜杰博士說。
在實(shí)踐過程中,還有許多企業(yè)仍未建立數(shù)據(jù)采集能力。樹根互聯(lián)聯(lián)合創(chuàng)始人、CEO賀東東舉例說,比如將機(jī)器等“啞設(shè)備”用傳感器連接,采集數(shù)據(jù)后還要傳輸和存儲(chǔ)、建模分析,才能將數(shù)據(jù)變成資產(chǎn),“但這么做成本高昂”。
釋放潛能
“數(shù)據(jù)應(yīng)該和廣東優(yōu)勢(shì)產(chǎn)業(yè)尤其是制造業(yè)深度融合,才能最大限度激活要素潛力,并助力產(chǎn)業(yè)轉(zhuǎn)型升級(jí)。”傅建平建議,廣東可從盤活數(shù)據(jù)資源、挖掘數(shù)據(jù)價(jià)值、釋放數(shù)據(jù)潛能三個(gè)方向?qū)?shù)據(jù)要素進(jìn)行突破。
所謂“見多才能識(shí)廣”,AI的迭代同樣來自“見多識(shí)廣之后的沉淀和創(chuàng)造力”。數(shù)據(jù)的治理、算法的進(jìn)步,需要大量結(jié)構(gòu)化標(biāo)注數(shù)據(jù),并對(duì)模型進(jìn)行訓(xùn)練、調(diào)優(yōu)。
“過去很多企業(yè)的數(shù)據(jù)被白白浪費(fèi)掉了,但現(xiàn)在通過傳感器即可采集和挖掘數(shù)據(jù),再借助基于機(jī)器的人工智能算法,不斷優(yōu)化生產(chǎn)和營(yíng)銷?!辟R東東說,數(shù)據(jù)已經(jīng)成為智能決策的依據(jù),未來也將取代傳統(tǒng)廠房、設(shè)備,成為企業(yè)最有價(jià)值的要素。
如今,廣東正分門別類推動(dòng)傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級(jí),并為此出臺(tái)了專門的轉(zhuǎn)型指引,“手把手”指導(dǎo)企業(yè)數(shù)字化轉(zhuǎn)型。
今年4月,廣東省工信廳印發(fā)的《廣東省紡織服裝行業(yè)數(shù)字化轉(zhuǎn)型指引》和《廣東省家具行業(yè)企業(yè)數(shù)字化轉(zhuǎn)型指引》提出,推動(dòng)大數(shù)據(jù)挖掘應(yīng)用邁上新臺(tái)階。
比如,在紡織服裝行業(yè),充分挖掘廣州、深圳、上海等紡織服裝展會(huì)數(shù)據(jù)資源,為招展、招商、服務(wù)和制定行業(yè)政策提供支撐。
在家具行業(yè),加強(qiáng)與家具賣場(chǎng)、經(jīng)銷商、電商平臺(tái)深度合作,用好用足各類平臺(tái)數(shù)據(jù)銀行,分析挖掘消費(fèi)者群體畫像,孵化培育熱銷產(chǎn)品,打造具有特色和影響力的消費(fèi)新品牌。
賽迪顧問廣州分公司總經(jīng)理賈紡紡認(rèn)為,在此基礎(chǔ)上,還要大力培育一批同時(shí)掌握行業(yè)和技術(shù)知識(shí)的制造業(yè)數(shù)字化轉(zhuǎn)型領(lǐng)域復(fù)合型人才,滿足行業(yè)發(fā)展對(duì)高素質(zhì)人才的迫切需求,以數(shù)字化轉(zhuǎn)型助力廣東傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級(jí),提高廣東制造業(yè)核心競(jìng)爭(zhēng)力。
需求和機(jī)遇往往伴隨著行業(yè)痛點(diǎn)誕生,不少企業(yè)已經(jīng)“嗅”到了商機(jī),開始借助廣東海量的數(shù)據(jù)資源,研發(fā)高質(zhì)量挖掘數(shù)據(jù)的系統(tǒng)平臺(tái)。
比如,數(shù)據(jù)標(biāo)注企業(yè)云測(cè)數(shù)據(jù),目前就在華南設(shè)有數(shù)據(jù)交付中心和數(shù)據(jù)采集基地。在智能駕駛、智能制造等場(chǎng)景中,其自主研發(fā)的數(shù)據(jù)標(biāo)注平臺(tái),可幫助企業(yè)快速獲取高質(zhì)量數(shù)據(jù),教會(huì)人工智能如何識(shí)別行人、車輛、交通標(biāo)識(shí)等。
“針對(duì)數(shù)據(jù)分析難的問題,通過AI大模型自動(dòng)識(shí)別并建模分析,可幫助企業(yè)快速提煉數(shù)據(jù)價(jià)值。”就在上周,云從科技在廣州宣布“從容”大模型亮相。該公司戰(zhàn)略部總監(jiān)馬磊說,大模型在制造業(yè)領(lǐng)域?qū)⒋笥小坝梦渲亍薄?/p>
轉(zhuǎn)自:南方日?qǐng)?bào)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來源“中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場(chǎng)。版權(quán)事宜請(qǐng)聯(lián)系:010-65363056。
延伸閱讀
版權(quán)所有:中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號(hào)-2京公網(wǎng)安備11010502035964