5月19日,在第七屆世界智能大會上,由國家超級計算天津中心“天河E級智能計算開放創(chuàng)新平臺”訓練研發(fā)的“天河天元大模型”正式發(fā)布。該模型是立足國產(chǎn)天河超級算力和智能算力,匯集構建中文大數(shù)據(jù)集,由平臺自主訓練研發(fā)的大型模型。
生成式通用智能是重大變革性突破。以ChatGPT為代表的生成式智能開啟了人工智能發(fā)展新階段。與單一判別式智能工具不同,生成式智能是文本生產(chǎn)、數(shù)據(jù)分析、代碼編寫、圖像生成等跨媒體多模態(tài)領域的通用智能工具,將滲入到生產(chǎn)、教育、工作生活等場景,并對人類生產(chǎn)方式、思想認知、社會治理等帶來變革性影響,將重塑人與智能機器生產(chǎn)關系。
訓練模型以數(shù)據(jù)和算力為基礎。谷歌BERT、OpenAI的GPT和百度文心大模型其參數(shù)規(guī)模已提升至千億、萬億,并隨之帶來巨大的數(shù)據(jù)量級需求。
天津依托天河占據(jù)了全國超過20%的超級計算算力資源,成為算力賦能科技創(chuàng)新和產(chǎn)業(yè)發(fā)展重鎮(zhèn)。天河E級智能計算開放創(chuàng)新平臺將帶來突破百億億次的多精度融合超級計算算力。
天津超算中心搜集整理了網(wǎng)頁數(shù)據(jù)、各種開源訓練數(shù)據(jù)、古文數(shù)據(jù)、百科數(shù)據(jù)、新聞數(shù)據(jù),以及專業(yè)領域的中醫(yī)、醫(yī)藥、問診、法律等多種數(shù)據(jù)集,訓練打造了自主研發(fā)的中文語言大模型——天河天元大模型。同時啟動面向醫(yī)療、工業(yè)、法律等領域?qū)I(yè)模型深度訓練,模型將作為產(chǎn)業(yè)智能化升級基座,用專業(yè)數(shù)據(jù)集,打造更貼合行業(yè)領域的智能化高水平“專家”。
未來,以生成式AI為基座的產(chǎn)業(yè)鏈,將成為智能化升級過程中可大規(guī)模復用的基礎設施。在大模型通用性、泛化性以及降低人工智能應用門檻的優(yōu)勢推動下,人工智能也將會加快落地,形成新的機遇。(經(jīng)濟日報記者 商瑞)
轉(zhuǎn)自:經(jīng)濟日報客戶端
【版權及免責聲明】凡本網(wǎng)所屬版權作品,轉(zhuǎn)載時須獲得授權并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關法律責任的權力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權事宜請聯(lián)系:010-65363056。
延伸閱讀