我國將打造1.2億詞級蒙古文文獻(xiàn)語料庫


來源:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)   時間:2018-12-04





  我國正在建設(shè)一個總字?jǐn)?shù)將達(dá)到1.2億詞的大型蒙古文文獻(xiàn)語料庫,目前已完成800萬字語料的錄入校對工作。


  記者從承擔(dān)這項工作的內(nèi)蒙古自治區(qū)社會科學(xué)院了解到,蒙古文文獻(xiàn)語料庫,將窮盡式收集和納入自蒙古文第一部文獻(xiàn)《成吉思汗碑文》(1225年)以來的中世紀(jì)傳統(tǒng)蒙古文文獻(xiàn)和近代蒙古文木刻本文獻(xiàn)。對于現(xiàn)代文獻(xiàn),將按學(xué)科分類,即按法律法規(guī)、文學(xué)藝術(shù)、新聞媒體、醫(yī)藥醫(yī)學(xué)、應(yīng)用公文、教學(xué)教材、軍事、體育等擇優(yōu)選錄。


  蒙古文文獻(xiàn)語料庫建設(shè)將通過錄入、校對、數(shù)據(jù)標(biāo)注加工等環(huán)節(jié),按照國際領(lǐng)先水準(zhǔn),設(shè)計蒙古文語料資源管理平臺網(wǎng)絡(luò)版。其最終目標(biāo)是建成世界最大、最全、最精的網(wǎng)絡(luò)版蒙古文文獻(xiàn)語料庫,為保護(hù)、開發(fā)、利用蒙古文文獻(xiàn)資料提供基礎(chǔ)。


  2015年策劃開展的這項工作將于2024年結(jié)束。目前,正在進(jìn)行共109卷的佛教經(jīng)典蒙古文《甘珠爾經(jīng)》的錄入工作。(記者 勿日汗)


  轉(zhuǎn)自:新華社

 

  版權(quán)及免責(zé)聲明:凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章,不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

熱點(diǎn)視頻

性能提升、服務(wù)擴(kuò)展,北斗三號基本系統(tǒng)建成 性能提升、服務(wù)擴(kuò)展,北斗三號基本系統(tǒng)建成

熱點(diǎn)新聞

熱點(diǎn)輿情

特色小鎮(zhèn)

?

微信公眾號

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964