此基礎(chǔ)上啟動(dòng)深度訓(xùn)練面向醫(yī)療、工業(yè)、法律等領(lǐng)域的專業(yè)模型。

國產(chǎn)中文大語言模型天河天元發(fā)布

2023-05-22 08:19:31發(fā)布     來源:多知網(wǎng)    作者:哆啦  

  多知網(wǎng)5月22日消息,近日,在第七屆世界智能大會上,國家超級計(jì)算天津中心正式發(fā)布打造天河 E 級智能計(jì)算開放創(chuàng)新平臺和天河天元大模型。

  據(jù)介紹,國家超算天津中心搜集整理了網(wǎng)頁數(shù)據(jù)、各種開源訓(xùn)練數(shù)據(jù)、中文小說數(shù)據(jù)、古文數(shù)據(jù)、百科數(shù)據(jù)、新聞數(shù)據(jù)以及專業(yè)領(lǐng)域的中醫(yī)、醫(yī)藥、問診、法律等多種數(shù)據(jù)集,訓(xùn)練數(shù)據(jù)集總 token 數(shù)達(dá)到 350B,訓(xùn)練打造了自己的中文語言大模型——天河天元大模型。

  同時(shí)大模型還在持續(xù)訓(xùn)練和完善中,并在此基礎(chǔ)上啟動(dòng)深度訓(xùn)練面向醫(yī)療、工業(yè)、法律等領(lǐng)域的專業(yè)模型。

  據(jù)悉,天河 E 級智能計(jì)算開放創(chuàng)新平臺將帶來突破百億億次的跨模態(tài)的超級計(jì)算算力,支撐傳統(tǒng)的科學(xué)工程計(jì)算,并服務(wù)智能混合計(jì)算,打造全方位的算力賦能創(chuàng)新和數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展載體。