国产综合视频在线观看,亚洲一区视频在线播放,中文字幕在线网址,最新国产精品视频

書(shū)香江蘇在線

搜索
熱搜: 活動(dòng)
微信
qq
weixin
書(shū)香江蘇在線 首頁(yè) 各地動(dòng)態(tài) 南京 南農(nóng)研究團(tuán)隊(duì)發(fā)布國(guó)內(nèi)首個(gè)“古籍版ChatGPT”

南農(nóng)研究團(tuán)隊(duì)發(fā)布國(guó)內(nèi)首個(gè)“古籍版ChatGPT”

2024-1-31| 發(fā)布者: shiyun| 查看: 2195| 評(píng)論: 0|原作者: 楊頻萍 許天穎|來(lái)自: 新華日?qǐng)?bào)

摘要: 近日,南京農(nóng)業(yè)大學(xué)信息管理學(xué)院王東波教授研究團(tuán)隊(duì)研發(fā)的“荀子”古籍大語(yǔ)言模型發(fā)布,這是國(guó)內(nèi)首個(gè)專門應(yīng)用于古籍處理與研究的智能工具,包含了《四庫(kù)全書(shū)》在內(nèi)的古籍文獻(xiàn)超20億字大型語(yǔ)料庫(kù),能夠?qū)崿F(xiàn)自然語(yǔ)言理 ...
  近日,南京農(nóng)業(yè)大學(xué)信息管理學(xué)院王東波教授研究團(tuán)隊(duì)研發(fā)的“荀子”古籍大語(yǔ)言模型發(fā)布,這是國(guó)內(nèi)首個(gè)專門應(yīng)用于古籍處理與研究的智能工具,包含了《四庫(kù)全書(shū)》在內(nèi)的古籍文獻(xiàn)超20億字大型語(yǔ)料庫(kù),能夠?qū)崿F(xiàn)自然語(yǔ)言理解、自動(dòng)翻譯、詩(shī)歌生成、自動(dòng)標(biāo)引等多項(xiàng)功能,作為開(kāi)源的、公益的研究成果,該模型已在GitHub(https://github.com/Xunzi-LLM-of-Chinese-classics/XunziALLM)、ModelScope(https://modelscope.cn/models/Xunzillm4cc/Xunzi-Qwen-Chat)等網(wǎng)站開(kāi)源。
  為何取名“荀子”?王東波介紹,荀子不僅是我國(guó)先秦時(shí)期偉大的樸素唯物主義的思想家,也是一位散文大家。在對(duì)他作品的深入研討中團(tuán)隊(duì)發(fā)現(xiàn),其在語(yǔ)言學(xué)理論的闡述上也是一位開(kāi)拓者,命名為“荀子”是為了紀(jì)念這位中國(guó)歷史上的語(yǔ)言學(xué)先驅(qū)。對(duì)于普通受眾而言,想要走近繁體、豎版、未添加句逗的古文不是一件容易的事,而“荀子”的上線意味著在智媒時(shí)代和古籍對(duì)話成為可能。
  “咱們請(qǐng)它以金陵為主題,生成一首五言絕句。”王東波現(xiàn)場(chǎng)演示了“荀子”的智能寫(xiě)詩(shī)功能,指令一輸入,系統(tǒng)便生成了一首堪稱絕妙的原創(chuàng)古典詩(shī):“秦淮佳麗地,城闕望中迷。柳暗青絲發(fā),花香碧玉衣。歌樓留夜色,畫(huà)閣斂春暉。細(xì)雨輕舟去,雙魚(yú)夢(mèng)澤飛。”
  除此之外,古文的閱讀理解、標(biāo)點(diǎn)添加,以及將古漢語(yǔ)翻譯為現(xiàn)代漢語(yǔ),這些讓受眾難啃的“硬骨頭”,“荀子”都可以輕松拿下。
  對(duì)于領(lǐng)域?qū)<叶裕麄兛梢越柚败髯印蓖瓿晒偶~法分析、實(shí)體識(shí)別、關(guān)系抽取、文本分類與匹配、文本摘要等專業(yè)古籍研究處理場(chǎng)景。同時(shí)發(fā)布的基座模型,還可以讓用戶根據(jù)自己的需求,使用本地的訓(xùn)練語(yǔ)料微調(diào)“荀子”基座模型,使其在古籍下游處理任務(wù)上取得更優(yōu)越的處理性能。
  盡管目前有200多個(gè)通用模型在各領(lǐng)域得到應(yīng)用,但古籍領(lǐng)域仍缺乏專業(yè)的大語(yǔ)言模型。功能強(qiáng)大的“荀子”到底是怎么做到化繁為簡(jiǎn)、通讀古今的呢?“首先是‘算力充足’并且‘飽讀經(jīng)書(shū)’!”王東波介紹,“荀子”的順利問(wèn)世離不開(kāi)南京農(nóng)業(yè)大學(xué)提供的高性能算力基礎(chǔ)設(shè)施支持,以及團(tuán)隊(duì)長(zhǎng)期積累的大量標(biāo)注、精加工語(yǔ)料庫(kù),團(tuán)隊(duì)給“荀子”投喂了40億字大型混合語(yǔ)料數(shù)據(jù)。
  “模型的構(gòu)建受算力、場(chǎng)景應(yīng)用等多方面影響,但精準(zhǔn)度較高的優(yōu)質(zhì)數(shù)據(jù),是最為關(guān)鍵的。”據(jù)王東波介紹,團(tuán)隊(duì)從2008年開(kāi)始接觸古籍,2013年至今一直專注于人工精標(biāo)注數(shù)據(jù)的工作。“比如《岳陽(yáng)樓記》,要訓(xùn)練機(jī)器標(biāo)注該典籍中的形容詞,就要首先訓(xùn)練相關(guān)人員標(biāo)注形容詞,在大量人工標(biāo)注的基礎(chǔ)上,再讓機(jī)器學(xué)習(xí)。”這項(xiàng)坐冷板凳的基礎(chǔ)標(biāo)注工作一做就是10年之久。
  王東波表示,我們期待能將古籍的智能化研究與跨學(xué)科的人才培養(yǎng)相結(jié)合,讓學(xué)生既有前瞻的科研視野,又能積累較為深厚的人文底蘊(yùn),同時(shí)讓更多受眾接觸古籍、品讀古籍、傳播古籍,真正地?zé)ɑ睢肮始埗选保餐苿?dòng)中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉(zhuǎn)化和創(chuàng)新性發(fā)展,賡續(xù)傳承中華文脈。
  聯(lián)合發(fā)布荀子古籍大語(yǔ)言模型的中華書(shū)局古聯(lián)公司則主要致力于未來(lái)的場(chǎng)景應(yīng)用和領(lǐng)域推廣,荀子大模型除讓大眾用戶能夠順暢利用古籍內(nèi)容、在專業(yè)領(lǐng)域推動(dòng)古籍整理、古籍?dāng)?shù)字化、古籍活化利用與傳播之外,未來(lái)還可廣泛應(yīng)用于AI寫(xiě)作、AI教學(xué)、數(shù)字文娛等領(lǐng)域。
  該成果依托國(guó)家社科基金重大項(xiàng)目“中國(guó)古代典籍跨語(yǔ)言知識(shí)庫(kù)構(gòu)建及應(yīng)用研究”實(shí)施。在同步舉行的古籍智能化研究與產(chǎn)業(yè)應(yīng)用研討會(huì)上,來(lái)自高校、出版界和互聯(lián)網(wǎng)企業(yè)的與會(huì)專家學(xué)者分別立足于各自領(lǐng)域,圍繞大模型在古籍整理、傳統(tǒng)文化傳承、數(shù)字化轉(zhuǎn)型等方面的工作進(jìn)行了深入探討。

鮮花

握手

雷人

路過(guò)

雞蛋
版權(quán)所有:江蘇現(xiàn)代快報(bào)傳媒有限公司 指導(dǎo)單位:江蘇省新聞出版局 江蘇省全民閱讀辦 主管單位:江蘇鳳凰出版?zhèn)髅郊瘓F(tuán) 主辦單位:江蘇現(xiàn)代快報(bào)傳媒有限公司  協(xié)辦單位:江蘇省全民閱讀促進(jìn)會(huì)
備案號(hào):蘇ICP備10080896號(hào)-8  地址:南京市洪武北路55號(hào)置地廣場(chǎng) 郵編:210005 電話:025-84783597 傳真:025-84783531 技術(shù)支持:江蘇現(xiàn)代快報(bào)傳媒有限公司   隱私政策
返回頂部