国产综合视频在线观看,亚洲一区视频在线播放,中文字幕在线网址,最新国产精品视频

書香江蘇在線

搜索
熱搜: 活動(dòng)
微信
qq
weixin
書香江蘇在線 首頁(yè) 域外資訊 “識(shí)典古籍”數(shù)字化平臺(tái):從“活”到“火”,古籍?dāng)?shù)字化之路越走越寬

“識(shí)典古籍”數(shù)字化平臺(tái):從“活”到“火”,古籍?dāng)?shù)字化之路越走越寬

2024-5-22| 發(fā)布者: shiyun| 查看: 491| 評(píng)論: 0|原作者: 中國(guó)新聞出版廣電報(bào)|來自: 江蘇省新聞出版局

摘要: 一直以來,古籍?dāng)?shù)字化整理面臨著技術(shù)、資金等方面的諸多困難,導(dǎo)致數(shù)字化進(jìn)展緩慢,或使用體驗(yàn)不佳等。為解決這些難題,2022年3月,字節(jié)跳動(dòng)公司與北京大學(xué)開展合作,以“北京大學(xué)—字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室”為 ...
  一直以來,古籍?dāng)?shù)字化整理面臨著技術(shù)、資金等方面的諸多困難,導(dǎo)致數(shù)字化進(jìn)展緩慢,或使用體驗(yàn)不佳等。為解決這些難題,2022年3月,字節(jié)跳動(dòng)公司與北京大學(xué)開展合作,以“北京大學(xué)—字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室”為研發(fā)基地,打造“識(shí)典古籍”數(shù)字化平臺(tái)。這是一個(gè)非營(yíng)利性公益平臺(tái),通過OCR(光學(xué)字符識(shí)別)、句讀、實(shí)體識(shí)別、知識(shí)圖譜構(gòu)建等方面的多種技術(shù),實(shí)現(xiàn)古籍的智能化整理,讓古籍能夠以文本的形態(tài)加以檢索、關(guān)聯(lián)閱讀和深度挖掘、利用。
  “識(shí)典古籍”數(shù)字化平臺(tái)于2022年10月開始向公眾免費(fèi)開放,截至今年4月24日,已上線4100部經(jīng)典古籍。該平臺(tái)產(chǎn)品相關(guān)負(fù)責(zé)人近日告訴記者,平臺(tái)未來將陸續(xù)完成1萬(wàn)種古籍的智能化整理工作,基本覆蓋儒家、道家和佛學(xué)的核心典籍目錄。

  技術(shù)賦能,古籍?dāng)?shù)字化開新篇
  古籍?dāng)?shù)字化的作用是活化,要讓越來越多的人了解與使用古籍。但古籍?dāng)?shù)字化并非易事,如果按照傳統(tǒng)方式解決古籍?dāng)?shù)字化過程中大量異體字、生僻字、標(biāo)點(diǎn)、閱讀順序等問題,相關(guān)單位需要一本本、一頁(yè)頁(yè)進(jìn)行人工掃描、校對(duì),會(huì)耗費(fèi)大量人力、物力,這成為古籍?dāng)?shù)字化的攔路虎。在這種背景下,具有很多互聯(lián)網(wǎng)和人工智能技術(shù)經(jīng)驗(yàn)的字節(jié)跳動(dòng),開始思索如何用技術(shù)為古籍?dāng)?shù)字化賦能。
  作為一家以內(nèi)容為主的公司,字節(jié)跳動(dòng)在內(nèi)容識(shí)別、內(nèi)容檢索等方面的技術(shù)上擁有天然的優(yōu)勢(shì),而這也反映在古籍?dāng)?shù)字化方面。字節(jié)跳動(dòng)相關(guān)負(fù)責(zé)人告訴記者,“識(shí)典古籍”數(shù)字化平臺(tái)解決了古籍?dāng)?shù)字化的兩大難題:古籍掃描準(zhǔn)確率以及轉(zhuǎn)換效率較低。目前行業(yè)內(nèi)OCR的識(shí)別準(zhǔn)確率平均為93%—94%,而“識(shí)典古籍”數(shù)字化平臺(tái)將這個(gè)數(shù)字提高到96%—97%。
  由于古籍沒有標(biāo)點(diǎn)符號(hào),因此以往需要人工添加標(biāo)點(diǎn)符號(hào)。而“識(shí)典古籍”數(shù)字化平臺(tái)通過算法,給原本缺少斷句的古籍自動(dòng)打上標(biāo)點(diǎn)符號(hào)。此外,為了進(jìn)一步提升文字識(shí)別的精準(zhǔn)度,命名實(shí)體識(shí)別技術(shù)會(huì)通過預(yù)測(cè)文字的實(shí)體標(biāo)簽,識(shí)別包括人名、地名、書籍、時(shí)間、官職在內(nèi)的5種類型的專有名詞。
  該相關(guān)負(fù)責(zé)人表示,除了應(yīng)用于古籍閱讀之外,“識(shí)典古籍”數(shù)字化平臺(tái)還將致力于提高古籍智能整理的能力,通過提供開放、一站式的古籍智能化整理工具,吸引更多收藏家自主上傳古籍資源。“我們不斷優(yōu)化OCR等算法,支撐不同樣式和掃描條件的古籍,借助飛書編輯器框架,打造體驗(yàn)良好、協(xié)作性強(qiáng)的校對(duì)、校勘體驗(yàn),簡(jiǎn)單培訓(xùn)后普通人也能上手。對(duì)于愿意將整理后的古籍通過‘識(shí)典古籍’開放給大眾閱讀的機(jī)構(gòu),可以免費(fèi)使用‘識(shí)典古籍’的整理平臺(tái)及其智能技術(shù)。”

  古籍活化,建立可打通知識(shí)圖譜
  把古籍的文字從紙張油墨轉(zhuǎn)變?yōu)閿?shù)字化的“1、0”,并不是古籍活化的關(guān)鍵。古籍活化就是要把古籍里面蘊(yùn)含的信息文化知識(shí)活化,讓年輕讀者了解古籍蘊(yùn)含的文化知識(shí),而“識(shí)典古籍”數(shù)字化平臺(tái)的知識(shí)圖譜化整理在這方面發(fā)揮了重大作用。
  據(jù)了解,使用者可以根據(jù)自己的需求進(jìn)行關(guān)鍵詞檢索,快速找到所需信息;還可以根據(jù)實(shí)體(時(shí)代、人物、地點(diǎn)等)作整體性分析和關(guān)聯(lián)檢索,讓分散在同一本古籍不同位置,或不同古籍的相關(guān)知識(shí)快速、全面聚合,打造一個(gè)完善的知識(shí)圖譜。
  “這相當(dāng)于搭建了一座古籍智能化數(shù)字圖書館,讓研究者找資料時(shí),不再需要一本本書查找、一頁(yè)頁(yè)翻閱。比如用戶檢索‘道義’,就可以了解該概念起源于哪個(gè)朝代的哪本典籍,以及它在各種書籍中的出現(xiàn)情況,從而快速推動(dòng)相關(guān)研究,這對(duì)傳統(tǒng)文化研究具有重要意義。”字節(jié)跳動(dòng)相關(guān)負(fù)責(zé)人表示。
  知識(shí)圖譜的作用遠(yuǎn)不止如此。據(jù)悉,“識(shí)典古籍”數(shù)字化平臺(tái)還可以在專有名詞基礎(chǔ)上識(shí)別這些專有名詞之間的關(guān)系,把人名、地名、官名、書名都識(shí)別出來,并試圖提取人、地和官職之間的關(guān)系,轉(zhuǎn)化成圖譜形態(tài),再與百科、各種問答應(yīng)用、旅游產(chǎn)品等聯(lián)系在一起,實(shí)現(xiàn)全方位的數(shù)字化賦能。
  據(jù)了解,字節(jié)跳動(dòng)向全社會(huì)開放古籍閱讀檢索研究權(quán)限,任何人都可以通過平臺(tái)搭建自己的古籍知識(shí)圖譜。他們無(wú)需親自翻閱多本書籍,就可以獲取完整的詞義,節(jié)省了研究者和讀者的時(shí)間。

  開放合作,宣傳讓古籍“火”起來
  讓古籍“活”起來只是第一步,還要讓古籍“火”起來。字節(jié)跳動(dòng)相關(guān)負(fù)責(zé)人表示,“識(shí)典古籍”數(shù)字化平臺(tái)的一個(gè)重要功能就是古籍活化傳承,通過古籍?dāng)?shù)字化提供更多的延展內(nèi)容和趣味玩法。
  據(jù)了解,“識(shí)典古籍”數(shù)字化平臺(tái)上線了電腦網(wǎng)頁(yè)版以及手機(jī)移動(dòng)版,用戶在此可以實(shí)現(xiàn)分詞檢索、圖文對(duì)照、繁簡(jiǎn)轉(zhuǎn)換、字典釋義、文白對(duì)照、實(shí)體百科等功能。同時(shí),今日頭條還專門開放古籍平臺(tái),展示平臺(tái)成果。截至今年4月24日,已經(jīng)累計(jì)有超過6231萬(wàn)人次通過今日頭條古籍頻道、網(wǎng)頁(yè)版等了解和閱讀古籍。
  在古籍?dāng)?shù)字化的基礎(chǔ)上,字節(jié)跳動(dòng)公益還聯(lián)合中國(guó)文物保護(hù)基金會(huì)、中國(guó)國(guó)家圖書館發(fā)起“尋找古籍守護(hù)人”活動(dòng),招募創(chuàng)作者,通過抖音、西瓜視頻、今日頭條等平臺(tái),創(chuàng)作相關(guān)內(nèi)容,推動(dòng)古籍活化,助力傳統(tǒng)文化傳承;此外,還推出古籍活化紀(jì)錄片《穿越時(shí)空的古籍》、VR互動(dòng)紀(jì)錄片《古籍尋游記》,以及系列古籍公開課等,整理古籍活化成果。一整套組合拳下來,成效斐然。
  其中,“尋找古籍守護(hù)人”活動(dòng)約有7萬(wàn)名創(chuàng)作者參與,視頻累計(jì)播放量24億次;古籍公開課共發(fā)布25期公開課,25位名師開講,涵蓋“識(shí)典古籍”數(shù)字化平臺(tái)上20余部古籍,觀看量超過9600萬(wàn)次。“現(xiàn)在我們以多元形式傳播古籍知識(shí),受到了行業(yè)的關(guān)注和認(rèn)可,特別是受到年輕人的喜愛。這給予我們信心,因?yàn)楣偶膫鞒性谀贻p人,古籍‘活’化和‘火’起來的種子,也要靠他們播撒。”字節(jié)跳動(dòng)相關(guān)負(fù)責(zé)人說道。

鮮花

握手

雷人

路過

雞蛋

媒體聚焦

省內(nèi)推薦

版權(quán)所有:江蘇現(xiàn)代快報(bào)傳媒有限公司 指導(dǎo)單位:江蘇省新聞出版局 江蘇省全民閱讀辦 主管單位:江蘇鳳凰出版?zhèn)髅郊瘓F(tuán) 主辦單位:江蘇現(xiàn)代快報(bào)傳媒有限公司  協(xié)辦單位:江蘇省全民閱讀促進(jìn)會(huì)
備案號(hào):蘇ICP備10080896號(hào)-8  地址:南京市洪武北路55號(hào)置地廣場(chǎng) 郵編:210005 電話:025-84783597 傳真:025-84783531 技術(shù)支持:江蘇現(xiàn)代快報(bào)傳媒有限公司   隱私政策
返回頂部