实博体育下载app

实博体育下载app

全(quan)国累计在线发布古籍(ji)数字资源(yuan)13万部(件) 数字化助(zhu)古籍(ji)走出“深闺高阁”

来源: 2024-01-30 点击:

为(wei)查阅古(gu)(gu)籍(ji)文献,要出差到各地,探访各家图书馆(guan)——这(zhei)是许多古(gu)(gu)籍(ji)研究(jiu)者(zhe)的共(gong)同记忆(yi)。在数(shu)(shu)字(zi)(zi)(zi)时(shi)代,这(zhei)种情况正发(fa)生改(gai)变。国家图书馆(guan)(国家古(gu)(gu)籍(ji)保护中心)等6家单位近(jin)日在线新增(zeng)发(fa)布古(gu)(gu)籍(ji)数(shu)(shu)字(zi)(zi)(zi)资(zi)源6786部(件)。至(zhi)此,全国已累计在线发(fa)布古(gu)(gu)籍(ji)数(shu)(shu)字(zi)(zi)(zi)资(zi)源13万(wan)部(件)。依托数(shu)(shu)字(zi)(zi)(zi)化手段,卷帙浩繁(fan)的古(gu)(gu)籍(ji)走出“深闺高(gao)阁”,让文明触手可及(ji)。

兼顾“藏”与“用”

古(gu)(gu)籍(ji),作(zuo)为(wei)文物必须保护(hu),作(zuo)为(wei)文献(xian)必须为(wei)读者所(suo)用(yong)。兼顾“藏”与“用(yong)”,一直(zhi)是古(gu)(gu)籍(ji)保护(hu)工作(zuo)的重点,而数(shu)字(zi)化是最好的方法。中国古(gu)(gu)籍(ji)数(shu)字(zi)化起步于(yu)20世纪90年代。随着(zhe)数(shu)字(zi)技术不断(duan)成熟,科技赋能古(gu)(gu)籍(ji)工作(zuo)取得(de)可喜进展。

“2016年国家图(tu)(tu)(tu)书(shu)(shu)馆搭(da)建(jian)(jian)起‘中华古(gu)(gu)籍(ji)资源库’平(ping)台(tai),发布了普通古(gu)(gu)籍(ji)、甲骨、敦(dun)煌文献等数字资源,并全部实现免登录在线阅(yue)览。”国家图(tu)(tu)(tu)书(shu)(shu)馆副研究员(yuan)南江涛介绍,国家图(tu)(tu)(tu)书(shu)(shu)馆还联合(he)海内外收藏机构(gou)(gou)发布“法藏敦(dun)煌遗书(shu)(shu)”“天津(jin)图(tu)(tu)(tu)书(shu)(shu)馆古(gu)(gu)籍(ji)”“云南省图(tu)(tu)(tu)书(shu)(shu)馆古(gu)(gu)籍(ji)”等,基本搭(da)建(jian)(jian)“国家古(gu)(gu)籍(ji)数字平(ping)台(tai)”架构(gou)(gou)。

随着“中华古(gu)籍(ji)保护计划”深(shen)入开展(zhan),各地图(tu)书(shu)馆(guan)陆续(xu)投入人力物力,大力推进古(gu)籍(ji)数(shu)字化。国家图(tu)书(shu)馆(guan)先后(hou)联合(he)(he)39家单位(wei)发布(bu)(bu)数(shu)字古(gu)籍(ji),1月(yue)4日是第(di)7次(ci)联合(he)(he)发布(bu)(bu),其中不仅包含明清版刻,还有碑帖拓(tuo)本等特色资(zi)(zi)源。相关数(shu)据(ju)显示,在现有的13万(wan)部(件)数(shu)字古(gu)籍(ji)中,超(chao)过10.2万(wan)部(件)归属(shu)于“中华古(gu)籍(ji)资(zi)(zi)源库(ku)”。

“这13万(wan)部(件)古籍(ji)(ji)数字资源(yuan),对于我们研究者(zhe)来说格外珍贵。”北京大学中文(wen)系(xi)教授杨海峥感叹(tan),在(zai)线(xian)查阅免去了往返奔波(bo)图(tu)书馆(guan)的(de)时间,平衡了古籍(ji)(ji)的(de)文(wen)物性(xing)与文(wen)献性(xing)。

AI助力古籍整理

把(ba)纸质古(gu)籍(ji)转化成数(shu)字文(wen)(wen)本,只是古(gu)籍(ji)保护(hu)的第一(yi)步(bu)。“现有的数(shu)字古(gu)籍(ji)大多由(you)缩微胶(jiao)片转换(huan)而(er)成,分辨率低,使用也不方便(bian)。”杨海峥举例解(jie)释,这类古(gu)籍(ji)通常不具备检索(suo)功能,想查阅(yue)某个(ge)内容,需逐篇(pian)逐页阅(yue)读原(yuan)文(wen)(wen),很难快(kuai)速(su)找到想要(yao)的知识。

人(ren)工(gong)智能(neng)的(de)(de)快(kuai)速发(fa)展,为数字古籍(ji)的(de)(de)整理分类带来革命性变化(hua)。2022年10月,由字节跳(tiao)动(dong)与(yu)北(bei)京大学(xue)数字人(ren)文研究中(zhong)心合作(zuo)研发(fa)的(de)(de)数字古籍(ji)平台“识典古籍(ji)”便是一个生动(dong)案例。

进入(ru)“识典古(gu)籍”的(de)(de)网(wang)站,记者看到《周易》《左(zuo)传(chuan)》《礼记》等陈列(lie)于实博体育(yu)下载(zai)app上。随机(ji)点开一本,左(zuo)侧(ce)为(wei)章节目录,右侧(ce)为(wei)正文,排(pai)版(ban)形式既(ji)顺应现代人的(de)(de)阅读习惯,又还(hai)原了(le)古(gu)籍纸张的(de)(de)阅读美感。

“与(yu)一些数字(zi)化平台(tai)(tai)不(bu)同(tong),‘识(shi)典古籍’是完全免费的(de),而且增加了(le)简繁体转换(huan)、底本影像对照(zhao)、全文检索(suo)等一系列便捷功(gong)能。”抖音集团(tuan)企业实博体育下载(zai)app部产(chan)品总经理唐垲鑫介(jie)绍,该平台(tai)(tai)主要应(ying)用了(le)文字(zi)识(shi)别(bie)、自动标点和命(ming)名实体识(shi)别(bie)这3种技术,不(bu)仅(jin)能将影印本上的(de)文字(zi)提取整理,还能通过(guo)序列标注识(shi)别(bie)文本中的(de)人名、地名等信(xin)息,准确率达到96%至97%。

“平(ping)台已整理上(shang)线了685部经典古籍,共计7900多万字(zi),主要来自《四部丛刊》。”唐垲鑫说,“识典古籍”已上(shang)线手机(ji)移动版,未来平(ping)台中的书目将持续更新(xin)。

业(ye)内(nei)人士(shi)预(yu)测,随着AI技术的(de)运用(yong),古籍文(wen)献中(zhong)所蕴藏的(de)古代(dai)历史文(wen)化知(zhi)识将不断被抽取,构(gou)造成(cheng)各种各样(yang)的(de)知(zhi)识库(ku),并将以知(zhi)识图谱(pu)的(de)形式(shi)支持互联网前(qian)端应用(yong)。

跨界合作成趋势

事(shi)实上,在“识典古(gu)籍(ji)”上线(xian)之前,文(wen)保(bao)机构、科研(yan)院校与(yu)互联(lian)网公司的跨界(jie)合(he)作(zuo)已越(yue)来越(yue)普遍。比如,腾讯联(lian)合(he)敦煌研(yan)究院开(kai)发了(le)AI病(bing)害(hai)识别(bie)技术,帮助“问(wen)诊”敦煌千(qian)年壁画。

由(you)于在(zai)产(chan)品(pin)研(yan)发、设计方面存(cun)在(zai)优(you)势,互联网(wang)公(gong)司等(deng)社会力量的(de)加入会进一步保障(zhang)古籍(ji)数(shu)字化平台(tai)的(de)服务质(zhi)量。“我们有优(you)秀的(de)产(chan)品(pin)经理、设计师、软件工程(cheng)师,能够不断(duan)优(you)化数(shu)字古籍(ji)平台(tai)的(de)产(chan)品(pin)功(gong)能。”唐垲鑫说。

“识典(dian)古籍”的诞生离(li)不开专家学(xue)者支持。北京大学(xue)数字人文研究中心(xin)主(zhu)任王军表示,北大在(zai)这次合作中负责人工审核与校对,弥补(bu)人工智能有识别(bie)错(cuo)误(wu)率的短板,并(bing)利用自有学(xue)术平台,连接更多专业研究者和学(xue)生群体。

专家认为(wei),在古籍整理(li)中,人文社科学(xue)者要(yao)积极介入(ru),并加强(qiang)与技术人员的合(he)作,那样才(cai)能更好(hao)地利(li)用机器而不是被(bei)机器牵着(zhe)鼻子(zi)走,从而保证结果的准确性。

“高校(xiao)古典文献学等相关专业如何培养兼具(ju)技术与学术能力(li)的复合型人才(cai)、如何形成多(duo)学科交(jiao)叉(cha)的课(ke)程体系(xi)等,都是需要综合考虑的问题。”王(wang)军说。

    Copyrights© All Rights Reserved 版权所有 甘肃文旅产业集团有限公司