打造网上国际投资促进平台 致力于中国投资促进事业
您现在的位置:首页 > 产业新闻 > 人工智能 > 文字新闻
人工智能助力古籍线上“活”起来
发布时间:2022-10-12  来源:北京日报  

  近日,由“北京大学-字节跳动数字人文开放实验室”研发的古籍数字化平台“识典古籍”测试版正式上线。目前,平台涵盖390部经典古籍,主要来自《四部丛刊》,共计3000多万字,即日起向公众免费开放。

  据了解,实验室由北京大学与字节跳动于今年3月合作成立,意在将人工智能技术应用于古籍资源的智能化整理,“识典古籍”平台就是双方合作的最新进展。

  当前,我国的古籍数字化尚处于初级阶段,面临技术难度高、资金缺口大、人才紧张等难点。相关资料显示,现存的20多万种古籍中,只有8万种完成影像数字化扫描,近4万种完成文本数字化。据专家统计,从1949年到2019年,国内共修复整理出版古籍近3.8万种,要将现存古籍全部修复整理出来,可能需要300年时间,若利用人工智能技术辅助修复整理,大概二三十年就能完成。

  “识典古籍”项目负责人介绍,平台主要应用了三种技术,包括文字识别、自动标点和命名实体识别。文字识别技术是对古籍的影印版文字进行单个切分,再进行文字识别和顺序识别。自动标点技术通过序列标注的方式对古籍自动进行标点划分。命名实体识别技术则是通过序列标注,识别文本中的人名、地名、书籍、时间、官职等信息。目前平台准确率可达96%至97%。与其他古籍数字化平台相比,“识典古籍”页面简洁,浏览流畅,提供影印底本作为参照,还具备主题词检索和繁简体转换功能,便于专业研究人员、古籍爱好者使用。

  未来三年,“识典古籍”将陆续完成一万种古籍的智能化整理工作,基本覆盖儒家、道家和佛学的核心典籍目录,届时将全部免费开放。平台还将向全社会开放古籍阅读检索研究能力,实现全自动整理校对,更高效地实现存量古籍全部数字化。平台同时鼓励拥有文献的学者自行上传文献,甚至可以参与再创作和再阐释,助力古籍文化传承和研究。

  纸页虽轻,却承载着文化厚重。古代典籍是中华文化传承千年的鲜活见证,字节跳动着力推动古籍保护传承。字节跳动资助国家图书馆定向修复珍贵古籍104册件,现已完成50多册件;在活化方面,抖音平台推出“寻找古籍守护人”计划,旨在激励创作者通过音乐、说书、绘画、复原美食等形式,普及古籍知识、演绎古籍内容,让古籍鲜活起来。

上一条:中铁装备联制“开拓号”超大直径泥水平衡盾构机在珠海隧道顺利下井
下一条:今年国务院将为企业减负超万亿元 降费占六成
与我们联系
  • 联系电话:+86-0512-53660867
  • 传  真:+86-0512-53660867
  • 邮  箱:info@investchn.com
Copyright © 2015-2024 InvestCHN.com All Rights Reserved. 版权所有:投促中国