北京师范大学学报(社会科学版) ›› 2023, Vol. 0 ›› Issue (5): 127-141.
李飞跃
LI Feiyue
摘要: 随着古籍的电子化与数据库应用,曾经停废的大量汉字被激活。字体字形多样、字际关系复杂和编码系统不一,严重阻碍了古籍文本的编辑、保存、呈现、转换、检索及深度利用。文本的电子化、规范化及标准化是古籍数字化的起点,也是数字设施建设和数字人文研究的基础。近代以来新旧字体、正俗字形与字符编码的三次系统性变更,决定了字符集与文本库建设只能以发布的各种国家标准为基础。纵观历史,汉字一直处在不断统一规范的进程中,汉文典籍的一致性让中华文明具有突出的统一性。创建统一字符集和标准文本库将是继秦朝“书同文字”之后的全新规范,也是汉字系统继从刻画到书写,又到数码形态的再次重置。“再造书契”有利于实现古籍数据的统一刻画、深度标引、交互整合和多功能开发,促进古籍文本结构化、知识体系化、平台智能化,推动古籍整理利用的转型升级。
中图分类号: