首 页 在线服务 华夏记忆 政府信息 科研参考 图书馆界 企业资讯 新农村建设
 
        华夏记忆首页 >> 研究 >> 鲍国强:文献编目新理念对古籍数字化的影响


鲍国强:文献编目新理念对古籍数字化的影响

      


    近年来,在文献数字化的大潮中,古籍数字化项目也正陆续实施并完成投入使用。但古籍数字化系统的完整含义到底包括哪些内容的问题依然处于探讨当中。与此同时,国内外文献编目领域也在不断提出新的理论和观念,如FRBR基本模式和全面规范理论等。到目前为止,尚未看到这些文献编目新理念对古籍数字化工作产生实质性影响。其中的关系是否真的如此?本文拟在分析归纳文献编目新理念的基础上,具体说明古籍数字化完整系统的主要内容,并从书目揭示、信息规范、知识链接和工具保障四个层面阐述这些新的编目原则和理论对古籍数字化工作的重大影响。不周之处,敬请专家学者指正。
    1 文献编目新理念
    纵观国内外最新提出的文献编目理论和观念,可归纳出两个明显的特点:1.国内外最新的文献编目理念正在与传统“辨章学术,考镜源流”的编目原则相结合;2.用新型的文献加工成果和数据库技术体现图书馆“服务第一”的立馆宗旨。由此可见,越是传统的,初始的,也就是与国际标准接轨的,现代化的。
    1.1 FRBR基本原则
    1997年,FRBR(《书目记录的功能需求》)[1]提出:work是一个独特的智力投入或艺术创作;expression是一个文献的智力或艺术实现;manifestation是反映一个文献的具体物质;item是一个文献表现形式的单独样本。若直译,它们分别是著作、内容表达、载体表现和单件。本文为顺应文献编目习惯,暂使用著作、品种、版本和复本作为对应称谓。这是FRBR把文献实体区分成四个层次,也就是需要文献目录揭示的四个范围大小不同依次递减的文献实体。
其次,FRBR提出了文献相关实体的基本属性。如著作具有题名、形式、日期、预期的利用者和背景等基本属性;品种具有题名、形式、日期、语言、内容提要、背景和使用限制等基本属性;版本具有某版题名、某版责任说明、版次、版本类型、出版地/发行地、出版者/发行者、出版/发行日期、载体形态等基本属性;复本具有复本索书号、复本来源、批校题跋、展览历史、复本现状和处置历史(被伪造或修复)等基本属性。这是FRBR定义了不同层次文献目录的揭示范围。书目的层次不同,其揭示的范围和重点也不一样。
    第三,FRBR还梳理了文献实体的相互关系。如著作具有著作→著作关系、著作整体/部分关系、著作→品种关系;品种具有品种→品种关系、品种整体/部分关系、品种→著作关系、品种—→版本关系;版本具有版本→版本关系、版本整体/部分关系、版本→品种关系、版本→复本关系;复本具有复本→复本关系、复本整体/部分关系、复本→版本关系。各种关系中箭头所示虽是单向的,但互相之间的关系已经穷举,所以,实际上每种关系都是双向的。如版本的版本→复本关系即指刻本古籍与具有某一题跋的刻本古籍的关系,两者之间的关系实际上是双向的。
    FRBR的基本内容就是表述了文献目录类型、揭示范围和职责使命,使数千年来的书目工作第一次出现了明朗化迹象。如书目的层次范围不清,就难以达到“辨章学术,考镜源流”的目的,即传统的目录功能都不具备。
    1.2 复本编目观念
    关于古籍复本编目问题,《ISBD(A)》后所附的IFLA国际书目控制和国际MARC委员会(UBCIM)主持编写的《UNIMARC指南3.古籍(善本)》[2]中有原则说明:“理想本或完整本和残缺本”作为UNIMARC模式的著录依据需要明确区分,以便适合日益突出的古籍机读目录和网上联机编目的需要。它认为:1.古籍的“理想本或完整本”就是进入发行或流传领域以前的图书,它所具有的是古籍的完整版本特征,还没有“打上”发行或流通收藏领域的烙印。2.编目员手头所编的古籍都是复本。复本包含了古籍流传、收藏过程中产生新的特征和变化,也包括残缺本。也可以这样理解,一部手稿,在作者手中是“理想本或完整本”,到编目员(包括作为收藏者的作者)手中就是“复本”,按“复本”的著录要求处理,不管它是否“打上”发行或流传领域的烙印。3.“理想本或完整本”的完整版本特征应著录在基本著录字段,复本情况全部著录在141、316、317和318等复本情况著录字段。4.“理想本或完整本”的基本著录字段内容适合所有复本或反映所有复本的完整情况。个别字段可以空缺。复本字段可以视复本数量任意添加,但相应字段须后缀复本区分要素,以免混淆不同的复本。
    在以藏本目录为主的书目体系中把版本和复本区分开来,对于明确书目类型,揭示古籍各级实体关系,“辨章学术,考镜源流”,具有重大的意义。[3]但因为多年来的编目传统习惯和复本区分的复杂性,导致要真正区分版本和复本还有许多工作要做。
    1.3 文献关联趋势
    FRBR关系模式的作用就是要建立一种古籍和其他古籍的连接,古籍诸层次、属性之间的连接,进一步帮助用户更好地在所描述的书目数据库和数字化信息库中“航行”。用户可利用正在检索的古籍的一个或多个属性,提出系统的古籍检索要求,以获取更多的所需信息。在古籍书目数据和规范数据中反映相应的关系,可提供附加的信息,在与之有关的古籍数字化信息中建立全方位的联系,帮助用户进行针对性查找和古籍信息增值检索。
    实际上,作为FRBR关系理论的实践者,MARC数据和DC元数据已经作出了积极的主体努力。MARC数据的款目连接块所有4--字段及856字段(电子资源地址与检索)、DC元数据的关联元素(Relation)提供了尽可能多的文献关联方式和技术。但事实是,尽管受到书目范围和人力物力等客观条件限制仅仅规定这些文献关联方式和技术,在实际应用中也只是很小一部分关联方式和技术被有效利用了。由于种种原因,如488字段(其他相关作品)等大量有用的链接字段至今闲置。
    根据古籍数字化的要求,上述文献关联方式和技术还是不能满足需要的。因为如古籍全文信息的内部关联,以及古籍与文献以外知识信息的外部关联等,还需要我们去研究开发新的关联方式和技术。
    1.4 全面规范理论
    书目规范原理产生于上一世纪七十年代。那么,在三十年后的今天,电子计算机的应用使文献检索由手工变为自动化;文献检索点由题名、著者、分类和主题四种向着应有尽有的局面发展;文献信息数字化又使文献信息检索深度由种部册深入到文献内部的知识点成为可能;书目规范记录由制作单位的自建自用已经发展到全球文献单位和用户的共建共享。在这样的知识信息网络迅猛发展环境中,国内提出了一种全面规范理论。[4]其研究认为:1.应继续坚持规范记录提供标目形式、识别要素、参照系统三个标准内容的原则。不但要突破目前书目信息规范制作范围,全面制作书目信息规范数据,还应重视标目识别要素问题,改善标目识别要素目前还是各行其是比较随意的状况。要依据书目记录及其有关文献来做各类信息规范数据,以便控制更大范围的书目记录和数字化文献信息检索系统。2.应力求健全拓展标目的参照系统。书目记录从手工卡片发展到机读目录,已经突破了所编文献本身描述的框架,“译自”、“译为”、“复制自”、“复制为”、“装订有……”、“与……一起装订”和“其他相关作品”等所编文献本身以外的信息均已划入机读目录的著录范围,书目规范记录也应突破特定标目自身范围内关系揭示的框架,如“源自”、“变为”、“由……合并”、“分为”等特定标目自身范围以外的关系也应划入规范标目的参照系统揭示范围。3.应努力突破规范标目的现有类型。目前,古文献规范数据考虑的主要类型还是题名规范、著者规范、地名规范、分类规范和主题规范。这些基本都是三十年前手工检索时代已经具有的检索点类型。为了发掘书目数据及全文数据的潜在功能,制作其他类型的古籍信息规范数据势在必行。如根据我国古文献的特点,其研究认为还应尽早编制古文献著作方式规范、古文献刊刻者规范和古文献版本类型规范等。
    1.5 工具保障要求
古籍数字化成果在计算机网络系统上投入使用,其表现形式具有虚拟化特点,即容易让用户只见树木,不见森林,不易把握整体。FRBR理论的提出体现了“服务第一”和“用户至上”的理念,它也势必要求文献编目的各项原则要以“服务第一”和“用户至上”这个立馆之本为出发点。其中,古籍数字化检索系统的工具保障要求也是很重要的一个方面。
    古籍数字化检索系统的工具保障要求主要有三个层面:1.将编制分类目录所依据的相应分类法从后台推送到前台,让用户直接依据分类法体系点击类目检索所需古籍。2.将编制文献目录所依据的相应书目信息规范表从后台推送到前台,让用户直接依据规范表体系浏览、选择和检索所需古籍或信息。3.将编制文献目录应参考的其他有关工具书从后台推送到前台,让用户很方便地依据有关工具书进行查考和学习,以便更好地使用古籍数字化系统。
    2 古籍数字化系统具体内容
    关于古籍数字化含义的探讨已经有许多,各种观点看法不尽相同。笔者认为,单纯把书目信息数字化和载体影像数字化当作古籍数字化固然不够全面,若只是将图文识别数字化和知识分类数字化当作古籍数字化推送给用户而不管用户如何使用,同样是存在很大欠缺的。古籍数字化应该是一个系统工程,它既包括静态的数字化内容,也包括动态的数字化内容,更应该包括使用数字化古籍信息时需要配置的数字化工具。
    2.1 古籍书目数字化
    古籍书目数字化即是把古籍书目转换为计算机可读可自动检索的书目系统。其中应注意三点:1.这个数字化古籍书目系统应该是符合国际标准的,以便国内外共建共享。2. 这个数字化古籍书目系统应该是全面应用信息规范编制出来的,其书目信息是可控的。3.因为古籍数字化不可能包括全部古籍,那些没有数字化的古籍信息就有赖于数字化的古籍书目系统来反映。
    2.2 古籍载体数字化
    古籍载体数字化即是把古籍实体影像数字化,让用户方便地得到古籍实体影像感觉。这种数字化工作的主体是被选中的古籍逐叶影像数字化。但其中还有两种古籍实体影像数字化工作不容忽视:1.某些不必要做逐叶影像数字化又需要用数字化形式揭示古籍部分样张的,可将其具有特点的古籍样张影像数字化。2.尽量创造条件向用户推送重要古籍实体的三维虚拟影像,并把视角深入到古籍的微观世界,如纸张纤维和墨色微粒。
    2.3 古籍图文数字化
    古籍图文数字化即是把古籍全文文字和插图内容识别为计算机可读的文本文件,以便做到字、词、句、段均可检索。其中有两项工作应予重视:1.全文文本信息应全部纳入信息规范范围。2.插图内容中文字也应纳入可检范围。
    2.4 古籍知识数字化
    古籍知识数字化即是古籍全文数字化信息按分类的要求进行数字化知识重组,以达到古籍知识增值的目的。如根据地方志数字资源的特点将它重组为人物、事件、地名、景观、文献、插图、民俗和物产八个专题资源库。需要注意的是这项工作要有古籍内容专家的参与。
    2.5 古籍关联数字化
    古籍关联数字化即是把古籍形式和内容各个方面应有的联想数字化。联想是人类进化的思想工具。古籍数字化信息失去联想,其作用便大打折扣。古籍数字化的动态内容主体就是联想。实现联想的工具就是文献信息的连接方式和技术。我们决不可以把古籍数字化信息关联看成是无关的或是可有可无的事物。
    2.6 古籍工具数字化
    古籍工具数字化即是把古籍数字化工作常用的工具书转换为数字化工具让用户直接使用,以保证古籍数字化信息系统使用效果的正常发挥。这些古籍数字化工具除上文提到的分类法和规范表以外,还应该包括字典、词典、百科全书、类书、职官志、人物志、地名志、刻工志、生卒年表、避讳字表和历史年表等。这些古籍数字化工具不但用户在前台可以随意使用,其全部信息与古籍数字化信息还应是逐一关联的。
    3 FRBR和复本编目对古籍编目整合工作的影响
    FRBR基本原则和复本编目要求已经在2004年3月出版的《新版中国机读目录格式使用手册》和2005年4月出版的《中国文献编目规则(第二版)》(全国情报文献工作标准化技术委员会、中国图书馆学会推荐使用)中得到完全实施。今后国家标准《古籍著录规则》的修订版也将按此原则进行修订。这些都是古籍书目数字化的工作标准和依据。
    3.1 对新编书目数据的影响
    FRBR基本原则和复本编目要求对古籍新编书目数据的影响,主要体现在首先要明确古籍目录的类型。著作目录、品种目录、版本目录和复本目录各自的著录对象及其属性是不同的。同样是特定版本的某一部古籍藏本,在版本目录中这一部藏本的复本特征要著录在MARC数据的复本字段,在复本目录中这一部藏本即可成为立目对象。鉴于目前图书馆的古籍藏本目录大部分是版本目录,就要注意它的立目对象是某品种古籍的特定版本文献,其残缺、补配和题跋等特征应著录在316等复本字段。
    3.2 对书目数据转换的影响
    FRBR基本原则和复本编目要求对古籍手工编目款目转换为计算机可读书目数据的影响,主要体现在需要复核原书内容和增加古籍书目数据特定字段。如古籍书目数据的193字段(中国古籍——一般性数据)和194字段(中国古籍——藏本形态特征)涉及古籍全书内容,编码数据详细,这些内容往往在手工编目款目中空缺较多,不看原书是做不出来的。增加古籍书目数据特定字段就是要把原著录在基本著录字段的复本特征剥离出来著录到古籍复本特征字段。
    3.3 对书目数据整合的影响
    FRBR基本原则和复本编目要求对古籍书目数据整合工作的影响,主要体现在字段统一和复本合并等方面。不少图书馆在大规模古籍数字化之前,其书目数据已经完成数字化了。但这种数字化书目数据因为制作年代较早,往往不符合FRBR基本原则和复本编目要求。如把复本特征著录在基本著录字段了,在版本目录中把特定版本的某一部古籍藏本当作立目对象了,等等。古籍版本书目数据整合工作中,在字段统一方面要把基本著录字段和复本著录字段区分开来,在复本合并方面要规范立目对象,版本相同的不同复本款目要合并为一条书目记录。
    3.4 对书目数据重组的影响
    FRBR基本原则和复本编目要求对古籍书目数据重组工作的影响,主要体现在改造已有的古籍书目数据,使之结构顺序符合古籍源流演变规律。这项工作的难度和工作量是显而易见的,但它对于用户的重要意义也是显而易见的。一项完整的古籍书目数字化工作应该包括这项内容。已有的古籍书目数据及其FRBR基本原则和复本编目要求,已经为这项工作提供了基本条件。如果把现有以版本立目的古籍书目数据重组为以“源本←→著作←→品种←→版本←→复本←→分析”六个层次为主体结构的综合性书目数据库(原书目数据库继续保留),必将有利于编目员和用户拓宽视野,站在更高的角度来审视古籍群体、书目体制和古籍数据库整体。这也就可以接近古籍书目数字化的崇高目标——“辨章学术,考镜源流”。
    4 全面规范理论对古籍数字化信息检索的影响
    全面规范理论的要求是把书目的全部信息和图文的全部信息纳入可控体系。在文献目录的手工编制阶段尚且需要书目控制,在文献数字化阶段则更是迫切需要了。在数字化阶段中,书目数据成倍增加,图文数据则是以前所未有的速度膨胀。其中,同一事物以大量形式上毫不相干的面目出现,而某一答案却与难以计数的形式相同或相近的事物纠缠在一起。试想,如果某一准确答案被淹没在数万、数十万乃至数百万条检索结果当中,这样的答案还有什么意义!这样的古籍数字化效果也得大打折扣了。而实施全面规范控制是解决这一难题的有效途径。
    4.1 对书目信息检索的影响
    在文献数字化阶段,全面规范理论对书目信息检索的影响,主要体现在两个方面:1.已有的规范类型功能要从现在的有限控制(如非统一标目不在200字段的@a子字段出现就不做题名规范)扩展为全面控制(即所有相关信息均纳入信息规范制作范围)。2.在题名规范、著者规范、地名规范、分类规范和主题规范的基础上,再逐步编制古籍的版本类型、著作方式、著者朝代、出版者、发行者、印刷者、内容计量单位、载体计量单位等规范数据库。这样才能对书目信息检索实行全面控制,保证古籍书目数字化信息的检索效果。
    4.2 对图文信息检索的影响
    全面规范理论对图文信息检索的主要影响是:1.进一步扩大古籍信息规范数据库制作范围,以满足全文信息检索的全面规范控制需求。2.将古籍插图中的文字也纳入信息规范数据库制作范围,以达到对古籍插图内容进行规范控制的目的。编制古籍图文信息规范数据是一项工程浩大的工作,但很有意义,应该逐步努力为之。
    5 关联趋势对古籍数字化知识链接系统的影响
    思想的精髓在于联想。只有广泛应用连接技术,才能使古籍数字化产生动态效果。这是体现古籍数字化作用的重要方面,也是用户所最需要的。而计算机及其网络系统的迅猛发展,则正好为广泛应用连接技术创造了有利条件。古籍信息规范数据库也是古籍数字化知识链接可借助的有效工具。
    5.1 对书目信息链接的影响
    关联趋势对书目信息链接的主要影响有:1.逐步达到使用MARC数据所有连接字段的目的,最大限度地开发MARC数据和DC元数据的文献关联潜能。2.在以“源本←→著作←→品种←→版本←→复本←→分析”六个层次为主体结构的综合性书目数据库中,建立比MARC数据所有连接字段范围更为广泛的文献信息链接,最大限度地满足用户的书目信息链接需求。
    5.2 对图文信息链接的影响
    关联趋势对图文信息链接的影响,主要体现在以下方面:1.建立古籍插图之间、全文之间的链接;2.建立古籍插图与全文之间的链接;3. 建立古籍插图与书目之间、全文与书目之间的链接。此间的书目可以是古籍书目,也可以是文献目录。最理想的是建立与包含古籍在内的文献目录的链接,使图书馆范围内的古籍数字化成为一个全面的非孤立的整体。
    5.3 对链接文献外信息的影响
    世界的发展使人类成为地球村的居民。同理,计算机网络的发展,使全世界各类海量知识信息成为信息村的基本单元。各种相关的知识信息没有理由老死不相往来。由此来看,关联趋势对链接文献外信息的影响,主要反映在以下方面:1.本数字化古籍信息应该链接馆外乃至国外的相关文献信息,包括相关的书目信息和图文信息。2.DC元数据是为了克服MARC数据不能反映非文献类知识载体(如文物、商品、建筑、动物、植物、家具等)的不足而产生的。可见,文献载体与非文献载体的链接需求已经存在。本数字化古籍信息应该链接相关的非文献知识信息。
    6 工具保障程度对古籍数字化工作效果的影响
    长期以来,我国各个阶层存在着只注重工作过程和成果,不注重实际效果的问题。许多正式出版的图书不附索引便是明证。在古籍编目中也有类似的问题。在古籍数字化工作中,效果便成为必需正视的重要问题。除古籍数字化工作本身质量以外,辅助工具的保障程度是保证古籍数字化工作成果正常发挥作用的衡量标准。这些工具既要按用户最普遍使用的检索习惯(或数种习惯)进行编制,又要将正文标目预先链接相关信息,用户直接点击即可,不用再次输入检索词。让用户输入检索词,既难以了解,又费时间,还容易出错。
    6.1 对书目信息检索效果的影响
    辅助工具的保障程度对书目信息检索效果的影响主要反映在:1.古籍分类目录应该配置分类表;2.古籍音序目录应该配置汉字音序表;3.古籍笔画目录应该配置汉字笔画表;4.古籍主题目录应该配置主题范畴表和字顺主题词表;5.古籍地区目录应该配置地名表;6.古籍时代目录应该配置中国时代表。
    6.2 对图文信息检索效果的影响
    辅助工具的保障程度对图文信息检索效果的影响主要反映在检索控制方面。古籍信息规范库是图文信息检索控制的主要工具。这种规范库既是古籍数字化工作者的工具,也要成为用户可以自由使用的图文信息检索辅导工具。所以,这种规范库是开放性的,它可以为古籍数字化工作者和用户共享,也可以在共享中实现互动,有何修改或补充信息实行实时递交、审核和改定。
    6.3 对数字化信息利用效果的影响
    古籍数字化信息是一个海量的综合性数据库,而每一个用户则只是其中一部分知识的使用者,所以使用古籍数字化信息过程中,用户肯定会产生各种疑问或难题,有时因用户理解错了,还会产生相反的效果。要使用户及时“解惑”,就必须随机配置使用古籍数字化数据库时经常翻阅的相关工具书。这些工具书应包括字词、人物、地名、典章、名物等方面的参考资料。
    7 结语
    要真正使上述文献编目新理念在古籍数字化系统工程中产生影响,取得实质性成效,就需要古籍数字化工作者付出不懈的努力:1.这些新的编目理念有不少与传统观念大相径庭,使人很不习惯,需要大力宣传,坚持实践,可能需要有一个过程,才能实现观念转变。2.要把理念便成现实,更是需要古籍数字化工作者脚踏实地,认真探索,随时关注数据库的技术发展,不断解决技术难题。3.在古籍数字化系统工程中反映上述文献编目新理念,是一项十分庞大、艰巨的工作任务,不是三、五年可以一蹴而就的。我们应该坚持可持续发展原则,不放松现在的努力,争取高标准的起点,分阶段实施,逐步完善新型的古籍数字化系统。


    注释及参考文献
    [1] IFLA文献目录记录功能要求研究组.书目记录的功能需求(Functional Requirements for Bibliographic Records: final report,简称FRBR).第63届IFLA大会.哥本哈根,1997
    [2] 周升恒,丘东江.国际标准书目著录[古籍(善本)]ISBD(A)第二修订版.见:吴龙涛等译《国际标准书目著录(ISBD)》(下).北京:华艺出版社,2002.1
    [3] 国家图书馆《中国文献编目规则》修订组.中国文献编目规则(第二版).北京:北京图书馆出版社,2005.4
    [4] 孙学雷等.古籍题名规范研究报告.北京:中国国家图书馆,2006.12

 

       The Influence of New Bibliographical
Cataloging Theories on Digitization of Ancient Books

Abstract:  Based on analysis of the new bibliographical cataloging theories, including FRBR(Functional Requirements for Bibliographic Records), item’s catalogue, relation of document, comprehensive authority and technical support, the paper explains on the contents of bibliography, physical character, image and text, knowledge, relation and technique in the system engineering of digitization of ancient books in detail, and emphatically expatiates on bibliographic description, information authority, knowledge relation, technical support and the important influence of the new cataloging principles and theories on the digitization works of ancient books.
Keywords:  Bibliographical Cataloging Theories; Digitization of Ancient Books

 



 
 
 
版权声明 | 关于国图 | 支持我们 | 旧版链接 | 人才招聘 | 站点地图 | 联系我们  
京ICP备05014420号 Copyright©National Library of China.All rights reserved Tel:(+86 10)88545426 88545360