CY_T 102.3-2020《新闻出版数字内容对象存储、复用与交换规范 第3部分:对象一致性检查方法》.pdf
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 新闻出版数字内容对象存储、复用与交换规范 第3部分:对象一致性检查方法 CY_T 102.3-2020新闻出版数字内
- 资源描述:
-
ICS01.140.40 A 19 CY 中 华 人 民 共 和 国 新 闻 出 版 行 业 标 准 CY/T 102.32020 代替 CY/T 102.32014 新闻出版数字内容对象存储、复用 与交换规范 第 3 部分:对象一致性检查方法 Specification of press and publication digital content object storage, reuse and exchangePart 3: Object conformance examination method 2020 - 11 - 16 发布 2021 - 02 - 01 实施 国家新闻出版署发 布 CY/T 102.32020 I 目 次 前言. II 引言. III 1 范围. 1 2 规范性引用文件. 1 3 术语和定义. 1 4 一致性检查内容. 2 4.1 完整性检查. 2 4.2 符合性检查. 2 4.3 有效性检查. 2 4.4 准确性检查. 2 5 一致性检查方法. 2 5.1 语义检查方法. 2 5.2 信息包验证方法. 3 6 特殊约束条件检查. 3 6.1 预定义术语取值检查. 3 6.2 属性一致性关系检查. 3 7 对象信息包验证. 4 7.1 信息包结构验证. 4 7.2 数据文件校验. 10 7.3 对象实例关系校验. 12 附录 A(资料性)PUBO 模型约束示例. 13 A.1 PUBO 最大基数约束示例 . 13 A.2 PUBO 最小基数约束示例 . 13 A.3 PUBO 基数约束示例 . 14 A.4 PUBO 属性并存关系示例 . 14 A.5 PUBO 属性同值关系示例 . 14 参考文献. 16 CY/T 102.32020 II 前言 本文件按照 GB/T 1.12020标准化工作导则 第 1 部分:标准化文件的结构和起草规则的规定 起草。 本文件是 CY/T 102新闻出版数字内容对象存储、复用与交换规范的第 3 部分。CY/T 102 已经 发布了以下部分: 第 1 部分:对象模型; 第 2 部分:对象封装、存储和交换; 第 3 部分:对象一致性检查方法。 本文件代替 CY/T 102.32014数字内容对象存储、复用与交换规范 第 3 部分:对象一致性检查 方法 ,与 CY/T 102.32014 相比,除结构调整和编辑性改动外,主要技术变化如下: a) 修改了本文件的适用范围,由适用于图书单一出版物类型扩展为适用多类型出版物; b) 修改了信息包结构验证,其内容包括:将 CY/T 102.32014 中对 ORE 资源图文件的位置和文 件名的验证修改为对 PUBO RDF 实例文档的位置、文件名以及文件内容的验证;存档信息包结 构验证的内容中, 将 CY/T 102.32014 中关于 ORE 资源图文件位置的验证, 修改为对 PUBO RDF 实例文档位置的验证; c) 删除了 CY/T 102.32014 中“资源图验证”的内容; d) 修改了数据文件校验,其内容包括:在保留 CY/T 102.32014 中对数据文件内容校验的基础 上,增加了对数据文件一致性、位置和冗余方面的校验; e) 增加了对“对象实例关系”的校验; f) 修改了附录 A 中 PUBO 模型约束示例的内容。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由全国新闻出版信息标准化技术委员会(SAC/TC 553)提出并归口。 本文件起草单位:北京大学、中宣部机关服务中心(中宣部信息中心) 、北京拓标卓越信息技术研 究院、中国科技出版传媒股份有限公司。 本文件主要起草人:王文清、陈鹏飞、刘成勇、刘勇、张沫、南志弘、陆新民、关涛、张志、姜磊、 郭昱锦。 本文件及其所代替文件的历次版本发布情况为: 2014 年 1 月首次发布为 CY/T 102.32014; 本次为第一次修订。 CY/T 102.32020 III 引言 随着互联网技术的发展和数字加工与出版相关技术的逐步成熟, 传统的新闻出版机构陆续应用信息 技术开展数字出版。在数字加工与出版过程中,图书、期刊等出版内容资源不仅包括可交付印刷或电子 出版与服务的各类媒体对象(如整书或篇章的PDF文件,以及期刊某期及某论文的PDF文件等)、排版或 加工过程中产生的媒体对象(如排版设计源文件等),还包括封面、目次、元数据、各类内容主体、各 类辅文(如参考文献、摘要、术语表等)数字内容实体构件。对于这些出版内容资源,需要建立一个新 闻出版领域统一的数字内容对象模型,以系统地表示和记录资源的内容结构、特征、表现形式、载体方 式以及资源之间的关联关系,并能按不同粒度进行相关数据的封装、存储、复用与交换。 近年来,在出版内容资源的知识表示与建模领域,受应用需求的驱动,国内外相关行业及企业标准 应运而生。2017年11月,数字内容对象存储、复用与交换规范系列国家标准的起草工作正式启动; 2020年3月,该系列国家标准正式发布,为出版内容资源本体的建立奠定了模型基础。 以GB/T 38371.12020数字内容对象存储、复用与交换规范 第1部分:对象模型等3项推荐性 国家标准为基础,结合新闻出版行业出版内容资源的加工及应用要求,本标准的制订需求提上日程。在 本标准的起草过程中,起草组对多项现行国家标准、行业标准及工程标准进行了调研,同时参考了大量 国内外数据标准和模型,从对象模型、对象封装、存储和交换以及对象一致性检查等多个方面给出一套 统一的行业标准,以实现新闻出版领域对出版内容资源的规范化表示,消除数据复用和交换障碍,降低 资源管理和利用成本,推动出版内容资源的融合和深入利用。 CY/T 102.32020 1 新闻出版数字内容对象存储、复用与交换规范 第 3 部分:对象一致性检查方法 1 范围 本文件规定了出版内容资源对象的一致性检查内容、 一致性检查方法、 特殊约束条件检查和对象信 息包验证等。 本文件适用于新闻出版行业有关数字内容资源的内容检查。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。 其中, 注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 38371.32020 数字内容对象存储、复用与交换规范 第3部分:对象一致性检查方法 CY/T 102.12020 新闻出版数字内容对象存储、复用与交换规范 第1部分:对象模型 CY/T 102.22020 新闻出版数字内容对象存储、复用与交换规范 第2部分:对象封装、存储与交 换 3 术语和定义 GB/T 20000.1界定的以及下列术语和定义适用于本文件。 3.1 一致性 conformance 满足规定的要求。 来源:GB/T 19333.52003,3.8 3.2 一致性检查 conformance examination 满足规定要求的相关检查。 来源:GB/T 38371.32020,3.2 3.3 对象一致性检查 object conformance examination 对数字内容对象的语义关系以及用于交换的对象信息包结构等方面进行的满足规定要求的相关检 查。 来源:GB/T 38371.32020,3.3 CY/T 102.32020 2 3.4 基数约束 cardinality constraint 对实例属性的出现次数进行限定的约束方式。 来源:GB/T 38371.32020,3.4 3.5 取值约束 value constraint 对实例属性的取值进行限定的约束方式。 来源:GB/T 38371.32020,3.5 4 一致性检查内容 4.1 完整性检查 出版物数字内容对象及其相关资源数据的完整性检查包括: a) 对象模型逻辑结构完整性检查: 对象模型是否完整表述出版物数字内容对象的语义关系, 对象 实例是否完整,以及对象实例是否完整包括必备属性等; b) 信息包完整性检查:对对象实例信息包中的必备文件(及文件目录)的存在性进行检查。 4.2 符合性检查 出版物数字内容对象及其相关资源数据的符合性检查包括: a) 对象语义符合性检查:对象模型是否符合约束条件、推理规则的检查等; b) 信息包符合性检查:PUBO RDF 实例文件中的语义关系是否与信息包清单文件(即 pubomanifest.xml 文件)中的对象关系列表(即节点 objectList 下的内容)相符;PUBO RDF 实例文件中的媒体对象及其物理文件是否与信息包清单文件中数据文件列表(即节点 dataFileList 下的内容)相符。 4.3 有效性检查 出版物数字内容对象及其相关资源数据的有效性检查包括: a) 对象模型逻辑有效性检查:检查属性的取值有效性等; b) 语法有效性检查:检查是否符合 XML、RDF、OWL 相关语法等。 4.4 准确性检查 出版物数字内容对象及其相关资源数据的准确性检查主要是针对对象实例信息包的内容进行检查, 包括文件系统中的目录名称及位置、文件名称及位置、container.xml与pubomanifest.xml文件的位置 是否准确等。 5 一致性检查方法 5.1 语义检查方法 利用语义检查方法,可覆盖对以下内容的检查: 对象模型逻辑结构完整性检查; CY/T 102.32020 3 对象语义符合性检查; 对象模型逻辑有效性检查; 语法有效性检查。 语义检查的具体方法如下: a) 对象模型逻辑结构检查:检查对象为 PUBO 及其扩展模型。检查内容为本体逻辑结构的语义一 致性。该逻辑结构的检查可通过本体模型定义文件以及相应的本体推理机完成; b) 实例数据逻辑结构检查:检查对象为符合 PUBO 或其扩展模型的 RDF 实例数据。检查内容包括 是否符合本体模型逻辑结构;对于实例的属性,检查内容包括属性与逆属性、传递属性、对称 属性等多个方面。 该逻辑结构的检查可通过 RDF 实例数据文件、 本体模型定义文件以及相应的 本体推理机完成; c) 约束条件检查:检查对象为 RDF 实例数据。检查内容包括基数约束检查和取值约束检查。PUBO 基数约束示例参见附录 A.1、A.2 和 A.3。在 PUBO 的扩展模型中,需要在扩展的派生类范围限 定属性取值时, 应考虑对取值约束的检查。 约束条件检查可通过本体模型定义文件以及相应的 本体推理机完成; d) 特殊约束条件检查:检查对象为 RDF 实例数据。检查内容包括预定义术语取值检查、属性一致 性关系检查。检查方法见 6.1 和 6.2。PUBO 中的特殊约束示例可参见附录 A.4 和 A.5。 5.2 信息包验证方法 利用信息包验证方法,可覆盖对以下内容的检查: 信息包完整性检查; 信息包符合性检查; 信息包准确性检查。 信息包验证的具体方法如下: 出版物数字内容对象的信息包主要包含PUBO RDF实例文件,以及一组相关的数据文件。信息包按照 一定的结构来组织文件。针对数据文件,利用对象模型中“校验算法”和“校验值”属性所提供的校验 信息,保证有效地对数据文件内容进行校验。信息包的验证包括信息包结构验证(见7.1)、数据文件 校验(见7.2)和对象实例关系校验(见7.3)等三个方面。 6 特殊约束条件检查 6.1 预定义术语取值检查 在PUBO扩展体系中, 如词表、 分类法等编码体系可由 “预定义术语集” 实例化后进行限定。 采用 “预 定义术语”的实例表示具体的词表词汇、分类词汇或分类号等信息。 在对实例数据进行校验的过程中,需检查预定义术语的取值是否符合匹配的预定义术语集。 6.2 属性一致性关系检查 6.2.1 属性一致性关系类型 PUBO所描述的各类资源具备多种属性,属性之间存在一定的关系,其类型包括: a) 属性并存关系:针对某个实例,两个或多个属性取值必须都存在,或都不存在; b) 属性同值关系:针对两个不同的实例,某一个或两个属性的值必须相同。如某丛书展开阅读全文
文档分享网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:CY_T 102.3-2020《新闻出版数字内容对象存储、复用与交换规范 第3部分:对象一致性检查方法》.pdf
链接地址:https://www.wdfxw.net/doc100166597.htm
链接地址:https://www.wdfxw.net/doc100166597.htm
相关资源
更多