书签 分享 收藏 举报 版权申诉 / 26

类型CY_T 102.2-2020《新闻出版数字内容对象存储、复用与交换规范 第2部分:对象封装、存储与交换》.pdf

  • 上传人:连胜
  • 文档编号:100166606
  • 上传时间:2021-06-04
  • 格式:PDF
  • 页数:26
  • 大小:311.43KB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    新闻出版数字内容对象存储、复用与交换规范 第2部分:对象封装、存储与交换 CY_T 102.2-2020新闻出版数字
    资源描述:
    ICS01.140.40 A 19 CY 中 华 人 民 共 和 国 新 闻 出 版 行 业 标 准 CY/T 102.22020 代替 CY/T 102.22014 新闻出版数字内容对象存储、复用 与交换规范 第 2 部分:对象封装、存储与交换 Specification of press and publication digital content object storage, reuse and exchangePart 2: Object encoding, storage and exchange 2020 - 11 - 16 发布 2021 - 02 - 01 实施 国家新闻出版署发 布 CY/T 102.22020 I 目 次 前言. II 引言. III 1 范围. 1 2 规范性引用文件. 1 3 术语和定义. 1 4 缩略语. 2 5 数字内容对象封装. 2 5.1 对象封装方式. 2 5.2 交换信息包文件结构. 2 5.3 证实方法. 5 6 数字内容对象存储. 5 6.1 信息包存储. 5 6.2 实例文件存储. 6 6.3 数据文件存储. 7 6.4 证实方法. 8 7 数字内容对象交换. 8 7.1 交换方式. 8 7.2 资源标识符获取接口. 8 7.3 指定资源 IRI 获取接口. 10 7.4 元数据获取接口. 11 7.5 数据文件 URL 获取接口. 12 7.6 数据流获取接口. 13 7.7 交换信息包获取接口. 13 7.8 交换信息包上传接口. 14 7.9 资源检索接口. 15 参考文献. 20 CY/T 102.22020 II 前言 本文件按照 GB/T 1.12020标准化工作导则 第 1 部分:标准化文件的结构和起草规则的规定 起草。 本文件是 CY/T 102新闻出版数字内容对象存储、复用与交换规范的第 2 部分。CY/T 102 已经 发布了以下部分: 第 1 部分:对象模型; 第 2 部分:对象封装、存储和交换; 第 3 部分:对象一致性检查方法。 本文件代替 CY/T 102.22014数字内容对象存储、复用与交换规范 第 2 部分:对象封装、存储 和交换 ,与 CY/T 102.22014 相比,除结构调整和编辑性改动外,主要技术变化如下: a) 修改了本文件的适用范围,由适用于图书单一出版物类型扩展为适用多类型出版物; b) 修改了数字内容对象的封装方式。CY/T 102.22014 中采用 OAI-ORE 资源图文件对符合 PUBO 本体模型的数字内容对象进行封装,本次修订采用“PUBO RDF 实例文档(RDF/XML 文档)”对符合本次修订版 PUBO 本体模型的出版物数字内容对象进行封装; c) 修改了信息包结构,其内容包括: 1) 将 CY/T 102.22014 中 CONTAINER 文件夹下的各级资源图文件及相关文件夹修改为 采用“PUBO RDF 实例文档”进行表示; 2) 修改了清单文件 pubomanifest.xml 的内容,除包含 CY/T 102.22014 中媒体文件清 单(dataFileList)之外,新增了对象清单(objectList),用于表示各资源实例作 为主体时,与之相关的客体及语义关系。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由全国新闻出版信息标准化技术委员会(SAC/TC 553)提出并归口。 本文件起草单位:北京大学、中宣部机关服务中心(中宣部信息中心) 、北京拓标卓越信息技术研 究院、中国科技出版传媒股份有限公司。 本文件主要起草人:王文清、陈鹏飞、刘成勇、刘勇、张沫、南志弘、陆新民、关涛、张志、姜磊、 郭昱锦。 本文件及其所代替文件的历次版本发布情况为: 2014 年 1 月首次发布为 CY/T 102.22014; 本次为第一次修订。 CY/T 102.22020 III 引言 随着互联网技术的发展和数字加工与出版相关技术的逐步成熟, 传统的新闻出版机构陆续应用信息 技术开展数字出版。在数字加工与出版过程中,图书、期刊等出版内容资源不仅包括可交付印刷或电子 出版与服务的各类媒体对象(如整书或篇章的PDF文件,以及期刊某期及某论文的PDF文件等)、排版或 加工过程中产生的媒体对象(如排版设计源文件等),还包括封面、目次、元数据、各类内容主体、各 类辅文(如参考文献、摘要、术语表等)数字内容实体构件。对于这些出版内容资源,需要建立一个新 闻出版领域统一的数字内容对象模型,以系统地表示和记录资源的内容结构、特征、表现形式、载体方 式以及资源之间的关联关系,并能按不同粒度进行相关数据的封装、存储、复用与交换。 近年来,在出版内容资源的知识表示与建模领域,受应用需求的驱动,国内外相关行业及企业标准 应运而生。2017年11月,数字内容对象存储、复用与交换规范系列国家标准的起草工作正式启动; 2020年3月,该系列国家标准正式发布,为出版内容资源本体的建立奠定了模型基础。 以GB/T 38371.12020数字内容对象存储、复用与交换规范 第1部分:对象模型等3项推荐性 国家标准为基础,结合新闻出版行业出版内容资源的加工及应用要求,本标准的制订需求提上日程。在 本标准的起草过程中,起草组对多项现行国家标准、行业标准及工程标准进行了调研,同时参考了大量 国内外数据标准和模型,从对象模型、对象封装、存储和交换以及对象一致性检查等多个方面给出一套 统一的行业标准,以实现新闻出版领域对出版内容资源的规范化表示,消除数据复用和交换障碍,降低 资源管理和利用成本,推动出版内容资源的融合和深入利用。 CY/T 102.22020 1 新闻出版数字内容对象存储、复用与交换规范 第 2 部分:对象封装、存储与交换 1 范围 本文件规定了出版内容资源对象的封装、存储与交换方式,并给出了对象交换服务接口。 本文件适用于新闻出版行业有关数字内容资源的数字化统一管理和共享。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。 其中, 注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 74082005 数据元和交换格式 信息交换 日期和时间表示法(ISO 8601:2000,IDT) GB/T 38371.22020 数字内容对象存储、复用与交换规范 第2部分:对象封装、存储与交换 CY/T 102.12020 新闻出版数字内容对象存储、复用与交换规范 第1部分:对象模型 CY/T 102.32020 新闻出版数字内容对象存储、复用与交换规范 第3部分:对象一致性检查方法 3 术语和定义 GB/T 20000.1界定的以及下列术语和定义适用于本文件。 3.1 信息包 information package 通过打包信息进行封装和识别的一种逻辑容器。 来源:GB/T 38371.22020,3.2 3.2 交换信息包 exchange information package; EIP 在不同系统之间,用于数据交换的信息包。 来源:GB/T 38371.22020,3.3 3.3 存档信息包 archive information package; AIP 为资源存档和长期保存而规定的逻辑存储格式。 来源:GB/T 38371.22020,3.4 CY/T 102.22020 2 3.4 PUBO RDF 实例文件 PUBO based RDF instance file 基于出版内容资源本体模型的符合RDF表示规范的实例数据存储文件。 4 缩略语 下列缩略语适用于本文件。 AIP:存档信息包(Archive Information Package) DCOO:数字内容对象本体(Digital Content Object Ontology) EIP:交换信息包(Exchange Information Package) MIME:多用途互联网邮件扩展(Multipurpose Internet Mail Extensions) OAIS:开放档案信息系统(Open Archival Information System) PUBO:出版内容资源本体(Publication Content Resource Ontology) RDF:资源描述框架(Resource Description Framework) SRU:基于URL的搜索/检索(Search/Retrieve via URL) SRW:搜索/检索Web服务(Search/Retrieve Web Service) URL:统一资源定位符(Uniform Resource Locator) 5 数字内容对象封装 5.1 对象封装方式 5.1.1 容器级封装 容器级封装用以封装出版物数字内容对象及其相关的所有对象信息。 5.1.2 对象级封装 对象级封装用以封装出版物数字内容对象及其所包含的单一媒体对象信息。 5.2 交换信息包文件结构 5.2.1 交换信息包类型 根据交换信息包所封装的资源粒度,可分为容器级交换信息包与对象级交换信息包。 5.2.2 容器级交换信息包结构 容器级交换信息包封装了一个完整的容器级封装所包含的所有信息,其结构如下: Container_Local_ID.zip/ mimetype META-INF/ container.xml pubomanifest.xml CONTAINER/ pubo_rdf_instance.xml(实例文件) dataFile/ CY/T 102.22020 3 audio/ 音频数据文件 video/ 视频数据文件 image/ 图像数据文件 text/ 文本数据文件 other/ 其他类型数据文件 注1:“Container_Local_ID”为容器级封装的本地标识符;交换信息包以“Container_Local_ID.zip”命名,采 用 ZIP 压缩格式对信息包进行压缩; 注2:每个交换信息包均含有一个名为 mimetype 的文件,其中内容为固定值“application/pubo+zip”,用于说明 交换信息包文件的格式;mimetype 文件不含新行或回车,自身不作压缩; 注3:“META-INF”文件目录用于存放容器级封装相关的信息,其中包含 container.xml 和 pubomanifest.xml 两个 文件: a) container.xml:其文件内容如下面的 XML 片段所示。 该 XML 示例片段中,“”元素的属性包括: full-path:当前容器级封装的 PUBO RDF 实例文件的相对路径; media-type:该交换信息包文件的打开方式; package-type:表示包类型,容器级交换信息包类型为“pubo-container+xml”。 b) pubomanifest.xml:该清单文件给出了该容器级封装所包含的媒体对象文件(即数据文件)列表及对象 实例关系列表,文件命名为“pubomanifest.xml”。该文件的根元素为“”,其属性包括: identifier:取值为出版物数字内容对象实例 IRI,在该内容清单中是唯一的; version:内容清单的版本号,用来区分具有相同标识符的内容清单。 “”下包含子元素“”(数据文件列表),示例 XML 片段如下所示: CY/T 102.22020 4 该 XML 示例片段中,“”元素的属性包括: id:必备属性;每一个“item”对应一份数据文件, “id”为当前媒体对象的 IRI(“” 表示应用单位的命名空间取值); href:必备属性;取值为当前媒体对象对应数据文件的相对路径(相对于 CONTAINER 文件目录); media-type:必备属性;取值为当前数据文件的 MIME 类型取值。 “”下包含的另一个子元素“”(对象清单),示例 XML 片段
    展开阅读全文
    提示  文档分享网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:CY_T 102.2-2020《新闻出版数字内容对象存储、复用与交换规范 第2部分:对象封装、存储与交换》.pdf
    链接地址:https://www.wdfxw.net/doc100166606.htm
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    版权所有:www.WDFXW.net 

    鲁ICP备09066343号-25 

    联系QQ: 200681278 或 335718200

    收起
    展开