元数据
定义
元资料是指“描述资料的资料”。虽然说源自于希腊介词和前缀 μετά- 的英文前缀“meta”代表“之后”或“之下”的意思,在此处实际上是使用知识论中“关于”的意思。元资料被定义为提供某些资料单方面或多方面资讯的资料;它被用来概述资料的基础资讯,以简化查找过程与方便使用 。例如:
创建资料的方法
资料的用途
建立的时间与日期
资料的建立者或作者
资料被建立在电脑网络的何处
用作标准
档案大小
举例,一个数位影像档案可能会包括描述图片大小、色彩深度、图片分辨率、图片建立时间、快门速度等资料的元资料 。一份文档的元资料可能会包含文档长度、作者、建立时间、文档概述等资讯。网页中的元资料也可以包含叶面内容的描述,以及有关于内容的关键字等等 。这些东西常被称作“元标签”(Metatags),其在1990年代后期以前被用来当作决定搜索引擎结果顺序的主要因素 。在1990年代后期,由于“ 关键字堆砌 ( 英语 : keyword stuffing ) ”的出现,对于元标签的倚赖程度逐渐降低 。元标签的滥用导致许多搜索引擎会误认某些结果的关联性高于实际值 。
元资料可以在被称作元资料注册系统或元资料储存库的数据库中储存和管理 。不过,如果没有文字和参考点的话,单纯看是很难辨认这些元资料的 。举例来说:一个数据库本身会包含一些数字,但是这些数字代表的涵义可能是某些计算后的结果,或者是书籍的ISBN码──这就需要参考才能知道,而无法直接由资料容器内部得知。菲利普·巴格利在1968年在他的著作《 Extension of Programming Language Concepts 》中发明了“metadata”这个词,当时的意思为“描述资料容器的资料”,也就是结构性元资料,而非描述性元资料或常用于图书馆目录的元内容(metacontent) 。自那时起,资讯管理、资讯科学、资讯技术、图书馆学与地理资讯系统等领域广泛接受了这个词汇。在这些领域中,元资料的定义为“描述资料的资料” 。尽管这是最广为接受的定义,许多学科也为了自用而采用了特殊的解释或定义。
类型
虽然元资料的应用层面很广,涵盖各式各样的领域,有专门和公认的方法来决定元资料的类型。 弗朗西斯·布雷瑟顿 ( 英语 : Francis Bretherton ) 和辛格利(1994)将元资料分成两类:结构性/控制性元资料和指南性元资料 。 结构性元资料 描述了诸如表格、栏、金钥和索引等数据库物件的结构。 指南性元资料 帮助人们找到特定的物品,而且经常被压缩为一系列自然语言中的关键字。根据 拉尔夫金博尔 ( 英语 : Ralph Kimball ) ,元资料可以分成两个相似的类别:技术性元资料和商业性元资料。 技术性元资料 等同内部性元资料,而 商业性元资料 则为外部性元资料。金博尔加入了第三种类别, 过程性元资料 。另一方面,美国国家资讯标准组织将元资料分成三种:描述性、结构性和管理性 。
描述性元资料 通常用于发现和识别,作为搜寻和定位物件的资讯,例如标题、作者、科目、关键字、出版商等等。 结构性元资料 描述物件的构成物是如何组织起来的,举例来说,书页是如何组成一本书中的章节的这种资料,就是结构性元资料。最后, 管理性元资料 给予有助于管理资源的资讯。管理性元资料参考技术资讯,包括档案类型、档案建立时间和档案建立方式。管理性元资料之下还有两个小分类,权限性元资料和保存性元资料。 权限性元资料 解释了知识产权,而 保存性元资料 则包含保存和储存资源的资讯 。
内容
主要是描述资料属性(property)的资讯,用来支持如指示储存位置、历史资料、资源寻找、文件记录等功能。元资料算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏资料的内容或特色,进而达成协助资料检索的目的。
该名词起源于1969年,由Jack E. Myers所提出的.metadata即关于资料的资料( data-about-data ),可以说是一种标准,是为支援互通性的资料描述,所取得一致的准则。其基本定义出自OCLC与NCSA所主办的“Metadata Workshop”研讨会。它将Metadata定义为“描述资料的资料”(Data about data)。此后各种有关Metadata的定义纷纷的出现。现存很多metadata的定义,主要端视特定社群或使用情境而不同。如有有关资料的资料(data about data),有关资讯物件之结构的资讯(structured information about an information object),描述资源属性的资料(Data describes attributes of resources)等。
都柏林核心集(Dublin Core Metadata Initiative,DCMI)是元资料的一种应用,是1995年2月由国际图书馆电脑中心(OCLC)和美国国家超级计算应用中心(National Center for Supercomputing Applications,NCSA)所联合赞助的研讨会,在邀请52位来自图书馆员、电脑专家,共同制定规格,建立一套描述网络上电子文件之特征。
参见
元数据注册系统
数据字典(又名元数据储存库)
都柏林核心
分众分类法
标签 (元数据)
元数据注册系统
元数学
微格式
本体 (信息科学)
语义网
SGML
XML Schema
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。
- 有价值
- 一般般
- 没价值