族谱网 头条 人物百科

元数据

2020-10-16
出处:族谱网
作者:阿族小谱
浏览:537
转发:0
评论:0
定义元资料是指“描述资料的资料”。虽然说源自于希腊介词和前缀μετά-的英文前缀“meta”代表“之后”或“之下”的意思,在此处实际上是使用知识论中“关于”的意思。元资料被定义为提供某些资料单方面或多方面资讯的资料;它被用来概述资料的基础资讯,以简化查找过程与方便使用。例如:创建资料的方法资料的用途建立的时间与日期资料的建立者或作者资料被建立在电脑网络的何处用作标准档案大小举例,一个数位影像档案可能会包括描述图片大小、色彩深度、图片分辨率、图片建立时间、快门速度等资料的元资料。一份文档的元资料可能会包含文档长度、作者、建立时间、文档概述等资讯。网页中的元资料也可以包含叶面内容的描述,以及有关于内容的关键字等等。这些东西常被称作“元标签”(Metatags),其在1990年代后期以前被用来当作决定搜索引擎结果顺序的主要因素。在1990年代后期,由于“关键字堆砌(英语:keywordstuff...

定义

元资料是指“描述资料的资料”。虽然说源自于希腊介词和前缀 μετά- 的英文前缀“meta”代表“之后”或“之下”的意思,在此处实际上是使用知识论中“关于”的意思。元资料被定义为提供某些资料单方面或多方面资讯的资料;它被用来概述资料的基础资讯,以简化查找过程与方便使用 。例如:

创建资料的方法

资料的用途

建立的时间与日期

资料的建立者或作者

资料被建立在电脑网络的何处

用作标准

档案大小

举例,一个数位影像档案可能会包括描述图片大小、色彩深度、图片分辨率、图片建立时间、快门速度等资料的元资料 。一份文档的元资料可能会包含文档长度、作者、建立时间、文档概述等资讯。网页中的元资料也可以包含叶面内容的描述,以及有关于内容的关键字等等 。这些东西常被称作“元标签”(Metatags),其在1990年代后期以前被用来当作决定搜索引擎结果顺序的主要因素 。在1990年代后期,由于“ 关键字堆砌 ( 英语 : keyword stuffing ) ”的出现,对于元标签的倚赖程度逐渐降低 。元标签的滥用导致许多搜索引擎会误认某些结果的关联性高于实际值 。

元资料可以在被称作元资料注册系统或元资料储存库的数据库中储存和管理 。不过,如果没有文字和参考点的话,单纯看是很难辨认这些元资料的 。举例来说:一个数据库本身会包含一些数字,但是这些数字代表的涵义可能是某些计算后的结果,或者是书籍的ISBN码──这就需要参考才能知道,而无法直接由资料容器内部得知。菲利普·巴格利在1968年在他的著作《 Extension of Programming Language Concepts 》中发明了“metadata”这个词,当时的意思为“描述资料容器的资料”,也就是结构性元资料,而非描述性元资料或常用于图书馆目录的元内容(metacontent) 。自那时起,资讯管理、资讯科学、资讯技术、图书馆学与地理资讯系统等领域广泛接受了这个词汇。在这些领域中,元资料的定义为“描述资料的资料” 。尽管这是最广为接受的定义,许多学科也为了自用而采用了特殊的解释或定义。

类型

虽然元资料的应用层面很广,涵盖各式各样的领域,有专门和公认的方法来决定元资料的类型。 弗朗西斯·布雷瑟顿 ( 英语 : Francis Bretherton ) 和辛格利(1994)将元资料分成两类:结构性/控制性元资料和指南性元资料 。 结构性元资料 描述了诸如表格、栏、金钥和索引等数据库物件的结构。 指南性元资料 帮助人们找到特定的物品,而且经常被压缩为一系列自然语言中的关键字。根据 拉尔夫金博尔 ( 英语 : Ralph Kimball ) ,元资料可以分成两个相似的类别:技术性元资料和商业性元资料。 技术性元资料 等同内部性元资料,而 商业性元资料 则为外部性元资料。金博尔加入了第三种类别, 过程性元资料 。另一方面,美国国家资讯标准组织将元资料分成三种:描述性、结构性和管理性 。

描述性元资料 通常用于发现和识别,作为搜寻和定位物件的资讯,例如标题、作者、科目、关键字、出版商等等。 结构性元资料 描述物件的构成物是如何组织起来的,举例来说,书页是如何组成一本书中的章节的这种资料,就是结构性元资料。最后, 管理性元资料 给予有助于管理资源的资讯。管理性元资料参考技术资讯,包括档案类型、档案建立时间和档案建立方式。管理性元资料之下还有两个小分类,权限性元资料和保存性元资料。 权限性元资料 解释了知识产权,而 保存性元资料 则包含保存和储存资源的资讯 。

内容

主要是描述资料属性(property)的资讯,用来支持如指示储存位置、历史资料、资源寻找、文件记录等功能。元资料算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏资料的内容或特色,进而达成协助资料检索的目的。

该名词起源于1969年,由Jack E. Myers所提出的.metadata即关于资料的资料( data-about-data ),可以说是一种标准,是为支援互通性的资料描述,所取得一致的准则。其基本定义出自OCLC与NCSA所主办的“Metadata Workshop”研讨会。它将Metadata定义为“描述资料的资料”(Data about data)。此后各种有关Metadata的定义纷纷的出现。现存很多metadata的定义,主要端视特定社群或使用情境而不同。如有有关资料的资料(data about data),有关资讯物件之结构的资讯(structured information about an information object),描述资源属性的资料(Data describes attributes of resources)等。

都柏林核心集(Dublin Core Metadata Initiative,DCMI)是元资料的一种应用,是1995年2月由国际图书馆电脑中心(OCLC)和美国国家超级计算应用中心(National Center for Supercomputing Applications,NCSA)所联合赞助的研讨会,在邀请52位来自图书馆员、电脑专家,共同制定规格,建立一套描述网络上电子文件之特征。

参见

元数据注册系统

数据字典(又名元数据储存库)

都柏林核心

分众分类法

标签 (元数据)

元数据注册系统

元数学

微格式

本体 (信息科学)

语义网

SGML

XML Schema


免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

——— 没有了 ———
编辑:阿族小谱
发表评论
写好了,提交
{{item.label}}
{{commentTotal}}条评论
{{item.userName}}
发布时间:{{item.time}}
{{item.content}}
回复
举报
点击加载更多
打赏作者
“感谢您的打赏,我会更努力的创作”
— 请选择您要打赏的金额 —
{{item.label}}
{{item.label}}
打赏成功!
“感谢您的打赏,我会更努力的创作”
返回

更多文章

更多精彩文章
打赏
私信

推荐阅读

· 国际数据
批评许多IDC的报告和预测由于方法的缺陷而受到批评,著名案例包括:预测英特尔安腾架构的销售预测WindowsPhone的市场份额竞争对手阿伯丁集团ABIResearchBurtonGroupCanalysDittbernerAssociatesForresterResearchFrost&Sullivan高德纳咨询公司GfKJupiterResearchTechnologyEvaluationCentersTekPlusThe451GroupWirelessFederationYankeeGroup
· 大数据
定义大数据由巨型数据集(英语:Dataset)组成,这些数据集大小常超出人类在可接受时间下的收集(英语:dataacquisition)、庋用(英语:datacuration)、管理和处理能力。大数据的大小经常改变,截至2012年(2012-Missingrequiredparameter1=month!),单一数据集的大小从数太字节(TB)至数十兆亿字节(PB)不等。在一份2001年的研究与相关的演讲中,麦塔集团(METAGroup,现为高德纳)分析员道格·莱尼(DougLaney)指出数据增长的挑战和机遇有三个方向:量(Volume,数据大小)、速(Velocity,数据输入输出的速度)与多变(Variety,多样性),合称“3V”或“3Vs”。高德纳与现在大部分大数据产业中的公司,都继续使用3V来描述大数据。高德纳于2012年修改对大数据的定义:“大数据是大量、高速、及/或多变的信息...
· 数据传输
协议分层与子条目在数据传输领域的课程与教材中,通常使用如下的OSI模型处理协议分层与主题:第一层,物理层:第二层,数据链路层:第六层,表示层:应用及历史基带或通带传输串行与并行传输通讯信道类型异步与同步数据传输参见计算机网络信息论Media(communication)信号处理电信Transmission
· 数据库
数据库管理系统数据库管理系统(英语:DatabaseManagementSystem,简称DBMS)是为管理数据库而设计的电脑软件系统,一般具有存储、截取、安全保障、备份等基础功能。数据库管理系统可以依据它所支持的数据库模型来作分类,例如关系式、XML;或依据所支持的电脑类型来作分类,例如服务器群集、移动电话;或依据所用查询语言来作分类,例如SQL、XQuery;或依据性能冲量重点来作分类,例如最大规模、最高运行速度;亦或其他的分类方式。不论使用哪种分类方式,一些DBMS能够跨类别,例如,同时支持多种查询语言。类型关系数据库MySQLPostgreSQLMicrosoftAccessMicrosoftSQLServerGoogleFusionTables(英语:GoogleFusionTables)FileMakerOracle数据库SybasedBASEClipperFoxProfosh...
· 数据压缩
概要对于任何形式的通信来说,只有当信息的发送方和接受方都能够理解编码机制的时候压缩数据通信才能够工作。例如,只有当接受方知道这篇文章需要用汉语字符解释的时候这篇文章才有意义。同样,只有当接受方知道编码方法的时候他才能够理解压缩数据。数据压缩能够实现是因为多数现实世界的数据都有统计冗余。例如,字母“e”在英语中比字母“z”更加常用,字母“q”后面是“z”的可能性非常小。无损数据压缩通常利用了统计冗余,这样就能更加简练地、但仍然是完整地表示发送方的数据。如果允许一定程度的保真度损失,那么还可以实现进一步的压缩。例如,人们看图画或者电视画面的时候可能并不会注意到一些细节并不完善。同样,两个音频录音采样序列可能听起来一样,但实际上并不完全一样。有损数据压缩在带来微小差别的情况下使用较少的位数表示图像、视频或者音频。然而,经常有一些文件不能被有损数据压缩压缩,实际上对于不含可以辨别样式的数据任何压缩...

关于我们

关注族谱网 微信公众号,每日及时查看相关推荐,订阅互动等。

APP下载

下载族谱APP 微信公众号,每日及时查看
扫一扫添加客服微信