族谱网 头条 人物百科

档案格式

2020-10-16
出处:族谱网
作者:阿族小谱
浏览:507
转发:0
评论:0
概述有些文件格式被设计用于存储特殊的数据,例如:视频文件中的JPEG文件格式仅用于储存静态的视频,而GIF既可以储存静态视频,也可以存储简单动画;Quicktime格式则可以存储多种不同的媒体类型。文本类的文件有:同一个文件格式,用不同的程序处理可能产生截然不同的结果。例如Word文件,用MicrosoftWord观看的时候,可以看到文本的内容,而以无格式方式在音乐播放软体中播放,产生的则是噪声。一种文件格式对某些软体会产生有意义的结果,对另一些软体来看,就像是毫无用途的数位垃圾。规范许多文件格式都有公开的、不同程度规范或者建议的格式。这些规范或者建议描述了数据如何编码,如何排列。有时也规定了是否需要特定的计算机程序读取或处理。有两种情况下,文件格式没有公开。第一种情况是:开发者将文件格式视作商业秘密不愿公开;第二种情况是:开发者不愿或花去很少的时间用于规范文档。需要注意的是,使用不公开的...

概述

有些文件格式被设计用于存储特殊的数据,例如:

视频文件中的JPEG文件格式仅用于储存静态的视频,

而GIF既可以储存静态视频,也可以存储简单动画;

Quicktime格式则可以存储多种不同的媒体类型。

文本类的文件有:

同一个文件格式,用不同的程序处理可能产生截然不同的结果。例如Word 文件,用Microsoft Word观看的时候,可以看到文本的内容,而以无格式方式在音乐播放软体中播放,产生的则是噪声。一种文件格式对某些软体会产生有意义的结果,对另一些软体来看,就像是毫无用途的数位垃圾。

规范

许多文件格式都有公开的、不同程度规范或者建议的格式。这些规范或者建议描述了数据如何编码,如何排列。有时也规定了是否需要特定的计算机程序读取或处理。有两种情况下,文件格式没有公开。第一种情况是:开发者将文件格式视作商业秘密不愿公开;第二种情况是:开发者不愿或花去很少的时间用于规范文档。

需要注意的是,使用不公开的文件格式可能会带来额外的成本。要了解这类文件格式,或者需要通过对获得的文件进行逆向工程,或者通过向开发者付费来获得文件的格式。第二种方式中往往还需要与开发者签订不扩散协议。不论怎样两种方式都是费时,费钱的。

识别文件的类型

从程序的角度来看,文件是数据流,文件系统为每一种文件格式规定了访问的方法。例如:元数据。不同的操作系统都习惯性的采用各自的方式解决这个问题,每种方式都有各自的优缺点。

当然,现代的操作系统和应用程序,一般都需要这里所讲述的方法处理不同的文件,

扩展名

用扩展名识别文件格式的方式最先在数字设备公司的CP/M操作系统被采用。而后又被DOS和Windows操作系统采用。扩展名是指文件名中,最后一个点(.)号后的字母序列。例如,HTML文件通过.htm或.html扩展名识别;GIF图形文件用.gif扩展名识别。在早期的FAT文件系统中,扩展名限制只能是三个字符,因此尽管现在绝大多数的操作系统已不再有此限制,许多文件格式至今仍然采用三个字符作扩展名。因为没有一个正式的扩展名命名标准,所以,有些文件格式可能会采用相同的扩展名,出现这样的情况就会使操作系统错误地识别文件格式,同时也给用户造成困惑。

扩展名方式的一个特点是,更改文件扩展名会导致系统误判文件格式。例如,将filename.html简单改名为filename.txt会使系统误将HTML文件识别为纯文本格式。尽管一些熟练的用户可以利用这个特点,但普通用户很容易在改名时发生错误,而使得文件变得无法使用。因此,现代的有些操作系统管理程序,例如Windows Explorer加入了限制向用户显示文件扩展名的功能。

特征签名

一种广泛应用在UNIX及其派生的操作系统上的方法是将一个特殊的数字存放在文件的特定位置里。最初这个数字一般是文件开始处的2个字节。现在一般是将任何可以独一无二字符序列都可以作为特征签名。例如GIF图形文件是将文件开始处的六个字节作为特征签名的,它可以是GIF87a或者GIF89a。但也有些文件很难通过这种方式识别,比如HTML文件。

采用这种方式可以更好的防止对文件格式发生误判,并且特征签名可以给出关于文件格式的更详细的信息。这种方式的缺点是效率较低。特别是显示大量的文件时,由于每种特征签名具有不同的识别方式,将消耗系统大量的资源对文件格式进行判断。扩展名和后面将提到的元数据方式由于采用固定格式数据,可进行快速匹配。应用程序往往利用特征签名来判断文件是否完整和有效。

元数据

最后一种方式将文件格式信息存放到磁盘特定的位置。

采用这种方式,元数据与文件本身份开存放。此法的缺点是可移植性差。因为不同的文件系统之间元数据可能需要转换。

苹果Macintosh的类型码

苹果计算机的文件系统为每个文件的目录入口都存储了创建者和类型码。这些代码称作OSType。例如一个苹果计算机创建的文件的创建者会是AAPL而类型也是APPL。RISC操作系统采用类似的系统,用一个12比特位的数字索引描述表。例如:十六进制的FF5代表PoScript,文件类型就是PostScript文件。

IBM/Microsoft的扩展文件属性

HPFS,NTFS,FAT12, FAT16,及FAT32文件系统可以保存额外的文件属性信息。它是由名字和与名字对应的值组成。例如扩展属性“.type”用于判断文件的类型,可能是值包括“Plain Text”或“HTML document”。一个文件可以有多种属性。

Unix的扩展文件属性

ext2,ext3,ReiserFS版本3,XFS,JFS和FFS文件系统允许存储扩展的文件属性。它是由名字和与名字对应的值组成。名字应当是独一无二的。

MIME类型

MIME广泛地用于许多Internet有关的应用,并且正在被广泛地采用到其他的应用中。最初在RFC1341中说明。MIME用一个类型/子类型表示文件的类型。例如:text/html代表文件是HTML文件,image/gif表示GIF文件。MIME最初是用于表示电子邮件的附件的类型。

参见

音频文件格式

文档文件格式

化学文件格式

文件扩展名

自由文件格式

图形文件格式

文件格式列表

目标文件格式

视频文件格式


免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

——— 没有了 ———
编辑:阿族小谱
发表评论
写好了,提交
{{item.label}}
{{commentTotal}}条评论
{{item.userName}}
发布时间:{{item.time}}
{{item.content}}
回复
举报
点击加载更多
打赏作者
“感谢您的打赏,我会更努力的创作”
— 请选择您要打赏的金额 —
{{item.label}}
{{item.label}}
打赏成功!
“感谢您的打赏,我会更努力的创作”
返回

更多文章

更多精彩文章
打赏
私信

推荐阅读

· 档案
词源“档案”一词,初见于清朝杨宾的《柳边纪略》,至今仍以此词称之。英语的档案(archive)首次出现在十七世界早期,衍生自法语archives(复数),源于拉丁文archīum或archīvum,也是希腊文ἀρχεῖον(arkheion)的罗马化形式。定义根据美国档案工作者协会(英语:Society_of_American_Archivists),档案的定义为“由个人、家庭或组织在公共或私人事务中建立或接收的材料,其信息具有持久价值或可作为创造者的职能和责任的证据而保存下来”。参见档案法参考资料陈兆祦。当代中国档案学文库。北京市:中国档案出版社,1999年。薛理桂。档案学导论。台北市:汉美图书,1998年。和宝荣、陈兆祦合著。档案工作基本知识。北京市:档案出版社,1988年。Bellardo,LewisJ.andBellardo,LynnLady.AGlossaryforArchivi...
· EXE格式
MZ(1)00-01h:MZ标志,MS-DOS开发者之一的马克·茨柏克沃斯基(MarkZbikowski)的姓名首字母缩写。(2)02-03h:EXE文件最后一个块没有全用完只用了N个字节,即文件长度除以512的余数。(3)04-05h:EXE文件使用的块的数量(每块512个字节),文件长度除以512的商通过(2)(3)两个数据可以计算出文件大小(3)是该文件中块的数量(1个块=512B)(2)是最后一个块的字节数(没有用完512B)文件长度=(Block-1)*512B+Bytes。(4)06-07h:重定向项目的个数。EXE文件加载到内存执行时文件中数据的偏移地址跟内存中偏移是不一样的,重定向就是达到重新修改偏移的目的。(5)08-09h:该处数据指出了EXE头部大小,一般来说,EXE头部之后紧跟着程序数据。单位是节,1节=16(0x10)字节如文件偏移0020h*10h=200h。(...
· APA格式
格式虽然有些作者对于APA格式其中的一些规范感到不妥,但APA格式仍备受推崇。期刊采用同一种格式能够让读者有效率的浏览和搜集文献资料,写作时感到不确定的学者们发现这样的格式手册非常有帮助。譬如,手册中的“非歧视语言”章节明文禁止作者针对女性和弱势团体使用歧视的文字,不过使用APA格式的学术期刊有时也会为了让文章更有条理而允许作者忽略此规定。标题根据APA格式,标题用来组织文章,使得其有层次架构。APA格式规定了文章内“标题”的特定格式(1到5级),此详细内容可参阅《美国心理协会刊物手册》第五版的第113页,级数和格式如下:第1级:置中大小写标题(CenteredUppercaseandLowercaseHeading)第2级:置中、斜体、大小写标题(Centered,Italicized,UppercaseandLowercaseHeading)第3级:靠左对齐、斜体、大小写标题(Flus...
· ZIP格式
历史前身1985年一家名为SEA(SystemEnhancementAssociates,系统增强伙伴)的小公司开发了一个在MS-DOS平台下的商业压缩软件,名为ARC。当时的软件发行方式与现在略有不同,用户购买了软件,除了得到软件的可执行文件还包括一份C语言的源代码。当时的卡茨与很多用计算机的平民一样,缺乏资金购买大量的商业软件,当时卡茨从网上下载了一份ARC的C语言源代码,并用汇编语言将其全新编写并编译出来。卡茨将这个软件名为:PKARC(PhillipKatz"ARC)。卡茨制作的新软件PKARC因为是使用汇编语言重新编写,因为是参照源代码编写的,所以完全兼容ARC并且性能上比ARC高。卡茨当时将这个新软件上传到网络上面。显然,卡茨此举造成对SEA公司的侵权。SEA最初希望通过联络卡茨使PKARC成为SEA公司旗下的一款产品,后来卡茨拒绝了。最终,双方对簿公堂,结果是卡茨败诉,卡茨被...
· AVI格式
AVI封装概述尽管AVI已经属于老旧的技术,但是由于Windows的通用性,和简单易懂的开发API,仍被广泛使用。AVI的文件结构分为“头部”,“主体”和“索引”三部分。主体中图像数据和声音数据是交互存放的。从尾部的索引可以索引跳到自己想放的位置。AVI将视频和音频封装在一个文件里,其顺序是:若干视频帧(VideoFrame)之后接着若干音频帧(AudioFrame),再然后是视频帧、音频帧,故名为“音频视频交织”,意即音频和视频按帧交错排列,以此达到音频同步于视频播放的效果。和DVD视频格式一样,AVI文件支持多视频流和音频流,虽然这些功能很少使用。大多数AVI文件还支持由MatroxOpenDML集团于1996年2月开发的格式后缀。这些文件非正式的称为“AVI2.0”,并得到微软的支持。AVI本身只是提供了这么一个框架,内部的图像数据和声音顺据格式可以是任意的编码形式。但是由于索引放在...

关于我们

关注族谱网 微信公众号,每日及时查看相关推荐,订阅互动等。

APP下载

下载族谱APP 微信公众号,每日及时查看
扫一扫添加客服微信