族谱网 头条 人物百科

Google文件系统

2020-10-16
出处:族谱网
作者:阿族小谱
浏览:624
转发:0
评论:0
历史设计GFS专门为Google的核心数据即页面搜索的存储进行了优化。数据使用大到若干G字节的大文件持续存储,而这些文件极少被删除、覆盖或者减小;通常只是进行添加或读取操作。它也是针对Google的计算机集群进行的设计和优化,这些节点是由廉价的“常用”计算机组成,这就意味着必须防止单个节点的高损害率和随之带来的数据丢失。其它设计理念包括高数据吞吐率,甚至这带来了访问反应期变差。节点分为两类:主节点和Chunkservers。Chunkservers存储数据文件,这些单个的文件象常见的文件系统中的簇或者扇区那样被分成固定大小的数据块(这也是名字的由来)。每个数据块有一个唯一的64位标签,维护从文件到组成的数据块的逻辑映射。每个数据块在网络上复制一个固定数量的次数,缺省次数是3次,对于常用文件如可执行文件的次数要更多。主服务器通常并不存储实际的大块数据,而是存储与大块数据相关的元数据,这样的数

历史

设计

GFS专门为Google的核心数据即页面搜索的存储进行了优化。数据使用大到若干G字节的大文件持续存储,而这些文件极少、覆盖或者减小;通常只是进行添加或读取操作。它也是针对Google的计算机集群进行的设计和优化,这些节点是由廉价的“常用”计算机组成,这就意味着必须防止单个节点的高损害率和随之带来的数据丢失。其它设计理念包括高数据吞吐率,甚至这带来了访问反应期变差。

节点分为两类: 主 节点和 Chunkservers 。Chunkservers存储数据文件,这些单个的文件象常见的文件系统中的簇或者扇区那样被分成固定大小的数据块(这也是名字的由来)。每个数据块有一个唯一的64位标签,维护从文件到组成的数据块的逻辑映射。每个数据块在网络上复制一个固定数量的次数,缺省次数是3次,对于常用文件如可执行文件的次数要更多。

主服务器通常并不存储实际的大块数据,而是存储与大块数据相关的元数据,这样的数据如映射表格将64位标签映射到大块数据位置及其组成的文件、大块数据副本位置、哪个进程正在读写特定的大数据块或者追踪复制大块数据的“快照”(通常在主服务器的激发下,当由于节点失败的时候,一个大数据块的副本数目降到了设定的数目下)。所有这些元数据通过主服务器周期性地接收从每个数据块服务器来的更新(“心跳消息”)保持最新状态。

操作的允许授权是通过限时的、倒计时“租期”系统来处理的,主服务器授权一个进程在有限的时间段内访问数据块,在这段时间内主服务器不会授权其它任何进程访问数据块。被更改的chunkserver——总是主要的数据块存储器,然后将更改复制到其它的chunkserver上。这些变化直到所有的chunkserver确认才存储起来,这样就保证了操作的完整性和原子性。

访问大数据块的程序首先查询主服务器得到所要数据块的位置,如果大数据块没有进行操作(没有重要的租约),主服务器回答大数据块的位置,然后程序就可以直接与chunkserver进行联系接收数据(类似于Kazaa和它的超级节点)。

批评意见

只能有一个主服务器——代码不允许存在多个主服务器。这看起来是限制系统可扩展性和可靠性的一个缺陷,因为系统的最大存储容量和正常工作时间受制于主服务器的容量和正常工作时间,也因为它要将所有的元数据进行编制,并且因为几乎所有的动作和请求都经过它;但是Google的工程师们辩解说事实并不是这样。元数据是非常紧凑的,仅仅只有数K到数M的大小,并且主服务器通常是网络上性能最好的节点之一;至于可靠性,通常有一个“影子”主服务器制作主服务器的镜像,一旦主服务器失败它将接替工作。另外,主服务器极少成为瓶颈,因为客户端仅仅获取元数据然后将它们缓存起来;随后的交互工作是直接与chunkservers进行。同样,使用单个的主服务器可以大幅度地降低软件的复杂性,如果有多个的主服务器,软件将变得复杂以能够保证数据完整性、自动操作、负载均衡和安全性。

参见

Hadoop-Apache软件基金会的开放源代码项目,提供与Google文件系统类似的功能。

Google产品列表

Gmail文件系统GmailFS使用一个可加载的Linux文件系统,它使用Gmail帐号作为存储媒介。


免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

——— 没有了 ———
编辑:阿族小谱
发表评论
写好了,提交
{{item.label}}
{{commentTotal}}条评论
{{item.userName}}
发布时间:{{item.time}}
{{item.content}}
回复
举报
点击加载更多
打赏作者
“感谢您的打赏,我会更努力的创作”
— 请选择您要打赏的金额 —
{{item.label}}
{{item.label}}
打赏成功!
“感谢您的打赏,我会更努力的创作”
返回

更多文章

更多精彩文章
打赏
私信

推荐阅读

· Google
历史创建1998年,Google的早期页面很简洁,当时两位创始人在HTML方面并不是很有经验。点击这里查看Google1999年时的外观1996年1月,加州斯坦福大学理学博士生的拉里·佩奇和谢尔盖·布林在学校开始研究一项关于搜索的研究项目。区别于传统搜索根据关键字在页面现次数来进行结果排序的方法,两人开发了一个对网站之间的关系做精确分析的搜寻引擎。这个名为PageRank的引擎通过检查网页中的反向链接以评估站点的重要性,此引擎的精确度胜于当时的基本搜索技术。最初,佩奇和布林将这个搜索引擎命名为“BackRub”,直到后来改为“Google”。这个新名字来源于一个数学大数googol(数字1后有100个0,即自然数10)单词错误的拼写方式,象征着为人们提供搜索海量优质信息的决心。Google搜索引擎在斯坦福大学的网站上启用,域名为google.stanford.edu。1997年9月15日,...
· Google+
历史2011年6月29日正式开放试验,这是创办人拉里·佩奇成为新首席执行官后的重大任务。该服务是一层集成了Google所有社交服务(诸如GoogleProfiles和GoogleBuzz),还加入了很多新的功能,比如社交圈(Circles),多人视频聊天(Hangouts),话题灵感(Sparks),Huddles以及移动社交应用(Mobile)。版本沿革2011年6月28日-Google+网站服务项目正式启动,只能通过邀请注册。2011年7月24日-注册用户数达到2500万人。2011年9月21日-向公众正式开放,任何人都可以注册而不需要被邀请。2011年11月7日-面向于企业的Google+Page正式启动。2012年1月27日-Google+将使用年龄限制从18岁下调至13岁。2012年4月11日-已重新更改设计用户界面。2012年5月7日-GoogleHangoutsOnAir功能...
· Google地球
纵览Google地球使用了公共领域的图片、受许可的航空照相图片、KeyHole间谍卫星的图片和很多其他卫星所拍摄的城镇照片。甚至连Google地图没有提供的图片都有。分为免费版与专业版两种。语言功用维基百科和Panoramio2006年12月Google地球增加了一个新的图层,名称为“地理网络”,内容包括集成维基百科的相关条目和Panoramio的相关照片。在维基百科,用户可以通过{{Coord}}模板在条目中添加地理坐标。2007年7月Google收购Panoramio。Panoramio网站上经过定位的照片匹配Google地球收录条件并经管理人员审查通过之后,通常在一星期后便会在Google地球上相应的位置展示,而等待接受审查的时间最多需要三星期。模拟飞行器在Google地球启动成功后,使用Windows的用户,按下Ctrl+Alt+A会弹出Google模拟飞行器;而使用MacOSX的...
· Google商标
Google商标的历史在1998年,谢尔盖·布尔使用自由软件GIMP设计了Google的第一个商标。这个商标仿照Yahoo!的商标在Google的结尾加上了一个“!”。为了给人以Google不墨守成规的印象,这个商标没有使用某个主色调,而是为每个字母使用了不同的颜色。Google涂鸦Google的第一个涂鸦是在1998年为火人节活动设计的。这个徽标是由拉里·佩奇和谢尔盖·布尔亲自设计的。此后Google的节日涂鸦都采用设计外包模式。在点击该徽标之后会链接到该节日主题的搜索页面。有些国家性的传统节日以及两国或两国以上的记念日重叠(如南美洲多数国家独立国庆为同一日),Google涂鸦只会在该国的版本展示该国的节祝日。2010年,为庆祝电玩游戏《小向导》诞生30周年,Google首次将涂鸦设计成动态的,仿照《小向导》的原始设计,将“Google”融入游戏内的迷宫,用户可以在Google页面玩这个...
· Google涂鸦
参见GoogleDoodle列表

关于我们

关注族谱网 微信公众号,每日及时查看相关推荐,订阅互动等。

APP下载

下载族谱APP 微信公众号,每日及时查看
扫一扫添加客服微信