互联网电影数据库
概要
IMDb上有丰富的电影作品信息,包括视频演员、导演,剧情,影评这类的基本信息,也有更深层的内容,比如视频相关的琐事花絮,片现的漏洞,视频音轨,屏幕的高宽比,视频的不同版本等等。演员,导演,作者和其他工作人员都在数据库中有自己的条目,其中列出他们参加过的视频,通常还有他们的传记。用户还可以找到那些在不同语言不同国家发行时使用了不同片名的电影 。
IMDb不只是电影和电子游戏等的数据库,还提供每日更新的电影电视新闻,以及为不同电影活动比如奥斯卡奖推出特别报道。IMDb的论坛也十分活跃,除每个数据库条目都有留言板之外,还有关于多种多样的主题的各种综合讨论版。IMDb扩展出来的姐妹站IMDbPro为专业人士提供额外的信息,如电影业界人士的联系方式,电影活动日期表等等。IMDbPro不是专门为普通大众设计服务的,内容也不是免费的。
任何人只要有电子邮箱并使用接受Cookie的Web浏览器就可以在IMDb上创建帐户,提交信息和对参加各种主题的投票。针对自动化查询的需求,数据库的大部分都能以压缩的文本文件格式下载,并用提供的工具解压(通常在命令行进行)。
历史
1989年时,Col Needham和其他人在Usenet新闻组 rec.arts.movies 电影和交换信息。他们编写了一个常见问题解答(FAQ)列表,包含演员,导演和已经去世的电影制作者的传记。在1990年末,他们的FAQ已经收录了将近10,000部电影和电视剧。
在1990年10月17日,Needham发布了一套UNIX的Shell脚本,该脚本可以搜索这4个FAQ,IMDb也由此诞生,不过那时的名字是rec.arts.movies电影数据库。
到了1993年,数据库已经扩展到包括琐事花絮,传记,视频情节等内容,还带有一个集中的电子邮件界面,用于搜索该数据库。当年晚些时候,IMDb被移到了万维网上(当时还处在婴儿期的网络)。数据库被放置在威尔士卡地夫大学的计算机科学系的服务器上。最初的网页界面作者是Rob Hartill。
在1994年,扩展了的电子邮件界面开始接受自动数据提交,人们不必再给指定的维护人员发信而间接提供新内容了。这些年里,数据库在连接着世界各地镜像的网络上靠捐赠的带宽运行。
在1995年,这一项目发展得很大,对Col Needham和其他的志愿者来说,依靠捐款和他们的空闲时间来维护它的运行已经明显不太可能。
1996年,成立商业公司的决定被作出,IMDb在英国注册成为互联网电影数据库公司。维护数据库的人们成为其股东,依靠广告,许可证和合作获得利润。
这种状态持续到1998年。数据库每时每刻都在成长,再一次到达了关键的时刻;利润被用在设备上,股东们很难接受辛苦劳动却只能得到很少收入的事实。一些大公司出价试图收购数据库,然而IMDb的股东们不肯轻易将其出售给无法保证继续免费提供其信息的其他企业。
就在这时,亚马逊的杰夫·贝索斯出现了。达成的交易是,IMDb得到了为股东们提供应有收入的资金,而Amazon.com可以在出售其DVD和录像带时使用IMDb的信息资源。
IMDb的功能继续不断扩展,2002年新增了针对娱乐界专业人士的IMDbPro,提供多样的服务,包括电影制作和票房详细资料,以及电影公司目录。订阅的价格是每月$12.95,或每年$99.95(2005年4月5日价格)。
250部最佳视频
“佳片250”旨在列出数据库内评级最高的250部电影,评级以数据库注册用户评分为基础,再套用下列所述公式 。入选规范必须是曾公开上映的非纪录片,片长至少45分钟,评分达两万五千人次以上 ,并且只有定期投票习惯的用户才会采用计票,至于有效票数量多少、如何才是匹配“有定期投票习惯”则还不为人知。IMDb宣称为了保持“佳片250”名单的公信力,他们“故意不公开有效计票的标准” 。除此之外,“佳片250”还套用精算学的“可信度公式”,对评分作加权评级 ,独立数据的数量越大(在此就是指合格用户的评分),统计处理后的可信度越高,IMDb原以下列公式计算加权评级(IMDb不公开现时公式):
以上:
公式所得的 W {\displaystyle W\ } 即为“贝式后验平均值”(详见贝氏定理)。
该榜因其综合广泛性以及不时的令人吃惊的结果而受到嘱目。上榜的电影中既有老电影(如《吸血僵尸》,1922年),也有新电影(如《蝙蝠侠:黑暗骑士》,2008年);既有流行视频(如得到超过420,000次投票的《指环王首部曲:指环王现身》),也有少有人问津的视频(如只有12,700张投票的《日出》)。榜上有各种不同类型的电影(如黑色视频《双重保险》、科幻片《银翼杀手》、音乐片《雨中曲》、西部片《黄金三镖客》、动画片《机器人总动员》等等);以及票房一般、很少获奖但却在影迷群体中有广泛的追随者的电影(比如《肖申克的救赎》、《死亡幻觉》等等)。截至2012年7月16日《肖申克的救赎》、《教父》、《教父II》为排名前三的电影。
这些条件是否能提供一个公正没有偏见的排行榜是有争议的。比如,新近上映的视频总是容易从一见钟情的影迷那里得到较高的评分,而这与成功视频应该经得起反复观赏的观念是不相符的。因此,有时新上映的视频冲进250最佳视频榜,甚至前100名,但随着更多观众的评分和重复观看后的评分而退出榜外的情景就十分常见了。另外一种对该榜的主要批评则是它反映的只是视频的受欢迎程度,并不体现对视频历史和艺术的客观知识。但实际上,在评论家年度评选和历史视频评选中,名列前茅的视频在最佳250部视频中通常排名很高。
目前在最佳250部电影名单中,主演最多视频的演员以詹姆斯·斯图尔特的10部作品最多,罗伯特·德尼罗及哈里森·福特各以9部作品居次。
在IMDb上还有最差的100部视频榜用基本相同的方法投票产生。经常位列榜首的视频是《 Manos: The Hands of Fate ( 英语 : Manos: The Hands of Fate ) 》和《Plan 9 from Outer Space》。
前20名名单
留言板
IMDb另一受欢迎的特色是其对应每个数据库条目,并且有47个主要板块的留言板系统。注册用户可以在这些留言板上分享和讨论关于电影,演员,导演的消息。至今已有超过六百万注册用户使用过留言板。
版权问题
所有为数据库提供内容的自愿者都对其作品拥有版权,但同时准许对其的复制,修改,并将其内容许可给IMDb。相应的,IMDb不允许其他人在未经许可情况下使用其电影概述或生平简介。使用软件方法屏蔽该网站显示的广告也被明令禁止。视频名录中一小部分可以被引用,而且只能用于非商业性的网站。
可信度
由于数据库的人物传记、琐事等部分是采取用户自由贡献,但又并未要求用户对其贡献内容附上参考来源,因此缺少有效而立即的机制,以阻止蓄意破坏者添加未经查证、或对该人物诋毁性的数据。部分人物消息准确度因此有争议。
API
IMDb的数据在官网上可以免费下载,可惜的是免费提供下载的数据是文本格式,不能检索。为了使IMDb的数据能够被更多人使用,许多开发人员用各自的方法实现了不同的API,目前主要有以下几种:
IMDB API ORG
此接口由中国人开发 ,是一个轻量级的Web服务(RESTful接口),它提供一种IMDB数据的有效访问方式。就像前面说的一样,虽然IMDB的数据可以在官网上免费下载,但是却没有提供一个很好的API来检索这些信息。此Web服务旨在一定范围内解决这一问题。
此接口相较于其它接口具备以下特点:
支持中文译名检索
支持中文数据返回
支持JavaScript调用接口(可以使用AJAX技术直接获取结果,非JSO方式)
返回的数据字段更丰富
支持多条结果返回
请求限制宽松
此接口是唯一支持中文检索的IMDb API。
OMDB API
此接口的作者为Brian Fritz ,是之前The IMDB API接口的作者,因为受到IMDb官方的要求而更换了域名,是较早一批提供IMDb数据检索的服务(RESTful接口)。
在英文世界,该服务有较高的知名度。
该接口支持JAVASCRIPT调用。
TMDB API
此接口是由themoviedb数据库开放的API,严格来说它并不是检索的IMDb数据,它是一个独立的数据库,只是返回数据中提供了IMDb的一些相关数据,如:IMDb ID,IMDb Rating等。
该接口提供的方法更多,但是需要授权使用,限制较多。
参考文献
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。
相关资料
- 有价值
- 一般般
- 没价值