关于 Google 图书搜索
概述
看法和意见
常规帮助

合作商计划
出版商和作者须知
立即加入
合作商帮助

图书馆计划
概述
图书馆合作商
图书管理员帮助

关于 Google 图书搜索

概述 | 历史 | 事实和误解

Google 图书搜索的历史

最初,就有 Google 图书搜索。

嗯,不完全是。但是,有人一定会认为该项目与 Google 本身的年代一样长久。1996 年,Google 的合伙创始人 Sergey Brin 和 Larry Page 还是计算机科学系的研究生,他们一直从事由斯坦福数字图书馆技术项目支持的研究项目。他们以建立数字图书馆为目标,并有这样一个伟大的构想:在大量藏书都实现数字化的未来世界,人们可以使用“网络抓取器”为图书的内容编制索引并分析图书之间的关联,从而通过跟踪由其他图书引用的次数和质量来确定任何给定图书的相关性和有用性。

他们当时构建起来的“抓取器”称为 BackRub,正是这种传统引用分析的现代转型产品促成了网页评级算法(使 Google 获得成功的核心搜索技术)的产生。

甚至在那时,Larry 和 Sergey 就预想各地的人们可以通过搜索全世界的图书来找到他们想要的图书。他们没有想到的是,有一天,他们将启动一个计划来帮助他们实现这个理想。在此,让我们简单回顾一下迄今为止的一些重要里程碑事件:

[2002]

由 Google 员工组成的一个小组正式启动了秘密“图书”计划。他们开始与专家讨论将会面临的挑战,讨论从一个简单但至关重要的问题开始:数字化扫描全世界每本图书需要多长时间?说来也奇怪,结果是没有人知道。根据 Google 公司的做事风格,Larry Page 决定自己进行实验。一天在办公室里,他和 Marissa Mayer(我们最早的产品经理之一)使用节拍器保持节奏,系统性地翻阅了一本共 300 页的图书。翻到最后一页时一共花了 40 分钟的时间。

受到世界各地正在进行的特别数字化计划(美国国会图书馆的American Memory(美国记忆)计划、Project Gutenberg(古登堡计划)百万册图书计划Universal Library(环球图书馆) [仅举这几个例子])的鼓舞,该小组进行了一系列现场考察以了解这些计划的运作方式。

在实地了解情况的过程中,Larry Page 与密歇根大学(他的母校和致力于图书馆数字化 [包括 JSTORMaking of America(美国的形成)] 的先驱者)联系。当了解到目前扫描该大学图书馆中的七百万卷图书估计需要 1,000 年时,他告诉大学校长 Mary Sue Coleman,他相信 Google 可以帮助他们在六年内完成扫描。

[2003]

一个小组成员参加了亚利桑那州菲尼克斯市的慈善书展,以购置一些图书来测试非破坏性扫描技术。经过无数次的实验后,该小组开发了一种扫描方法,比目前常用的高速处理方法更加温和。这令该小组成员精神振奋 – 图书本身应该更高兴吧。

与此同时,对于解决在处理包含奇怪的类型大小、不寻常字体或其他异常情况的图书(共 430 种不同的语言)中的信息时遇到的棘手技术问题,小组的软件工程师已取得了进展。

[2004]

牛津大学的包德利图书馆由 Thomas Bodley 爵士于 1602 年创办,该图书馆的使命始终是为全世界服务,而不仅仅是为大学社团服务。该小组访问了这座著名的图书馆并对受到了热情的接待。

在参观书库的过程中,图书管理员拿出了几个世纪以前的“毛边”书,这些书很少进入人们的视野。自从莎士比亚作为剧作家以来,让这些图书能突破文人学士的小圈子而快速接触到更多读者的梦想似乎第一次出现曙光。

这次访问非常有启发性,接下来的会议和讨论促成了在三年时间内数字化该图书馆中一百多万本 19 世纪公共领域巨大藏书的正式合作

同时,与世界上一些最大的出版商进行的一系列探讨也开始初见成效。十月份,Larry 和 Sergey 在德国法兰克福书展上对外宣布了“Google 图书搜索”。首批加入该计划的出版商有:Blackwell、剑桥大学出版社、芝加哥大学出版社、Houghton Mifflin、Hyperion、McGraw-Hill、牛津大学出版社、Pearson、Penguin、Perseus、普林斯顿大学出版社、Springer、Taylor & Francis、Thomson Delmar 和 Warner Books。

十二月份,我们宣布开始“Google Print”图书馆计划,该计划是与哈佛大学、密歇根大学、纽约公立图书馆、牛津大学和斯坦福大学合作进行的。这些著名图书馆总共的藏书预计超过 1500 万卷。

[2005]

在 Google Print 问世一年后,该小组再次参加了法兰克福书展,并对外宣布“Google Print”现在接受八个欧洲国家的合作商:奥地利、比利时、法国、德国、意大利、荷兰、西班牙和瑞士。

为实现我们将全世界的信息组织在一起并使全世界的人们都能访问和使用这些信息的使命,我们向美国国会图书馆捐赠了 3 百万美元以帮助建立世界数字图书馆,该图书馆将可为世界各地的人们提供稀有和独特藏书的在线访问。我们还为图书馆提供了试点扫描计划,其中包括美国国会图书馆的法律图书馆中具有史料价值的图书的数字化工作。

Google 将“Google 图书搜索 (Google Print)”重命名为 Google 图书搜索 (Google Books),该名称更准确地反映了它的用途。 该小组还通过参加有关图书馆计划基本准则的公开辩论对关于图书馆计划的争议做出了回应。

[2006]

在美国出版商协会 (AAP) 的动情演说中,密歇根大学校长 Mary Sue Coleman 解释了选择与我们合作进行图书馆计划的原因,同时强调了在面对自然灾害(如卡特里娜飓风)时数字化图书的重要性,他还补充道“我们永远信任这个计划”。

三月份,我们参加了伦敦书展,在那里,我们的一些出版商合作商分享了他们多年来积累的经验。

不久以后,我们请合作商告诉我们是否愿意向读者出售在线访问图书的完整访问权限(在他们的浏览器中具有的访问权限)。这是在我们与出版商密切合作,以开发能协助他们以创新的方式在线售书的众多新选择中的第一项。

整个夏天,我们通过创建一个空间供人们在线查找和搜索莎士比亚的完整剧本,帮助莎士比亚戏剧公演揭开中央公园 50 周年免费表演的序幕。同时在纽约,我们还参加了美洲书展,让美国的出版商和作者了解,当他们加入图书合作商计划后,用户可以查看哪些信息的机会

我们启动了一系列产品改善计划,使图书搜索更实用、更便于使用。首先,我们通过向所有不受版权保护的图书添加“下载 PDF”按钮扩展了对我们已扫描的公共领域著作的访问权限。几个月后,我们发布了新浏览界面,该界面可让用户更轻松地浏览和导航图书搜索。此新界面还附带新的“关于此书”页面,该页面使用 Google 算法来使用,在页面上提供与图书密切相关的内容 -- 最初包括相关图书、选定的页面以及学术著作中的引用。

秋天,有四个新图书馆加入了图书馆计划:加州大学、马德里康普鲁腾塞大学、威斯康辛大学麦迪逊分校和弗吉尼亚大学。


[2007]

使用新 UI 作为起点,我们尝试了几种新方法以实现人们与图书之间的互动。

  • 在本图书中的位置:带有地图的 Mashup 可让人们按在文本中提及的位置浏览图书(后来,我们发布了适用于 Google Earth 的实验性 KML 层来将这一过程逆转,即用户选取一个位置,然后我们将图书映射到该位置)。
  • 热门段落:我们通过追踪单个段落在藏书中的使用,创建了一种浏览各个图书的新方法。
  • 我的图书馆:我们帮助人们在其个人藏书中利用 Google 搜索的功能。用户开始组织管理以及共享他们的个人图书馆,并与其他人一起阅读和评价。
  • 新主页(最初仅限美国):我们为人们提供了跳点,供他们探索我们的索引中更多的图书。

Marissa Mayer 在美国引入了通用搜索,图书搜索成为 Google 搜索功能的一个更综合的部分。

五月份,洛桑州立图书馆兼大学图书馆和根特大学图书馆加入了图书搜索计划,同时增加了大量法语、德语、佛兰德语、拉丁语和其他语言的图书,使欧洲图书馆合作商数增加到六个。

七月份,我门向所有不受版权保护的图书添加了一个“查看纯文本”链接。T.V. Raman 说明了如何打开图书,以适应屏幕阅读器和盲文显示器等技术,这种技术让有视力障碍的用户可以像视力正常的用户一样轻松地阅读这些图书。

到十二月份为止,图书搜索界面已提供 35 种以上的语言支持,包括日语、捷克语芬兰语等等。来自 100 多个国家/地区的 10,000 多个出版商和作者参与了图书搜索合作商计划。参与图书馆计划的合作商数已增加到 28 个,其中包括七个国际图书馆合作商:牛津大学(英国)、马德里康普鲁腾塞大学(西班牙)、加泰罗尼亚国立图书馆(西班牙)、洛桑大学图书馆(瑞士)、根特大学(比利时)和庆应义塾大学(日本)。

展望下一年,我们将继续发展我们的技术并扩大与全世界出版商和图书馆的合作关系。敬请期待...

©2011 Google - 主页 - 关于 Google - 隐私政策