google知识

Google最新版本搜索引擎Caffeine,更快更准确

2009-11-13

近日Google表示其最新版本的搜索引擎Caffeine即将隆重上市,据悉其搜索速度将更快,结果也将更准确。

公司并未公布确切的发布日期,但表示Caffeine将在2010年初全面推出。Google发言人Anthony House表示,“我们之所以没有在今年年底前将产品全面推出,主要是由于我们知道对于相当一部分网络站点管理员来讲,这个假期是非常重要的,我们不想让他们就此担心而无法安心度假。”

在周二的公司博客上,Google首席工程师Matt Cutts表示Google已经做好了向新阶段转化的准备,该阶段将以位于其一个数据中心的Caffeine为主。他表示,这意味着Google的一小部分用户将在日常搜索中从Caffeine支持技术获益。

Caffeine的一个显著性的标志就是在沙盒页有一则信息,其中包括开发者和公众对于该项技术的评论和留言。本周二的留言中,Google表示Caffeine将很快和大家见面。但目前公司认为该沙盒已不再需要了,并已将其关闭。不过,公司同事表示对于测试阶段大家所提出的积极的意见和建议表示感谢。

8月份,Google曾经推出了一些用于Caffeine平台的产品,并将其描述成一项神秘的工程,可以为Google提供下一代主打产品。Caffeine并非要修改Google搜索现有的模式,而是在此基础上,对于搜索参数的大小,速度和准确性进行改良。同Google常规的搜索技术更新不同的是,新的引擎代表了公司搜索产品方面具有重大意义的改变。

House表示,Caffeine是对原有搜索引擎的全面整修。“大多数消费者并不会注意到这些差别。这也不会对大部分的网络站点管理员造成影响,但是我们之所以要以沙盒的形式推出,就是想尽早将一些意想不到的问题解决。”除了搜索质量有所提升外,Caffeine也使得Google能更方便地进行一些创新。

谷歌搜索结果中将加入固定链接功能

2009-09-27

据国外媒体报道,网页中经常会加入一些固定链接,但点击链接时,用户便会进入特定的网页。维基百科便经常使用这种方法,以帮助用户更有效地浏览大篇幅的文章。谷歌公司近日宣布,谷歌搜索结果中将加入固定链接,以此帮助用户快速准确地搜索到信息。
例如,当尝试搜索“nuclear fusion”(核聚变)时,正如大家上面看到的,谷歌维基百科搜索结果下面显示数项标题,包括综述(Overview),要求(Requirements),主要反应(Important reactions)等。
如果用户希望了解产生核聚变的要求,用户可以直接进入“要求”部分。因此,谷歌的这项功能可以有效地帮助用户浏览篇幅较长的网页内容。
如果你是一名站长,并且希望为谷歌搜索把网页设置为几个特定部分,你可以阅读谷歌提供的相关建议。

Google Chrome OS操作系统过于理想?

2009-07-09

笔者从谷歌黑板报获悉谷歌将要开发自己的基于Chrome浏览器扩展的操作系统。 Chrome 操作系统是一个开放源代码的、精巧的操作系统,它最初会针对上网本。在今年晚些时候,将开放它的源代码。

快速、简便和安全是谷歌 Chrome 操作系统的核心特质。谷歌正在将该操作系统设计得更快速更精巧,数秒间即可启动并将您带入互联网世界。用户界面最小化以避免掩盖您的个人风格,而大多数的 用户体验则将发生于网络之上。彻底地重新设计谷歌 Chrome 操作系统的底层安全架构。如此一来,用户就不必再应对病毒、恶意软件和安全更新。一切皆由系统搞定。

从Google的官方博客看,该操作系统既支持X86架构,也支持ARM架构,一款操作系统可以兼顾两个完全不同架构的PC,那么性能如何呢?微软的Windows在X86架构上的优势是最为明显的,不能在ARM架构上运行。所谓术业有专攻。对于不是软件出身的Google凭什么可以做到在两种系统上都可以运行,总给有个优劣之分吧。如果有的话,那究竟在哪个架构上更优呢?倾向于任何一方,都会导致另一方疏远Google,这也许就很好地解释了为何Google操作系统首先进军上网本市场。因为上网本的应用比较单一(主要是上网浏览),这既可以掩饰了Google操作系统初期功能的不足,又可以谁都不得罪,先拿下一些市场再说。但Google是否忘记了上网本市场操作系统预装所走过的路。最初上网本市场还是Linux当道,但到了今天,微软的Windows已经重新夺回了这一市场,而且占据了80%—90%的份额,不知Google对此有何感想?其实在目前的PC产业,Wintel联盟仍在起着主导的作用,一来是双方的利益关系,更关键是X86架构的PC与Windows在性能和体验上最佳结合是无人能敌的。也许有人又会说,英特尔并购风河,而且推出自己的Moblin系统,没错,但那是英特尔的另一个战场—MID和智能手机,与PC无关,只要PC市场还在,Wintel联盟就会存在。
事实表明,Google的操作系统仍然是一个理想中的产物,具体会怎样,还要等到真正发布之后,但为何Google要在设个时间来发布一款尚处在开发阶段的操作系统呢?这就涉及到了最现实的。这段时间,微软搜索Bing的发布以及Windows7的测试都受到了业内的好评,想必之下,Google的Chrome浏览器增势缓慢,搜索引擎的市场份额也出现了下降,Android操作系统还未有实质性的进展,这些无疑让Google很不爽,借时下Windwos7来炒作一把,至少引起业内的关注,也可以让微软注意一下自家的后院,延缓微软在互联网市场的攻势,当然顺便提一下已经让人们不很关注的Chrome浏览器。但现实总归是现实,Google要想真正在PC市场挑战微软,还需要真功夫才行。

Google推出网页加速工具Page Speed

2009-06-06

Google本周四推出面向开发者社区网页加速工具Page Speed。Page Speed此前为Google内部使用,是Google提高搜索引擎速度的重要工具。

网页响应速度是使Google搜索引擎获得成功的重要因素。用户在使用Google搜索引擎时,通常只需几秒钟的时间就可以获得搜索结果。包括Gmail在内,Google其他一些互联网服务的响应速度也非常快。

Google采取了多方面措施来提升网站响应速度。一方面,Google对网页采取了最小化设计,并建设了庞大的数据中心。另一方面,Google对网站的前端设计进行了优化,使网页能够以最快的速度加载。

Page Speed正是Google用于优化网站前端设计的重要工具。Google日前将该工具进行了开源,并将该工具集成在了一款火狐浏览器插件Firebug中。该工具能向开发者提供建议,告诉开发者如何根据最佳方式加速网站。

Google在官方博客中称,Page Speed能自动优化网站图像,提供能直接被用在网站中的压缩图片。该工具还能识别出网页加载,但并没有起作用的JavaScript和CSS。这将减少用户等待网页加载的时间。

Google网页质量评估手册解密

2009-05-20

最近笔者发现一份英文的Google网页质量评估手册(Quality Rater Guidelines),据说这是一份Google给他员工培训如何人工评估网页质量的内部机密文件。  下面简要说明一下这份评估手册的一些主要内容:

Google把搜索分为3种类型:

Navigational:指的是人们心里已经明确知道要去的网站,比如搜索IBM。

Informational:指的是人们对某一个话题感兴趣,想了解更多相关的信息。比如搜索某一个人的名字,了解更多这个人的相关资料。

Transaction:指的是有人想购买或者下载某种东西,通过搜索确定去哪里购买等。比如搜索“buyipodtouch”。

Google准对某个关键字对网页质量的评估分类:

Vital:这是网页质量的最高标准。Vital的网页通常是一个公司或者个人的正式网站。比如搜索“IBM”,www.ibm.com就是vital网页。

Useful:这是第二高标准的网页。Useful的网页指的是正确回答查询问题的网页。本人认为,这也是为什么wikipedia在许多搜索中,总是排在很前的原因。

Relevant:这是中位的评分。Relevant给与那些提供部分相关信息,但信息不够综合全面,也不是权威的网站的网页。我觉得我的博客上的大多数网也属于这个类别。

NotRelevant:这是指那些网页基本上没有什么用,但是与查询的关键字还有一点联系。比如网页内容已经过时,只适合很小的一个地区等等。

Off-Topic:这是指与搜索完全不相关的网页。比如搜索”hotdog”,结果却是doghouse。

垃圾网页分类(SpamLabels):

NotSpam:NotSpam标签给与那些没有采用欺骗性的网页设计技术的网页。

MaybeSpam:这个标签给与那个网页可能使Spammy,但不是100%确定的网页。

Spam:这个标签授予那些违反Googlewebmasterguidelines的网页。

谷歌趋势与谷歌搜索观察的比较

2009-04-07

谷歌近日发布了一份研究报告(link),对谷歌趋势(Google Trends)和谷歌搜索观察(Google Insights for Search)做了一个深入的剖析,并将两者的结果与主流的行业报告做了一个比较,这些主流的行业报告都是依据实际的销售数据得出的,像汽车销售和房屋销售的数据。此报告比较并解读了几个统计模型,得出了每个模型的相对精度。

谷歌趋势

结果听起来很有趣,它们之间的主要不同之处在于,谷歌得出的数据要早于主流的行业报告——有时要比实际的零售数据早几周。谷歌趋势更能反映当下的经济状况,这意味着对数据的分析可以提前,而市场的拐点也可以更早的被人识别出来。

这种预测能力并没有成为谷歌私用品。在谷歌搜索观察和谷歌趋势页面,所有的查询结果都能以CVS格式的文件下载下来,此格式文件可以导入到电子表格或者数据库应用中。如果你在趋势行业工作,这可是一个绝妙的消息,你可以马上撇弃其他传统的报告,开始使用谷歌现成的数据源。

在此篇报道的开头就强调了一点,谷歌趋势使用的都是区域化的匿名搜索使用状况数据。正如在谷歌治印博客(Google Blogoscoped)所指出的

无论你是使用谷歌搜索引擎,使用Gmail发邮件,还是使用谷歌411声讯服务,在Chrome浏览器中地址栏中随便输入什么,你都会为谷歌提供了可供挖掘的数据,而谷歌对这些数据如何利用,我想明白人立刻就能想到。

对于个人而言,这开始有些让人骇人听闻,但是要记住一点,所有的这些数据都浓缩到了趋势数据中去,而且根据谷歌的隐私政策(privacy policy),除法律诉讼需要,谷歌的隐私政策是拒绝任何对个人贡献数据的核查。而且,此类详细数据只会保存很短一段时间。

而现实是,谷歌拥有这样一个信息宝藏是一回事,而知道如何利用这个宝藏又是另外一回事。谷歌走的很远,它将集合得到的数据提供给他人使用。譬如,谷歌开设了一个特殊页面,用来追踪美国境内的流感趋势(flu trends),公众可以根据各自生活所在地域,在谷歌信息的帮助之下决定是否要注射流感预苗。

Google实验室是什么?

2009-03-01
Google实验室

Google实验室

Google 实验室(http://labs.google.cn/)是为 Google 工程师和有探索精神的 Google 用户而开设的演练场。喜欢奇思幻想的 Google 员工将他们的原型产品放到 Google 实验室并征询关于技术使用或改进的反馈意见。这些试验这其实是开发过程的第一阶段。有探索精神的 Google 用户可以试用任意或所有在这里的原型产品并将他们的意见直接发送给开发这些产品的 Google 人员。
Google 工程师和研究人员开发了Google 实验室。这些 Google 员工仅在业余时间支持这些项目,所以有时候会出现某个演示不能运行或者运行缓慢。
Google 工程师和研究人员一直在寻找展示他们心爱产品的方式。Google 实验室对他们似乎是个不错的途径,他们能获得反馈信息却不需将每一个新的功能强加给所有的 Google 用户可以发送一条信息让他们知道这项技术是否实用。

目前实验室已经完成的项目有:

中文版已推出

Google Search Appliance virtual edition
基于虚拟机上运行的谷歌搜索服务器。

Google 公交搜索
搜索公交换乘信息

Google 代码搜索
搜索开放源代码

Google 趋势
看看整个世界都在搜索什么

分享Google图片搜索技巧

2009-02-09

现在已经很多人善于用图片搜索来找寻自己需要的图片,特别是那些设计人员更是离不开图片搜索,因为用起来真的很方便,比如Google就能索引到几十亿张图片,并且每天进行更新、补充。

图片是不分国界和语言的。这里要提到的是Google 对于图片搜索的排名有所调整。直接输入一些中文的关键词也可以查到在别国网站上的图片了呢。
比如你搜索“布兰妮”,出来的图片结果就不只是中文网页里的图片,更多的是国外网站上提供的。

除了人名、地名有这样的处理以外,类似的关键词还有:品牌名、漫画名、游戏名等等。因为在某种程度上说,它们在不同语言里都是通用的。

另外,再向大家介绍一个小诀窍。如果你想搜索可以作为桌布背景的图片,不妨把图片尺寸限制在较大尺寸,比如:春天。

从搜索引擎角度看SEO

2009-01-19

前段时间google发布了官方seo指南。这个文档中包含了适用于google的最佳seo实践策略。

一切都要以用户体验为中心。google表面的立场是:seo要最终回归到用户体验。是的,用户体验,我们经常听到这个词,但恐怕没有多少人真正理解为什么google把用户体验适用于一切事情。

google在搜索市场占据统治地位的原因是人们喜欢google提供的搜索结果,比如,最近发布的一项研究显示,google搜索结果页是第三大最可信的在线信息来源。如果google不再让人们对他们的搜索结果感到满意,也就是导致很差的用户体验的话,那么人们自然会转向其它搜索引擎,也就意味着人们不再访问google,当然,也不会再点击adwords广告了。因此,不管你是否赞同google以提高用户体验的名义执行的一些政策,可预见的时期内,你可以信赖这些基于有利于用户体验的政策。

百度真的很排斥SEO吗?只能说它对SEO比较敏感,换句话说,对SEO作弊方面做得比较严格,为了SEO而SEO百度是很容易看到出来,在这方面百度投入较大的人力。所以本来是垃圾站,但是利用搜索引擎收录的特点,在搜索结果中排到很好的位置,这样也违反了搜索引擎的初衷,让用户查到的都是一些对自己没用的资料。做网站就重要的还是在网站的内容,适当的SEO也是必不可少的。

Google 资讯是什么?

2009-01-10

处理资讯的全新方法

Google 资讯是一个由计算机生成的资讯网站。它汇集了来自中国大陆超过 1,000 多个中文资讯来源的新闻资源,并将相似的报道组合在一起,根据读者的个人喜好进行显示。

一直以来,新闻读者都是先挑选一种出版物,然后再寻找所关注的标题。为了向读者提供更加个性化的选项以及更加多样化的视点供其选择,我们采取的方式略有不同。在 Google 资讯中,我们为每项报道提供了指向多篇文章的链接,因此您可以先确定感兴趣的主题,然后再选择要阅读每项报道的具体发布者的网页。点击您感兴趣的标题,然后您就可以直接进入发布该报道的网站。

我们的文章是由计算机进行选择和排名的,它们会评估某项报道在线显示的频率和所显示的网站及其他因素。因此,对报道的排序不涉及政治观点或意识形态,对于任何给定的报道都有多样化的视点供您选择。我们将继续添加新闻来源,优化技术,不断改进 Google 资讯,并努力向更多地区的读者提供这一产品。

功能

个性化资讯:谁也不可能尽览每天发布的所有资讯,何不设置个性化网页,使其只显示最符合您兴趣的报道呢?

快讯:对于所关注的话题,您可以通过注册选择每周、每天或即时接收电子邮件快讯。

联合供稿:您可以在自己喜欢的联合供稿阅读器中订阅 RSS 或 Atom 联合供稿,从而接收 Google 资讯不同栏目的更新或 Google 资讯搜索结果。