点集贵州电脑网
 
 
 梦想之源 ›› 灌水专区 ›› Google如何抓取网页、编制索引和提供服务 版主:
灌水专区
新建论坛
申请免费TS
1 / 1 页
<< 1 >>
跳转
 主题:Google如何抓取网页、编制索引和提供服务
 
 狄丝
发表时间:[2008-03-03 14:35:22] [向作者发站内短信] [复制链接告诉朋友]
等 级:准尉
经 验:5347
性 别:美女
文 章:711
精 华:40

提交搜索结果包含三个主要过程:

  • 抓取: Google 知道您的网站吗? 我们能够找到它吗?
  • 编制索引: Google 会为您的网站编制索引吗?
  • 提供: 网站是否包含与用户搜索相关的良好、实用的内容?

抓取

抓取是 Googlebot 发现新的和已更新的网页的过程,这些网页将被添加到 Google 索引中。

我们使用大量的计算机来获取(或"抓取")数十亿网页。 承担获取任务的程序叫 Googlebot(也称为漫游器 (robot)、bot 或 spider)。 Googlebot 使用算法流程: 计算机程序会确定要抓取的网站、抓取频率以及从每个网站中获取的网页数量。

Google 抓取过程的起始点是一个网页网址列表,它是在之前的抓取过程中生成的,并使用网站管理员提供的 Sitemap 数据进行了扩充。 Googlebot 在访问这些网站时,会检测每个网页上的链接并将它们添加到要抓取网页的列表中。 新出现的网站、现有网站的更改和无效链接将被记录并用于更新 Google 索引。

Google 不接受为提高网站抓取频率而支付的费用。我们会将搜索业务和以盈利为目的的 AdWords 服务严格分开。

编制索引

Googlebot 处理所抓取的每个网页,以便将其看到的所有字词和每个网页的位置编制到大型索引中。 此外,我们还处理包含于关键内容标记和属性中的信息,例如 Title(标题)标记和 ALT(替代)属性。 Googlebot 可以处理许多(但不是全部)类型的内容。 例如,我们无法处理大多数 Flash 文件或动态网页的内容。

提供结果

用户输入查询时,我们的计算机搜索索引查找匹配网页,并返回我们认为与用户搜索最相关的结果。 相关性由 200 多个因素确定,其中之一即特定网页的

PageRank。 PageRank 是基于来自其他网页的内部链接对网页的重要性进行的衡量。 简单来说,其他网站对您网站网页的各个链接构成您网站的 PageRank。 并非所有的链接都是相等的: Google 致力于通过确认垃圾链接和其他对搜索结果造成负面影响的行为来改善用户体验。 最好的链接应基于您提供的内容的质量。


上帝给我大脑于是我思考,上帝给我双腿于是我奔跑,上帝给我十指,于是我上网.经过思考后,我奔跑着来上网!

 楼主更多新贴 :  
★冰雨轩TS绿化版下载及使用教程
游戏地带魔兽世界英雄榜签名图片生成器
主题活动VIP收费TS,您明智的选择!
游戏地带CT_RaidTracker魔兽世界3.0中文版下
1 / 1 页
<< 1 >>
跳转
  快速回复
  帐号: 密码: 匿名不登陆
回复内容:  
验 证 码:
 
 
·VIP收费TS,您明智的选择!
·9800GT+19'液晶DIY仅售3500元
·双核特惠:1999、2999、3999
·什么是点金积分,如何查看自
·团购一期:三星R458-DS0G+高
  
贵州点集科技发展有限责任公司·点集贵州电脑网 版权所有©2006-2008
中华人民共和国增值电信业务经营许可证 黔B-20070010号
客服QQ: 93804809818866281927205370
电子邮件: deangi@vip.sina.com
技术支持: 0851-5109268