当前位置:厦门seo » seo入门教程 » SEO教程第31课:了解百度搜索引擎的工作原理是什么

SEO教程第31课:了解百度搜索引擎的工作原理是什么

日期: 2013-10-10   

seo2
要想做好网站的seo优化工作,就必须先要了解百度搜索引擎的工作原理是什么?这样就能投其所好,更有利于提升网站排名。
百度搜索引擎的工作过程大概分为三个阶段。
一..爬行和抓取
为了抓取网上尽量多的页面,搜素引擎蜘蛛会跟踪页面上的超链接,从一个页面爬到下一个页面。整个互联网是由相互链接的网站及页面组成的。从理论上说,蜘蛛从任何一个页面出发,顺着超链接都可以爬行到网上的所有页面。
二.预处理
“预处理”也被简称为“索引”。搜索引擎蜘蛛抓取的原始页面,还要做大量的预处理工作,为最后的查询排名做好准备。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度、丰富度等。
三.排名
用户输入关键词后,排名程序调用索引库数据,找到匹配该关键词的网页。为了用户便于判断,除了网站标题和URL(URL也称为网页地址)外,还会提供一段来自网页的摘要以及其他信息。
seo入门教程小贴士:我将会在百合seo核心教程中分享:如何吸引百度蜘蛛来抓取更多的页面,内容更加实用,操作性更强。
在这篇“了解百度搜索引擎的工作原理是什么”文章中告诉我们了一项重要的知识点,你知道是什么吗?
“为了抓取网上尽量多的页面,搜素引擎蜘蛛会跟踪页面上的超链接,从一个页面爬到下一个页面”。通过这句话我们可以知道:做网站seo优化最主要的工作就是做超链接。

评论 (1)

  1. 酷猫
    2014 年 3 月 13 日 下午 7:08

    蜘蛛爬行在做日志的时候就会很清楚,上面几位都解释很清楚。我在给你推荐我自己的养蜘蛛的方法希望帮到你!
    百度对于收录页面是通过网站入口URL的联通成一个网状,然后百度的抓取功能是被称为“百度蜘蛛”的工具在进行收集,那么这个百度蜘蛛的收集器就是网站页面收录的关键。怎么才能更容易的被百度蜘蛛发现与收录呢?百度蜘蛛的计算原理目前我的了解有限,百度蜘蛛并不是人,它没有思考能力,它只是根据命令与设定的规则来行动。
    据我经验了解百度蜘蛛的收录规则:
    1.原创内容
    这是唯一的最为重要的点,百度蜘蛛在每天每天的运作它会记录起所有的内容性质,那么在爬取的时候就会进行筛选,而第一无二的原创文章则是百度蜘蛛最喜欢的被称为“蜘蛛食量”。由于百度蜘蛛对内容是没有理解能力的,它只对词语进行判断,那么在题目与文章内容里我们就要增加词语的密度与联系。作为现在的百度来说相关度高的文章容易被收录。建议:如伪原创文章前200个字是蜘蛛判断是否原创的关键。
    2.蜘蛛通道的建设
    百度每天会发出很多的蜘蛛去收集内容供应搜索引擎的更新,那么百度蜘蛛的通道就是URL。蜘蛛通过搜索引擎的URL进行行动,那么我们网站就要给出大量的门让蜘蛛进入到网站来,尽量多的让蜘蛛带走我们的内容,那么那些地方才是蜘蛛喜欢去的呢?我们在选择做外链引蜘蛛的时候要考虑到,蜘蛛喜欢的是一些内容更新多,活跃度高的网站:例如(论坛,门户,社区等)。
    3.养蜘蛛
    这是很多SEO做的工作,养蜘蛛就是让百度蜘蛛喜欢网站,从而经常来网站,这样就能很好的收录网站内容。具体怎么做呢?根据蜘蛛的规则:原创文章、外部URL之外,这个更新时间与更新频率尤其重要,我自己的经验是每天早上8:30-10:30之间发布文章是非常好的,因为这样一天里就有尽量多的时间让蜘蛛接触新内容,方便蜘蛛抓取。更新的时候不要过于不定时的发,在更新时段里进行发布。在收录的快慢情况下,进行下一时段的发布,如果前面发布的文章很快被收录之后再下午3:00-5:00之后时在进行发布。我的了解是,一次性增加10-20篇文章是会出现漏洞的,就是蜘蛛只抓取一部分。坚持一段时间蜘蛛的抓取就能得以控制。在第一时段更新之后,发现没有被收录的文章,在第2时段前,我们可以进行修改,增取在第2时段被收录。
    这是酷猫我自己的经验浅谈,如果有更好的百度蜘蛛抓取规则,可以留言下来进行讨论。

留下评论

你需要先 登陆 才能留下评论 。