搜索引擎排序规则入门解析

- 编辑:小平SEO -

搜索引擎排序规则入门解析

一、蜘蛛工作流程
1、抓取网页
(1)蜘蛛抓取
<1>爬虫Spider顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。(网页快照)

<2>蜘蛛(spider)
①百度蜘蛛:Baiduspider
②谷歌机器人:Googlebot
③360蜘蛛:360Spider
④SOSO蜘蛛:Sosospider
⑤雅虎蜘蛛:“Yahoo! Slurp China”或者Yahoo!
⑥有道蜘蛛:YoudaoBot,YodaoBot
⑦搜狗蜘蛛:Sogou News Spider

(2)抓取规则:通过链接抓取,深度优先策略和广度优先策略同时使用,层级不要太多,不要超过5层

(3)抓取的内容
<1>链接:抓取的方式
<2>文字:识别度最高
<3>图片:alt,描述图片的一句话,让搜索引擎识别图片
<4>视频/flash(不识别)
<5>js(不识别)
<6>iframe框架(不识别):谷歌浏览器、火狐浏览器右键-审查元素,最终还是通过文字来让蜘蛛识别内容,尽量不用
如:百度地图:http://www.shmolds.com/lianxi

(4)影响抓取的因素
<1>需要权限:登录,权限
<2>网站打不开:服务器(空间主机)不稳定,404死链,网站被黑

2、处理网页(过滤)
(1)临时数据库:暂时存放抓取回来的网页
(2)筛选过滤:互联网大量的无价值的页面,死链接,欺骗页面,低质量页面,为了节省搜索引擎工作时间,服务资源
(3)索引:质量较高的页面,查看索引量,可以在百度搜索资源平台(百度站长平台)查看

(4)收录
<1>平时大家所说的【收录】,约等于索引量
<2>单个页面:百度一下页面网址
<3>整个网站:site:域名

<4>注意
①索引量大于收录:一般情况,特别是新站
②索引量小于收录:数据不准,多个快照

3、百度官方说法
(1)收录:页面被Baiduspider发现,分析过
(2)索引:Baiduspider经初步分析后认为有意义,做建库处理
(3)先有收录才可以建立索引,收录量大于索引量
(4)http://ziyuan.baidu.com/college/articleinfo?id=806

二、搜索引擎排名的流程
1、抓取→临时数据库→筛选→索引→收录→提供检索服务(排名)
2、排序规则:搜索引擎算法

3、排名建立在基础优化上
(1)网站定位
(2)网站TDK
(3)网站布局
(4)网站内容
(5)用户数据
(6)外链推广
(7)……

4、影响搜索结果排序的因素
(1)相关性
(2)权威性
(3)时效性
(4)重要性
(5)丰富度
(6)受欢迎程度

你会喜欢下面的文章? You'll like the following article.