查询系统及PR值计算公式
- 编辑:小平SEO -查询系统及PR值计算公式
一、查询系统
1、搜索词处理
(1)中文分词
(2)去停止词
(3)指令处理:“与”逻辑
(4)拼写错误矫正
(5)整合搜索触发
2、文件匹配:找到符合用户搜索词的“与”逻辑的所有页面子集
3、初始子集的选择:选出页面权重较高的一个子集,再对子集中的页面进行相关性计算
4、相关性计算
(1)关键词常用程度
(2)词频及密度
(3)关键词位置及形式:标题标签、黑体、H1
(4)关键词距离:例:减肥方法、减肥的方法、减肥效果特别好的方法
(5)链接分析及页面权重:锚文字、锚文字周围的的文字
5、排名过滤及调整:惩罚算法过滤有作弊嫌疑及降权的页面
6、排名显示:抓取到的TD标签信息、动态生成页面摘要
7、搜索缓存:搜索引擎会把最常见的搜索词存入缓存
8、查询及点击日志
(1)用户:IP地址、搜索的关键词、搜索时间、点击了哪些结果页面
(2)搜索引擎:搜索结果质量、调整搜索算法、预期搜索趋势
二、PR值(权重)计算公式
注:d=阻尼系数=0.85