SEO密码

链接关系计算、特殊文件处理、质量判断

  家富人宁,终有个家亡人散各奔腾。
枉费了,意悬悬半世心,好一似,荡悠悠三更梦。

 链接关系计算、特殊文件处理、质量判断

   链接关系计算
        链接关系计算也是预处理中很重要的部分之一。现在所有主流搜索引擎排名因素中都包含网页之间的链接流动信息。搜索引擎在抓取页面内容后,必须事前就要计算出:页面上有哪些链接指向哪些其他页面?每个页面有哪些导入链接?链接使用什么锚文字?这些复杂的链接指向关系形成了网站和页面的链接权重。

链接关系计算

        搜索引擎中的PR值就是这种链接关系的最主要体现之一。由于页面和链接数量庞大,网上的链接关系又时时处于更新之中,所以链接关系及PR的计算要花费很长的时间。关于PR值得分析,SEO大婶之后会分享。

特殊文件处理

        特殊文件处理
        除了HTML文件外,搜索引擎通常还能抓取和索引以文字为基础的多种文件类型,如PDF、Word、WPS、XLS、PPT、TXT文件等。在搜索结果中也会常常看到这些文件类型。但是,就现前的搜索引擎来讲还不能处理图片和视频,对FLASH这类非文字内容及脚本和程序只能进行有限的处理。

特殊文件的处理

       虽搜索引擎在识别图片及从FLASH中提取文字内容方面有些进步,不过距离直接靠读取图片、视频、FLASH内容返回结果的目标还有一段距离。对图片、视频内容的排名往往是依据与之相关的文字内容,之后的整合搜索介绍会详细的介绍。
        质量判断
       在预处理阶段,搜索引擎会对页面内容质量、链接质量等作出判断。近年来的百度绿萝、石榴等算法,谷歌的熊猫、企鹅算法等等都是预先计算,然后上线,而不是查询实时计算的。

质量判断

       这里所谓的质量判断包含多种因素,并不局限于针对关键词的提取和计算,或针对链接进行数值计算。例如对页面内容的判断,很可能还包括了用户体检、页面排版、语法、广告布局、页面打开速度等情况,或许还会涉及到模式识别、机器学习、人工智能等方法。