SEO密码

初始子集的选择、排名过滤及调整、排名显示、查询及点击日志

人生若只如初见,何事秋风悲画扇。等闲变却故人心,却道故人心易变。
骊山语罢清宵半,泪雨霖铃终不怨。何如薄幸锦衣郎,比翼连枝当日愿。
                                                                              木兰花·拟古决绝词柬友

         1、初始子集的选择

         找到包含所有关键词匹配文件后,还不能进行相关性计算,因找到的文件经常会有几十万几百万,甚至上千万个。要对这么多文件实时进行相关性计算,需要的时间还是很长的。

初始子集的选择、排名过滤及调整

         就实际上的用户并不需要知道所有的匹配几十万、几百万个页面,大部分用户只会查看前两三页,也就是是20、30个搜索网页结果,其中可能还包括付费展现的网站。搜索引擎其实并不需要计算这么多页面的相关性,只需计算最重要的一部分页面就可。百度、谷歌、雅虎、搜狗、360、必应这些,网友可以试下,搜索的最终结果是多少个,我就不说了,反正搜索结果最前面显示的,一般都是用户体验效果好些的。百度不是有一句话吗:“百度一下,你就知道”。
         2、排名过滤及调整

         选取匹配文件子集、计算相关性后(之后会介绍),大体排名就已经确定了。之后搜索引擎可能会有些过滤算法,对排名进行轻微调整,其中最主要的过滤就是施加惩罚。对那些疑似作弊的页面,虽按照正常的权重和相关性计算排到前面,但“老搜”的却会在最后一步把这些页面调到后面去。比较典型的例子是百度的11位,谷歌的负6、负30、负950等等算法。

排名的显示

         3、排名的显示

         当所有排名确定后,排名程序调用原始页面的标题标签、标签说明、快照日期等这些数据显示在页面上。有时搜索引擎需要动态生成页面摘要,而不是调用页面本身的说明标签。

排名显示、查询及点击日志

         4、查询及点击日志
         搜索用户的IP地址、搜索的查询词、搜索时间,以及点击了哪些结果的页面等,搜索引擎都会记录形成日志。这些日志文件中的数据对搜索引擎搜索结果质量、调整搜索算法、预期搜索趋势等等都有非常重要的意义。
虽搜索引擎的工作过程“繁琐”,但就实际上搜索引擎工作步骤与算法是非常复杂的。
         各大搜索引擎都还在不断优化算法,优化数据库格式这些,“度娘”近年来就生出了“闪电算法、清风算法、飓风算法、冰桶算法、蓝天算法、天网算法等等”这些看似温柔型的标题,实际上有些还是站在用户体验的角度。大致上的主流搜索殷勤基本工作原理都是如此,实行性的改变这种问题可以不必担心。