SEO密码

TrustRank算法

  TrustRank算法是早年基于链接关系的排名算法。TrustRank可以翻译为“信任指数”。最初也是检测垃圾的方法,现在搜索引擎排名算法中,TrustRank算法概念使用更为广泛,常会影响大部分网站的排名。TrustRank算法最初针对的是页面级别,在搜索引擎中TrustRank值也通常表现在域名级别,整个域名的信任指数越高,整体排名能力就越强。

   TrustRank算法最初来自于2004年斯坦福大学和雅虎的一项联合研究,用来检测垃圾网站,于2006年申请专利。这是说明TrustRank算法的应用PDF文件地址www.vldb.org/conf/2004/RS15P3.PDF

以下是该文件的部分内容

       用TrustRank打击网络垃圾邮件佐尔坦Gy翁毅赫克托加西亚莫丽娜简佩德森斯坦福大学斯坦福大学雅虎!股份有限公司。计算机科学系计算机科学系701第一大道斯坦福,CA 94305斯坦福大学,CA 94305森尼维耳,CA 94089ZOTANTH.CS.STANFRAD.EDU HeCTUR@ CS.STANFRAD.EDJPEDSESE@ YHOO-CONC。Web垃圾邮件页面使用各种技术实现在搜索引擎中的排名高于应得的排名结果。而人类专家可以识别垃圾邮件,手工评估一个太贵了大量的页面。相反,我们提出技术半自动分开信誉好,垃圾邮件的好页面。我们首先选择一个小集合种子页要由专家评估。一次我们手动识别有信誉的种子页,我们使用Web的链接结构来发现其他页面可能是好的。本文我们讨论实现种子的可能方法。选择和发现好的页面。我们目前世界上运行的实验结果由AltVista索引的广域网和评估我们的技术性能。我们的结果显示我们可以有效地过滤垃圾邮件基于良好种子的网络部分设置不到200个站点。

         术语“网络垃圾”指的是超级链接页面。以误导为目的创造的万维网搜索引擎。例如,色情网站可以通过添加成千上万个关键字来对Web进行垃圾邮件。它的主页,经常使文本对人类看不见通过巧妙地使用配色方案。搜索引擎然后将索引额外的关键字,并返回色情作品页作为对包含某些查询的答案的页关键词。由于添加的关键字通常不是严格成人性,人们寻找其他话题被引导到页面。另一种网络垃圾邮件技术是允许免费复制所有材料或部分材料。复制品不是直接用于商业的优势,VLDB版权公告和出版物的标题它的日期出现,并通知复制是通过许可的非常庞大的数据库捐赠。以其他方式复制,或重新发布,需要捐赠的费用和/或特别许可。第三十届VLDB会议录多伦多,加拿大,2004创建大量的虚假网页,所有指向到单个目标页面。由于许多搜索引擎在排名页面中输入链接的数量,目标页的排名可能会增加,并出现更早。在查询结果集中。就像电子邮件垃圾邮件一样,确定页面或组。页面是垃圾邮件是主观的。例如,考虑一个一组互相链接页面的网站。这些链接可以表示有用的关系。这些站点,或者它们可能是用Express创建的。提升对方页面排名的意图。一般来说,很难区分这两种情况。然而,就像电子邮件垃圾邮件一样,大多数人都很容易。识别网络垃圾的公然和厚颜无耻的事例。例如,大多数人会同意,如果文本中的大部分内容页面是不可见的人类(如上所述),是与页面的主题无关,然后添加页面。有误导的意图。  

TrustRank算法   

         TrustRank算法并不是由Google提出的,不过由于Google所占市场份额最大,而且TrustRank在Google排名中也是一个非常重要的因素,所以有些人误以为TrustRank是Google提出的。更让人糊涂的是,Google曾经把TrustRank申请为商标,但是TrustRank商标中的TrustRank指的是Google检测含有恶意代码网站的方法,而不是指排名算法中的信任指数。

         基于这个假设,如果能挑选出可以百分百信任的网站,这些网站的TrustRank评为最高,这些trustrank最高的网站所连接的网站信任指数稍微降低,但也会很高。与此类似,第二层别信任的网站链接出去的第三层网站,信任度继续下降。由于种种原因,好的网站也不可避免的会接到一些垃圾网站,不过离第一层网站点击距离越近,所传递的信任指数就越高,第一级网站点击距离越远,信任指数将依次下降。这样trustrank算法,就能给所有网站计算出相应的信任指数,离第一层网站越远,成为垃圾网真的可能性就越大。

青

渭城朝雨浥轻尘,客舍青青柳色新。

劝君更尽一杯酒,西出阳关无故人。

                                                     王维