这可能使我们免受手动锚文本过度优化惩罚,但 Penguin 似乎并非如此。 在我上面提到的例子中,网站管理员几乎满足了所有精确匹配锚文本指标。他们还满足了所有短语匹配指标。这些因素的结合使他们对 Penguin 影响的预测增加了整整 100%。 将高价值关键词塞入其他短语并不能保证您获得任何保护。
现在从中可以得
出很多潜在的结论。它可能只 WhatsApp 号码 是将精确匹配的影响加倍(即,如果您在精确匹配中得分高,那么您在短语匹配中得分也会高)。我们确实看到了一些这种情况的发生,但它似乎并不能解释所有额外的预测能力。可能是他们瞄准了其他相关关键词,从而增加了他们对企鹅算法其他部分的曝光。然而,我们所知道的是,当我们考虑短语匹配锚文本时,模型的预测能力会大大提高。
不多也不少
商业锚文本 这是我最喜欢的指标,因为 集成还消除了手动导入统计数据 它展示了 Google 如何使用其最强大的辅助数据集之一(关键字的出价)来检测链接图的操纵。我们围绕商业锚文本建立了 4 个指标。 该页面在单个链接中具有高价值锚点
您可以看到
删除商业锚文本将对我们预测 印度尼西亚号码列表 网站是否会受到企鹅的影响产生深远影响。 如果你一直密切关注,你可能会注意到其中很多都是相关的。拥有完全匹配和短语匹配的锚文本可能意味着你拥有高度商业化的锚文本。所有这些指标都是相互关联的,正是它们组合在一起的弱信号使得更容易检测到企鹅漏洞。
链接来源 我们试
解决的下一个问题是链接源的质量。最明显的步骤是尝试检测常见的垃圾链接源:目录、论坛、留言簿、新闻稿、文章和评论。使用一组足迹来识别这些类型的链接并抓取训练集的所有反向链接,我们能够构建一些指标来识别仅具有这些类型的链接或以这些类型的链接为主的网站。 首先,有趣的是,每种类型的链接都呈正相关,但相关性非常弱。