大规模聚合研究的事情。我希望对尽可能多的潜在影响变量进行一定程度的控制。 通过使用我们自己的数据,该研究受益于: 所有内容的相同根域权限。 类似的个人 URL 链接配置文件(稍后有人会笑)。 已知原始发布日期,无需重新优化或修补。 每个博客的已知原始关键字目标(而不是猜测)。 已知且一致的内容深度/质量分数 (MarketMuse)。 用于针对每个博客的特定关键字的类似内容写作技术。 您永远不会消除将相关性误解为因果关系的可能性。但是控制一些变量会有所帮助。 正如兰德在周五的白板上所说,“相关性并不意味着因果关系(但它肯定是一个暗示)。”
警告: 我们在控制中获得的东西,我们失去了样本量。96 个样本量远不如一万或十万有用。因此,在考虑您认为最有可能为真的排名因素时,请仔细查看数据并谨慎行事。 此资源可以帮助衡量您应该对每个 Pearson 相关值的置信度。一般来说,关系 号码表 越强,需要对结果有信心的样本量就越小。 那么你到底在这里做了什么? 我们已经对可能影响新创建内容的有机性能的因素产生了暗示。不多也不少。但它们确实是有趣的提示,也许值得进一步讨论或研究。 你没有做什么? 我们还没有发表关于谷歌算法的全面概括。这篇文章不应被视为 Google 算法的权威指南,也不应假设您的网站将展示相同的相关性。
那么我应该如何处理这些数据呢? 阅读本文的最佳方式是观察我们观察到的与数据的潜在相关性,并考虑这些相关性可能或可能不适用于您的内容和策略的可能性。 我希望这项研究采用一种新的方法来研究单个 URL,并激发建设性的辩论和对话。 欢迎您提出建设性的批评,并希望推动这些对话向前发展! 统计表 所以别废话了,给我看看货,你说?好吧,让我们从我们的统计表开始,格式像棒球卡,因为为什么不呢?: *注:研究中仅使用了具有完整排名数据的博客。我们丢弃了缺少数据的博客,而不是添加任意数字。 和往常一样,如果你想重现我的结果 ,这里是原始数据集。