如何分析谷歌的算法:你需要的数学和技能

  • 如何分析谷歌的算法:你需要的数学和技能已关闭评论
  • A+
所属分类:博客文章

如何分析谷歌的算法:你需要的数学和技能如何分析谷歌的算法:你需要的数学和技能

“你想花钱做广告还是解决这个黑盒子?”
这个(粗略的)问题帮助我决定了我的职业道路,10年前成为今天的搜索引擎优化。
我选择这条路是因为我喜欢在挑战中工作,在幕后寻找导致事情发生的原因。
在谷歌42岁的深度思考的帮助下,寻求解决生活、宇宙和一切事物的答案,然后再次检查我是否有正确的问题(剧透:它是6乘以9)是让我兴奋的搜索引擎优化。
让我写这篇文章的是,在杰夫·弗格森的帖子上,我们是否有破解谷歌算法的数学方法,如果有,这个行业需要什么,

需要两件事

所以,对于那些了解我的人来说,你不会惊讶于我反对这样一种观点,即基本的相关性分析,即使使用了斯皮尔曼系数,也足以分析谷歌的算法。
自从我在2011年的SMX East演讲开始,我就公开提倡使用多元线性回归作为分析重要问题的最低标准。
其他先进的统计方法,不管是机器学习还是神经网络,都有它们的作用。
但我的重点是这篇文章。
使用统计方法的一个重要警告是,一个工具本身或最后附加的工具本身并不符合一个好的研究。
这就是拥有正确的数据分析技能和搜索引擎优化经验发挥作用的地方。
正如在COVID-19分析中反复看到的那样,仅仅拥有数据分析员的背景并不足以证明一个人可以在媒体或Twitter上比流行病学专家解决问题。
虽然少数人似乎有助于提供有价值的想法供大家分享,但绝大多数人都不谨慎,谦逊地允许错误信息传播。
我需要提醒业界当搜索引擎优化错误信息被非搜索专家传播到新闻中时会发生什么,

统计学家

好吧,那么是什么让我有权指出研究的高级统计学方向,
我在国际经济学专业攻读国际关系硕士学位,在那里我学习了计量经济学,并从中获得了撕开有关中国经济的计量经济学论文的乐趣。
你会在Twitter上发现我在Twitter上撕碎SEO相关性研究,这是有原因的。

那么,为什么要回归呢

首先也是最重要的一点,它不再是孤立地分析单个度量。
取而代之的是,在影响排名的因素上,多个指标也可能相互影响。
这就要求至少在这一点上使用多元线性回归。
除此之外,SEO不再关注单一指标,而不再谈论多个因素,这促使SEO更广泛地考虑一套全面的指标来提高排名。
另一方面,这会优先考虑1000个指标,因为1000个指标可能会让人望而生畏,但如果900+仅仅移动指针0.1%,那么确定哪些指标将加速优化任务。
此外,使用时间序列和回归分析(其中分析的因素在一个固定的时间段内,而不是在一个特定的时间点)可以帮助平滑的日常或每周的变化,集中在核心领域,同时提供对主要算法更新变化的洞察。
对于那些希望获得可信度的机构来说,看看科学领域是如何对复杂领域进行回归分析的。例如:

  • 海平面上升
  • 超导材料科学
  • 或者,如果你想要更接近搜索引擎优化,是什么驱动了零售网站的有机流量

虽然很少,但具体提交的搜索引擎优化研究论文确实出现了进入。

良好的分析技能很重要

从逻辑上讲,在没有经过正确培训的情况下给某人一个工具并不意味着这会自动带来好结果。
这就是为什么拥有正确的好奇心,愿意深入研究(像一个超级用户)并将数据通过振铃器,将补充先进的统计工具。
这种心态将决定:

  • 收集什么数据
  • 什么有方向性
  • 甚至在开始分析之前就要删除

这是一个基本的标准,需要一些搜索引擎优化的经验,特别是要事先认识到哪些指标可能是潜在的原因,以及如何避免对人口统计、季节性、买家意图等产生偏见。
而拥有SEO经验也意味着分析有更好的机会包括有价值的外贸网站SEO交互效果来分析,特别是当一个孤立的优化可能不会被视为垃圾邮件,除非与其他策略结合起来。(例如,白色背景的大段落中的白色文本,用户无法看到)
此外,知道谷歌没有使用单一的单一算法,意味着任何分析都需要包括类别或组,无论是通过:

  • 关键词意图
  • 搜索音量
  • 排名
  • 工业
  • 等等

查看数据散点图以确保不存在以下问题的原因:

  • 异方差:由于变异性不相等而向外扇形的数据
  • 辛普森悖论:两个不同的群体表现出相同的趋势,当结合在一起时会产生相反的趋势

所以,在这些分析中,散点图或胡须图是必须的,以表明研究避免了常见的统计问题。
有了这些结果,提供一个标准的回归结果格式可以帮助那些有统计背景的人快速、轻松地审查结论,而不必单独运行回归,只是为了再次检查对结果的声明。
因为统计研究的一个关键部分,也是许多公开推广的SEO研究过程中的一个常见错误,就是这些解释远远不合理。
轻信的声明经常被用作链接诱饵,而不是为SEO社区阐明。
当我深入研究这些研究时,我经常问自己:

  • 数据集是否排除了潜在的异常值,如维基百科或亚马逊
  • 如果索赔是CTR影响排名,研究如何处理排名影响CTR的内生性
  • 一个关于直接影响流量排名的奇幻说法有没有特别的证据来支持它呢
  • 为什么排名会显示在X轴上,好吧,最后一个更让我恼火

这就是同行评议的用武之地。
反复检查自己的作品是否有错误是一回事。
同行评议通过帮助找到盲点、挑战假设、提高研究质量、建立更大搜索引擎优化社区的工作适合性,将其提升到另一个外贸网站推广层次。

一次性完成所有这些

在一个理想的世界里,是的!
事实上,要达到这一目标,可能需要几步(和一些失误)。
而我,以及许多有统计头脑的seo,并没有要求效仿任何一个例子。
要生成模型创意,请查看:

  • 我的2019 TechSEO Boost演示文稿
  • 迈克尔·金的运行视频

关于如何编写回归研究以及如何使用Python运行线性回归模型,请参阅hulyacoban的文章。
这是SEO行业需要去的地方,如果我们真的想真正了解谷歌的算法正在进行的是什么,在研究中建立一个坚实的基础,并停止虚假信息。

这项研究…

好吧,要看情况。
或者更准确地说,当相关性研究和软件度量有价值时,应该考虑到Russ-Jones提出的一些可接受的例外情况和一些突出的反对意见。
如何分析谷歌的算法:你需要的数学和技能
我并不反对私人使用相关性研究来制作内部业务用例。
干吧。
在商业世界里,时间是宝贵的,所以尽你所能去做,如果失败了就承认。
在公共领域,很少有有价值的研究是通过使用正确的分析框架和正确的书面记录或者关注谷歌SERP的逐年变化而进行的。
而那些强调数据透明的方法论的文章则需要对其开放性给予应有的赞扬。
另外,通过SearchPilot等工具进行SEO实时测试研究。
这些都是更为数学化的结构,我与开发人员一起进行内部构建,并从2011年开始公开展示它们的价值。
因此,这些研究的工作,从使用PPC的搜索引擎优化标题,到在Pinterest上做的实验,如果你有巨大的流量,它是一个伟大的垫脚石。

我们往上走

除此之外,先进的统计方法和扎实的数据分析技能与搜索引擎优化经验是一个必须实现的行业需要。
而且,有足够多的具有统计头脑的seo愿意帮助、审查和提供建议,使这些研究成为权威。
是的,每当一项新的研究出来时,这些SEO在Twitter上都会有很多严厉的批评,但这正是出于对行业声誉的关心,以防止一项研究的观点被误解,推动糟糕的搜索引擎优化,并希望其他人学习如何更好地分析复杂的系统。
尽管多元线性回归模型并不完美,因为需要依赖历史数据,而且随着时间的推移,维护量会对结果产生偏差,但对于搜索引擎优化行业来说,这仍然是朝着正确方向迈出的一步,因为搜索引擎优化行业越来越注重统计。

简明扼要地说…

如果你有大量的数据(以及时间和资源)来做这件事,并想成为行业内第一个做这件事的SEO机构、顾问等,那么你需要做的是:

  • 一种先进的统计模型,如多元线性回归
  • 一个好奇的心态与搜索引擎优化经验
  • 一个大的度量集合,在大小上被具有方向性质量的度量所缩小
  • 交互度量
  • 数据的组和类别
  • 超过一周的时间段
  • 内生性,杂种优势,和其他偏见审查
  • 删除数据异常值(如果有)
  • 解释方法
  • 作品展示了散点图和回归数据格式
  • 索赔有足够的证据支持
  • 经同行评审的数据和分析

森摩尔网络从2013年开始做外贸网站的SEO推广服务,到现在已经7年多了。我们已经为上千个人和企业提供外贸网站的优化推广服务,客户遍及全国各地,我们的服务深受客户好评!如果您有外贸网站需要推广,请联系我们,我们会提供专业、快速的额服务!

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin
450+锚文本Dofollow英文博客文章外链包月服务
Trustpilot 五星认证Verified好评  Facebook评价
英文新闻稿写作发布服务—中级版
100不同站点多类型外链服务