首先要了解搜索引擎的基础原理,这才能知道在什么情况下什么数据指标是有关的;
之后需要对多种技术的入门级知识,因为各类数据的获取方式都不同,有些需要采集、有些需从日志提取
、有些从数据仓库导出、有些从API获取等等,需要学习的方向不尽相同;
单单的数据只是数字,还需要分析数据才能让它产生价值。临时性的分析一般用到Excel,监控类的分析
则需要自己做个能输出图表的报表系统。
这些至少要花个半年功夫才能学会,但并不算难,没有什么可畏惧的。就如学习1+1时都会觉得9*9是难的
,但学会后再往回看,那就没什么了。
一个基础的假想案例分析
假设个较接近于实际应用的例子:
一个游戏类论坛,A板块为网盘游戏下载,很多页面上有到X网盘的导出链接;B板块为BT下载,页面上有
一个站内的种子下载链接,无站外导出链接。
开始分析:
统计页面的抓取数量与即时收录数量,并计算之后,发现A板块的页面质量明显低于B。(页面质量 = 收
录数量 / 抓取数量)
那么此时猜测,是否是A板块帖子页面上,X网盘的导出链接导致了它的页面质量低
为了验证猜测,再将A板块的帖子页面分为两组,其中aa组有X网盘的导出链接、bb组没有X网盘的导出链
接。分别计算其页面质量。如果aa组帖子的页面质量明显低于bb组,那么可以得出初步结论:
“X网盘的导出链接,使得自身帖子页面质量降低,影响到收录量,并最终导致SEO流量受损。所以需将该
类导出链接做特殊处理,比如由自己站内URL,301跳转到X网盘等。”
当然这个结论未必是正确的。比如,aa组帖子具备的特征,除了具有X网盘的导出链接外,也可能具备的
特征如转载帖子比较多(游戏资源贴许多会是转载),可能是后者真正导致了其页面质量的低下。
尽管更严谨的数据分析(比如再将转载帖子与非转载帖子分组)更可能得出准确的结论,但这般严谨下去
就没个头了,SEO毕竟不是火箭科学,在某步的数据获取很有难度时,借助经验来猜测下可能更划得来。
所以可以先实施项目,然后再监控整个A板块相对B板块的页面质量是否有拉近,从而以最终效果来证实之
前的猜测正确与否。
尽管这个例子完全为假设,我并不确定实际情况中,帖子到网盘的导出链接是否会影响到页面质量。但类
似的例子平日能遇到很多,且此类分析的时候所需的数据收集起来方便,因此这是日常SEO数据分析最容
易碰到的一类情况。
一个进阶的实际案例分析
(数字与实际数值不等,但大致比例相同)
内页的流量在某一时间段大幅度下降,需分析其下降原因。
一个常用且管用的思路是,取25%的热词,看它们带来的流量、与另外75%词分别的变化。如果得出的数据
是热词的流量下降多,即多半为热词的排名有下降;如果下降程度相当,则为整体的影响。
首先,计算得出25%的热门关键词,它们的流量下滑幅度为35%;而75%的非热词,它们的流量下滑幅度为
30%。但虽然数据差了5%,但差距还不是特别明显,需要进一步分析才能确定。
因为关键词往往是可以被进一步分词的,如“SEO文章”可进一步分为两个检索词——“SEO”、“文章”
,而且检索词才是搜索引擎真正在处理的。所以进一步的分析就去分析25%的热门检索词流量的变化。
最终得出的数据是,包含25%热门检索词的关键词流量下降了40%,不包含热门检索词的词流量仅下降10%。