距离上一篇SEO的数据分析已经过了好久了,最近觉得应该写一些实际点的内容看看SEO到底怎么做。先明确一些基本点,一个网页被收录与否,有两个因素,
1.是否被爬虫爬过
2.页面质量是否过关
上一篇文章已经提过了收录率这么一个指标,很多网站都懒得去做这个指标,我看看site的数据不就行了!,事实上没有这个指标,很多工作就无从下手。从数据中找出问题,利用数据指导解决方案,分析数据验证工作成果。 最近看了《深入浅出数据分析》这个本书,觉得不错,把数据分析的方法讲得很生动,建议有兴趣的从事数据分析的同学可以买本看看。 任何数据分析由,目标->分析->评估->决策,四个环节组成。目标:我们想看一下网站的收录情况如何,在SEO方面是否还有提高的机会。分析:收录情况什么算好什么算坏,是不是用一些指标来衡量?网站的收录情况是不是过于笼统,是不是应该细分下各个页面的收录情况?
评估:于是我们需要下面一些数据
1.网站的页面层级关系
2.各个层级页面带来的SEO流量
3.各个层级页面的收录情况如何SEO流量的占比可以从Google Analytics中过滤出来。页面数量可以从数据库获得,或者通过火车头or自制小脚本抓取统计。收录率可以将获取的页面通过工具进行搜索,火车头也可以。问题立马凸显!1+2级目录页带来了大量的流量,收录率不是很好,优化收录的流量提升突破口在此!产品页面数量很多,收录也不是很理想,但是带来的流量有限,除了收录问题,还有页面内容的问题,本文中先不管它了。