网站内页不被收录一直是困扰站长的一大难题,一般收录率达到70%以上算是优质站点,大多数网站收录率维持在50%左右,如何提高内页收录率成为关键性难题。在此与各位探究内页不收录的几大原因以及解决办法,不足之处还望高人拍砖。
一,内页权重低
网站内页权重未达到搜索引擎的索引标准,自然会被判定为无意义页面而放弃索引。通常安排四层结构为上限,层次过深容易导致权重分配不足而难以收录。通过增加内页外链以及首页直链能有效提高内页权重,进而带动深层页面的收录。
二,抄袭或伪原创
搜索引擎对伪原创甚至抄袭一直嗤之以鼻,蜘蛛索引时通过对比数据库计算相似度,若是超过比例上限则会考虑放弃收录。从最近两月的数据上看,百度加大了对抄袭站的打击力度并声明日后会持续净化。但不可否认伪原创对收录量提升的作用,因此建议各位站长保持合适比例的原创,鱼龙混珠进而快速提高收录量。
三,涉及敏感词汇
若是内容涉及法律敏感词汇,页面将不会被收录。通过百度搜索部分敏感词汇可以发现搜索结果皆为知名站点,原因在于知名站点可信度较高,百度作为搜索服务商可以降低可能由此产生的法律纠纷。若是内容无法避免提及敏感词汇,可以采用同义词近义词或是错别字的方法刻意躲避该收录陷阱。
四,内部程序出错
由于页面存在死链接或代码出错也可能导致不收录现象,建议收录量过低的站长朋友们仔细检查站内是否存在内部程序错误。
五,内容质量
对比抄袭或伪原创,即使是原创但内容质量过低也是一大弊端,如恶意堆叠关键词或是锚文本链接质量过低数量过多等。在此笔者要驳斥一下所谓文采差可读性低引起不收录的说法,通过长期的观察笔者发现不少站点即使内容页语句不畅不知所云,甚至全文乱码也能被收录并获得优异的排名,对此笔者在自己博客内有作过大量测试,有兴趣的朋友可以观察研究。
六,空间不稳定
网站空间不稳定会导致不少问题,可以试想蜘蛛在爬行某网站时多次碰壁会有何种印象。一个稳定快速的网站空间是所有站点健康成长的基石。
七,其它原因影响
网站被降权或是新站通常都会出现内页收录率较低甚至不收录现象。另外,内页外链的暴增暴跌也会导致页面被判入沙盒放弃收录。若是上述方法都无法解决问题,则应考虑是否是外部因素导致内页不收录。