那么,石榴算法中,百度究竟是如何判断网页质量呢网上较多文章对此发表观点,归纳有以下几点:感兴趣的受众群大小该页面的稀缺程度(可替代性)该页面是否有弹窗该页面广告的多少由上可见,目前我们的研究重点大部分集中在对网页的页面价值的判断上,缺乏对搜索用户交互行为的研究与分析。今天,我们尝试从搜索用户交互行为的角度出发,猜测百度如何判断文章质量。对于安装了百度统计的用户,百度可以根据跳出率、退出率、页面停留时间几个关键指标,很容易对网页质量加以判断。然而,对大部分没有安装百度统计的搜索用户,百度是不可能跟踪这些关键指标的,百度通过迂回战术从侧面分析关键词的匹配度,匹配度越高,表明文章质量度越高。百度如何通过搜索行为判断文章质量我以为,主要根据以下2点:
一、通过对搜索结果的二次点击率(或多次)进行判断
当用户点击某结果后,(因不满意结果)产生第二次点击(或多次)的比率如果某页面二次点击率非常低,百度搜索引擎有理由相信,此网页的关键词匹配度非常高,同时文章的质量也有保证。因为,众多用户的行为已经为网页投了关键的一票。
二次点击率是相对上一条点击而言。
百度搜索默认显示10条搜索结果,我们假设一个这样的情景:大量用户点击到第6条结果,就不再点击其他结果,从常理来说,第6条结果的网页,是最匹配的,那么质量度自然较高。如果这种数据表现达到一定程度,百度很可能会把它的排序提高到前面几位(提高排序权重)。