一个网站的页面内容,例如人物、事件、餐厅、产品、电影、软件、评论、不仅要给用户看,还要让搜索引擎可识别,而目前要让其知会特定内容含义,我们需要使用结构化数据,结构化数据也是为了方便搜索引擎识别特别页面内容而产生的,有特定的规范,有特定的格式。搜索引擎都支持标准的结构化数据,以便为用户提供更好的搜索体验。百度、谷歌、360都支持网站结构化数据的提交,结构化微数据可以让搜索引擎提供更丰富的搜索结果摘要展现,让搜索用户直接在搜索结果中看见你商品的重要信息
1、选择此网页为典型网址,作为百度学习提取结构化数据的起始网页。
我们若要告知百度网页哪部分内容代表软件名称,只要用右键划选百度浏览器,在弹出菜单中选择名称即可,其他信息采用类似的方式标注。其他结构化数据同样如此选择。页面右侧列出了描述软件信息的字段,希望将网页中有的信息都标注完整。有些右侧带重要标识,这些字段是出富摘要的必要字段,需特别关注。
2、此页面标注完成后,点继续标注进入创建网页集页面。
网页集是指一类相似页面的集合,通过网址模式来圈定。对于网址结构良好的网站来说,一个网址模式可以代表一类网页,此模式覆盖的网页,网页结构是类似的。百度将结合对你网站结构的理解,根据你标注的第一个页面,自动推荐一个模式。
3、接下来到验收百度学习成绩时候了大部分情况下,百度的学习是不错的。百度会根据网页集模式,随机抽样符合此模式的网页,并自动标注网页内容。你需要详细检查百度的数据标注,并给予反馈:如果随机抽样的网页,页面结构和首次标注的典型网页不一样,需点击忽略;如果有些字段,没有自动抽取出来,需要用鼠标划选标注;如果有些字段,自动标注的内容错了,需要删除,重新划选标注。
4、标注完成后,回到工具首页可以了解数据处理的状态和进度。
如果数据处理没问题,最终你的网站将获得类似下图的富摘要展现效果此工具目前处于邀请内测阶段,只支持软件类,之后逐步开放电影、游戏等类别。若要使用请发送邮件至zhanzhangpingtai@baidu.com申请权限。