一:GSA是什么
Google Search Appliance(简称:GSA)是由Google公司出品的一种机架设备。 Search Appliance 随附的Google 软件安装于功能强大的硬件上,不需要进行一连串复杂的软件配置过程,就可以部署。
二:GSA的用途
1.提供文件索引功能
可以集成到企业内部,文件管理系统或网站上使用类似谷歌搜索的界面提供給终端用户检索。说简单一点就是为企业提供一个类似谷歌的小型搜索引擎。网上有不少山寨搜索引擎,就是使用GSA来抓取内容,再编写代码呈现搜索结果!你还在为他们的强大而感叹的时候,我很高兴的告诉你,用GSA也可以办到!
2. 搜索引擎人员的模拟抓取工具
谷歌百度这类搜索引擎可能会收录索引您网站的部分网页,如果您要尽可能多的收录,您就得利用GSA来找出没被收录的原因。您还可以用它检测出您网站上的404,500错误页面,GSA就是一个测试工具,根据抓取的结果,您可以对您的网站做出相应的修改,对新手SEOER有很大帮助!
三:虚拟机版本的GSA
是一种机架设备,根据相关法律,大陆是无法购买该设备的,好在有为我们提供仿真式的虚拟机版本。1.GSA 虚拟版下载
谷歌提供的虚拟机下载地址:http://dl.google.com/vgsa/vgsa_20081028.7文件为7-Zip格式,需安装7Z软件(7-zip是压缩比最高的压缩软件),将里面的文件解压到硬盘目录,并在虚拟机中选择打开。
2.配置GSA虚拟机
GSA 采用Linux+Python架构,进入后只允许我们对网络和时区进行配置,抓取,索引等其他操作是在Admin HomePage(管理后台)进行的,Search Home Page 是一个供你搜索抓取到的网页的一个入口。配置的一些经验:
1.网络都选NAT
2.IP设置选择DHCP,自动获取