近,elischwartz,一个外国的seo从业者,分享了他使用Splunk的经验。以下是elischwarz(“我”)分享的经验:
想必,每一位对seo技术感兴趣的站长都希望从更深层次上了解谷歌搜索引擎的网站结构和排名规则。从我多年学习seo技术的经验来看,深入分析网站访问日志可以帮助我更好地了解搜索引擎是如何“浏览”网站的,在很多网站分析工具中,Splunk无疑是让我放心和实用的一个。
注:Splunk是机器数据的引擎。可用于收集、索引和利用由所有应用程序、服务器和设备(物理、虚拟和云中)生成的快速移动的计算机数据。
监控网站URL是否被Google crawler捕获(Baidu spider和Yahoo crawler也可以被监控)
当网站生成新页面时,网站管理员关心的是页面包含问题。如果将快照作为一个指示器,则可能是Google crawler抓取快照以确定它是否包含在内的几天(甚至几周)之后。如果你想快点,可以直接在搜索引擎中搜索相关页面的标题。
有效的方法是检查网站日志,以确定该网页是否已被谷歌抓取。是时候用Splunk了。
具体步骤:
一、首先,选择要查询的时间段。时间越短,响应速度越快,所以查询的时差应该尽量缩短。
二 、在查询框中输入以下查询语句:
Index={thenameofyournindex}urlstub和googlebot
404页是一件很烦人的事情。98%的访问者在看到404页时会直接关闭页面。这样,你的网站不仅几乎失去了内容或产品的展示,用户还在心里默默地给你一个不好的评价。你:你稍后会来我们的网站吗?用户:哈哈。
对于404页,您可以选择使用screeningfrom等工具查找修复。但如果无效页面太多,则应分析事实日志。通过日志解析,可以找到大多数人访问的404个页面,并选择修复页面或跳转。
设置Splunk以查找404页:
一、首先,选择搜索时差。我通常把它设为30天。你可以随意设置。
二、在查询框中输入以下查询语句:
Index={thenameofyourindex}状态=404 | toplimit=50uri
这个限度可以由你自己决定。我更喜欢设置为50个网址。执行完查询语句后,单击statistics以查找列表中访问者多的404页。
与301跳转不同,302跳转属于临时重定向。然而,在许多链路值测试中,302可以通过测试,并且有排名。但因为几年前,很多黑帽seo通过这种技术获得排名,现在很多搜索引擎都加大了对它的攻击。因此,302跳转只能用于那些只需要执行临时跳转的页面。