通过之前的研究,相信大家也了解了一些seo的基本理论知识。今天,来自广州新川教育的seo庞红将继续为大家分析搜索引擎的工作原理,这对于加深对seo的理解非常重要。只有了解自己和敌人才能赢得每一场战斗。一些seo从业者总是把眼光放得很高,认为这些基本理论没有什么研究价值。他们梦想成天拿到seo的秘籍,让网站一夜成名。这是不切实际的,也是从本质上没有seo的。
搜索引擎蜘蛛,一个非常生动的名字。把互联网比作蜘蛛网,蜘蛛就是一种在网络上爬行的蜘蛛。搜索引擎蜘蛛通过链接地址搜索网页。它们从网站的某个页面(通常是主页)开始,读取网页的内容,在网页中找到其他链接地址,然后通过这些链接地址搜索下一个网页,这样它们就会继续分解,直到抓住网站的所有页面。如果把整个互联网当作一个网站,那么搜索引擎蜘蛛就会用这种方法抓取互联网上的所有网页。
搜索引擎蜘蛛可以根据内容的不同分为以下几类。
在搜索引擎分类部分,提出了全文搜索引擎从网站中提取信息来构建web数据库的概念。在搜索引擎中有两种自动信息收集功能。一种是定期搜索,即每隔一段时间(比如谷歌一般是28天),搜索引擎就会主动发送“蜘蛛”程序。搜索特定IP地址范围内的internet网站。一旦找到一个新网站,它将自动提取网站的信息和地址,加入自己的数据库。
二是提交网站搜索,即网站所有者主动向搜索引擎提交网站地址。它会在一定时间内(从2天到几个月)将“蜘蛛”程序发送到您的网站,扫描您的网站并将相关信息存储在数据库中供用户查询。随着搜索引擎索引规则的巨大变化,主动提交网站并不保证你的网站会进入搜索引擎数据库。的方法是获得更多的外部链接,这样搜索引擎就有更多的机会找到你,并自动包含你的网站。
当用户按关键字搜索信息时,搜索引擎将在数据库中搜索。如果你找到一个符合用户需求的网站,你可以使用一种特殊的算法——通常基于关键词的匹配度、位置、频率和链接质量——来计算每个页面的相关性和排名级别,然后根据相关性将这些链接按顺序返回给用户。这个引擎的特点是搜索范围大。
目录索引(Catalog Index)又称“分类检索”(classified retrieval),是互联网上个提供www资源查询的服务。它主要收集和整理互联网资源,根据所搜索网页的内容,将其网址分配到相关分类主题目录的不同类别中,形成类似图书馆目录的分类树结构索引。目录索引不需要输入任何文本,只要根据网站提供的主题对目录进行分类,通过层层点击即可访问。
虽然它具有搜索功能,但从严格意义上讲,它不能称为真正的搜索引擎,只是按目录分类的网站链接列表。用户可以根据分类目录找到所需的信息,而不必依赖关键字。