网站搜索优化"物种起源"基于算法排名的爬取与建立索引
2021-01-09 22:31:00 来源:孝秦熊博客 评论:0 点击:
为了提供很好的效果,搜索引擎需要在网络搜索所有工共的页面,然后呈现给搜索用户,与他们相关的页面.
在孝秦熊博客看来,创建索引的关键是在于从网页的哪里开始爬取,所以孝秦熊建议应将新建的网站优先推送给,优质的搜索引擎平台.
索引的更新
网页在不断变化,为保证索引能实时动态更新,还需要添加上临时索引、已删除文档列表。
临时索引:内存中实时建立的倒排索引。
已删除文档列表:存储已删除文档的id,形成文档ID列表。
文档被更改时,原先文档放入删除队列,解析更改后的文档内容放入临时索引中,通过该方式满足实时性。用户输入query查询时从倒排索引和临时索引中获得结果,然后利用删除文档列表过滤形成最终搜索结果。
临时索引的更新策略:
1、完全重建:新增文档超过一定数量,对新老文档合并后重新建立索引。
2、再合并策略:新增文档超过一定数量,临时索引合并到老索引中。
3、原地更新策略:增量索引的倒排列表追加到老索引相应位置的末尾。
4、混合策略:将单词根据不同性质分类,不同类别单词采取不同的索引更新策略。
在孝秦熊看来:
.在网站上增加了客户交互模块,客户不仅可以吸引更多的流量到您的网站,努力提高网站的排名。
、新的Web内容和搜索引擎的要求设计的页面标题和页面描述,从主要考虑关键词,关注每一个搜索引擎的不同要求,关键字排列方式不同。
、搜索引擎优化网站的产品信息。
、网站发布到所有的搜索引擎,并选择适当的搜索引擎相关的网络站点(包括博客上发表的问题和答案等)。
、网站内容相关规定,内修改站页面之间的链接,不一定做站点内的各个页面之间的连通性。
、网站与网页的代码修改,代码适用于搜索引擎的要求简单而轻量级的Web内容。
、添加会每天进行更新或相关的网站内容,以保持网站的及时更新。
、网站进行修正和补充,产品信息等所需的文本。