提高内页收录与排名的原理分析

来源:郑州黄雀SEO 作者:郑州SEO 点击数:

今天要放假了,郑州SEO黄雀要赶各种各样的场子。一晚上都要两三个,到家都十一点左右了。回家还要照顾孩子,还真没有时间写SEO方面的知识了!但对于SEO的思考黄雀SEO却从没有停滞过,等空闲了我一定将心中想的每一个点都详细的写出来,大家一起来讨论!今天的这篇文章是黄雀SEO前几个月写的。虽然现在比哪个时候更加成熟了,但哪个时候所思考的内容依然没有过时。我从中思考出的技巧依然还在用!内页快速排名是很多做流量站的梦想,今天将内页快速排名的原理讲一下,懂得原理了如何利用这就是技术操作层面的小技巧了!
网站的内页排名是黄雀SEO里谈论比较多的,今天黄雀本来想对前几日黄雀测试的内页权重利用友情链接传递的最新结果做再次分析,但无意中看到这篇文章,也是讲如何做内页排名的。子爵仔细品读了一下,讲的还是很有道理的。今天晚上也分享出来。和黄雀之前分享的关于内页的文章相互参考着阅读,相信你会对内页排名有一个全新系统的认识。

SEO内页快速排名技术

    在众多的SEO理念当中,或多或少的每一位SEO从业人员都有遇到一些优化中比较纠结的问题,而众多纠结的问题当中,收录一是很多SEO人员提到比较频繁的词汇。今天我们不讲外链,也不讲内链,我们讲收录与排名,老样子,继续用SEO案例给大家展示案例效果,如下图所示:

SEO实战干货:独家揭秘内页快速收录排名 SEO推广 第1张

SEO实战干货:独家揭秘内页快速收录排名 SEO推广 第2张

该站上线是2016年11月中旬,到文章截稿时间大约一周左右,从整体站点页面的收录速度以及排名中可以看得出,蜘蛛的抓取频率是非常快的。在给大家揭秘内页实战快速收录并且做到页面参与排名的方法以前,我必须的告诉大家两个点。

第一、该站点所有文章均为抄袭,任意一篇文章的内容上都出现了多次,打破了传统原创思维理念。

第二、这仅仅是一个刚上线的新站,并且没有使用任何所谓的蜘蛛池进行吸引蜘蛛。

那么就会有很多朋友会问,新站是如何做到快速收录并且可以建立部分页面参与排名的,这个话题是本文的研究核心。首先我不得不说一句,如果大家也遇到了收录问题,那么至少有一点你没有做好,那就是你一直在关于所谓的外链、内链、布局原创内容。忘记了一个核心的点,就是搜索引擎排名原理。

首先要想做好页面收录并且参与排名,我们要先思考下搜索引擎工作原理,当然,别小看这种最最基础的东西,你领悟了核心要点,那么操作收录起来就会变得游刃有余,如下图所示:

SEO实战干货:独家揭秘内页快速收录排名 SEO推广 第3张

通过百度百科的文档中我们可以看出,整个原理是从最初的爬行抓取>收录>建立索引>搜索词处理>排序,虽然才几个步骤,但是每个步骤都有他的核心要点。下面我将把整个核心要点给大家一一剖析。

一、爬行与抓取

首先我们要了解到搜索引擎蜘蛛要想爬行和抓取一个页面必须要满足两个特点,第一、足够的外链来吸引蜘蛛抓取;第二、网站的更新频率。在百度站长平台里面每个站点都会有一个抓取频次,而抓取频次我们可以特定的看作站点受蜘蛛的喜爱程度,也可以通俗的理解站点抓取频次越高,那么你站点被蜘蛛喜爱程度就会越高,从而你的收录就会加快。如果使用蜘蛛池这类程序的同学,我想就应该非常清楚,但是很多朋友即使使用了蜘蛛池那也只是外部链接进行吸引蜘蛛,如果配上站点更新频率,效果更佳!

二、收录与索引

大家都会通常的认为页面收录与页面建立索引并无太大区别,其实不然,在整个站点页面文档中会有两种情况发生:

1、URL收录=是,索引=否;代表已经进入了索引,只是这个网页的“权重”非常非常低,可以视作是“无效索引”。

2、URL收录=是,索引=是;代表已经有资格参与排名,但是不保证100%能获取排名,可以视作是“有效索引”。

我们可以简单的去理解site出来的站点页面是被收录的,但不代表site出来的页面是被索引的。但是我们依然可以去检测出页面是否具备参与排名的资格,如下图所示:

SEO实战干货:独家揭秘内页快速收录排名 SEO推广 第4张

Domain与Site最大的区别在于后者可以统计页面收录,而前者我们可以分析出站点外链域,而这里的作用我们并不是去讨论外链域,而是仅仅使用Domain命令来检测站点能够参与排名的有效数值。

其实大家可以用一种非常简单的方法去快速检测你的页面是否有参与排名的资格,如下图所示:

SEO实战干货:独家揭秘内页快速收录排名 SEO推广 第5张

SEO实战干货:独家揭秘内页快速收录排名 SEO推广 第6张

SEO实战干货:独家揭秘内页快速收录排名 SEO推广 第7张

上面三张图我们可以把site出来的收录页面进行搜索查询,可以检测到页面被收录,但是当你搜索整个标题却没有排名,也就是前面我提到过的url收录=是 但是url索引=否,说明网页“权重”较低,并没有参与排名,那么我们再来看几张图,如下图所示:

SEO实战干货:独家揭秘内页快速收录排名 SEO推广 第8张

SEO实战干货:独家揭秘内页快速收录排名 SEO推广 第9张

SEO实战干货:独家揭秘内页快速收录排名 SEO推广 第10张

从上图我们可以看得出,该页面不仅仅被收录,还建立了索引,并且搜索整个标题可以检索到排名。从这点我们可以看出,索引的页面无需做任何外链、内链、甚至是抄袭的文章即可有参与排名的资格。那么问题来了,该如何进行有效的页面进行建立索引并建立起参与排名的资格?

很多人在思考一个问题,文章要尽量原创,满足用户需求,提高用户体验等等。但是为何有些站点收录非常好,排名也非常不错,文章却是采集或者伪原创。讲到建立索引以前,我们继续先把剩下的一个工作原理分析完毕。

三、检索与排名

在整个检索与排名中,会体现出最常用的两个搜索引擎原理,一个就是倒排索引,另外一个就是TF-IDF算法,首先我们来了解下倒排索引的更新策略,如下图所示(来自百度百科-倒排索引):

SEO实战干货:独家揭秘内页快速收录排名 SEO推广 第11张

在整个倒排索引结构中,最常见的有四种更新策略,而上述的案例中就用到了其中两种,如果大家仔细的去观察我的每一个文章,就不难发现即使我的页面是纯抄袭文章,但是我抄袭的每一个标题和原来标题不相同,并且标题会更加的去符合页面内容,提升页面词频需求(TF-IDF)。其次则是抄袭的文章不会直接复制粘贴,我会进行重新排版,重构页面从而达到页面并非采集的作用。

在搜索引擎里面。有一个算法叫做TF-IDF算法,简单来说,TF-IDF算法(详细公式参考:http://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.html))是用来检索页面文档关键词出现的频次。并且可以通过该算法计算一个文件集合里面的词频出现的次数从而来评定一个页面的重要程度。而该重要程度是结合页面TITLE来计算,也就是大家常说的文章内容要符合页面标题的主题相关性(类似作文写作中的紧扣主题)。

看到这里,我相信很多朋友就会理解为何蜘蛛池程序可以快速提升收录并且有部分页面进行参与排名,很大的一个特点就是蜘蛛的频繁抓取,从而建立了索引,在短时间内让页面“权重”提升,并且促进排名,而新闻站点的原理也是因为蜘蛛抓取频繁的特点,几乎无需发布任何的外链即可有很好的排名。

现在我们再来分析和思考整个页面的抓取到最终的检索排名我一共操作了哪些:

第一、大量的不定时更新,让蜘蛛抓取频繁抓取(建议给百度提交站点地图,定时更新站点地图)

第二、大量采集文章通过修改标题与布局重构让页面变得更新有新鲜度(满足更符合页面的用户需求)

第三、每天保持大量的更新让蜘蛛抓取形成习惯

第四、由于该站是老域名,加上站点原始数据积累,可保持站点的权威度,从而相对新域名来说站点更加具备抓取优势。

总而言之,虽然最后只给大家留下了4点,当然也有很多SEO同学会觉得我说了一堆没用的,但是如何你真正的去领悟到我所提到的一些核心要点,那么你就不难发现SEO建立索引的奥妙所在,做SEO,思路决定出路,我更加建议seo同学们可以多去了解搜索引擎的一些基础算法和百度官方优化指南文档,如果能够把里面的任何一个核心点通过实战的方式去吃透他,那么比你看任何的所谓的SEO文章都要有价值!
很多人都觉得这篇文章有些深奥,几乎看不懂。子爵网赚结合自己的思考做下解释:
一、为什么大网站或者比较好的网站收录比较快?
        看到这个问题,很多人马上会说:因为大网站权重高,因为好的网站搜索引擎给予更高的信任!那我们再次思考,权重高、信任值高是通过什么来实现呢?
        一个很重要的因素就是搜索引擎蜘蛛的抓取量和抓取频率,而且是高质量的蜘蛛抓取频率。当一个网站经常被高质量蜘蛛反复抓取的时候,其页面被建立索引的概率就更高!这应该就是大网站、高质量站收录快的原因之一。
二、小网站、新网站如何才能实现大网站、好网站的效果呢?
        第一,关于这个问题,作者已经给出了一个答案。虽然子爵也没有验证过,但看起来还是有些道理的。这就是不定时更新、不断更新网站地图,使百度蜘蛛过来的时候能抓到新内容。这个方法可以试试,因为没有测试过,不保证有效。
        第二,可以建立蜘蛛池来引导蜘蛛频繁抓取。什么是蜘蛛池?蜘蛛池可以看作是利用程序不断给网站发的海量外链。其原理是通过程序建立大量的网站,并且网站的内容随机生成。搜索引擎因为有大量的内容需要抓取,所以就不断的拍蜘蛛前来抓取,来抓取的蜘蛛多了,就聚集了很多蜘蛛形成了蜘蛛池。如果这些海量页面上都有你网站的链接,那这些聚集的蜘蛛就会顺着链接爬向你的网站。因为蜘蛛非常多,而且是一直都非常多,所以页面就会被反复抓取,建立索引的机会更高。但需要注意的是,1、蜘蛛程序在抓取的时候,也会占用你的网站资源,对网站服务器造成一定的压力,特别是大量蜘蛛抓取的时候更是明显;2、网站质量不同、网站域名是否受信任等原因会影响蜘蛛池的蜘蛛质量,影响收录效果。
PS:如何有用一个蜘蛛池?
1、可以选择网上别人建立好的,选择一个差不多的租赁。有按条收费的,也有按天收费的,大概是一天50块钱的样子,如超级蜘蛛池
2、可以建立自己的蜘蛛池程序。可以在网上找一套差不多的蜘蛛池程序,找一些相对较老的域名,批量建立站点,并设置好蜘蛛池。这对技术要求有点高,并且需要一个性能还可以的服务器。
3、可以模拟蜘蛛池建立一个网站。我们知道,如果你的网站站点内容非常多,那就会有较多的蜘蛛过来抓取,那样就可以引导蜘蛛到目标网站上,实际上也形成了一个简单的蜘蛛池。具体可以做一个新闻类的站点或者一个小说类的站点,要一天到晚不停的采集更新,形成海量不间断的内容,吸引较多的蜘蛛抓取;另外,在每一个页面上都加上网站的网址链接,这样蜘蛛再去抓取每一个页面的时候都会爬向你的网站。但因为只有一个网站一个域名,且网站页面质量相对较低,所以基本无法实现链接投票,仅仅能不断提供蜘蛛。
通过建立蜘蛛池,使大量的优质蜘蛛不断的前来网站抓取。这样就形成了网站快速建立索引的外部条件,下面我们再来说下内部条件。
三、复制的文章如何获得收录和排名?
        谈论这个问题之前,我们先来看看前面所讲的索引知识,子爵先画出重点:
1、蜘蛛抓取的页面文件分解、分析,并以巨大表格的形式存入数据库,这个过程即是索引(index)在索引数据库中,网页文字内容,关键词出现的位置、字体、颜色、加粗、倾斜等相关信息都有相应记录。
2、完全重建策略。完全重建策略是一个相当直观的方法,当新增文档达到一定数量,将新增文档和原先的老文档进行合并,然后利用前述章节提到的建立索引的方式,对所有文档重新建立索引。新索引建立完成后,老的索引被遗弃释放,之后对用户查询的响应完全由新的索引负责。
3、合并文件策略。有新增文档进入搜索系统时,搜索系统在内存维护临时倒排索引来记录其信息,当新增文档达到一定数量,或者指定大小的内存被消耗完,则把临时索引和老文档的倒排索引进行合并,以生成新的索引。
子爵为什么要把这三点找出来呢?我们读书一定要细,因为字里行间都存在着搜索引擎的秘密。我们一条条来分析下:
(1)蜘蛛对抓取的页面进行分解,并对页面的文字内容、关键词位置颜色、字体等信息进行记录。也就是说搜索引擎会对页面上的所有这些细节信息都记录下来。你只要修改了这些中任何一点东西,你复制的文档就和原来的文档有差别。你修改的地方越多,差别就越大。这样在搜索引擎做文章重复性检验的时候就会对比这些差别。再排名的时候会将原封不动采集的首先PASS掉,给予更多改动的文档更多机会。
(2)完全重建策略。大多数网站的大多数页面都只能遵从的一个策略。这个策略也解释了为什么我们写的原创文章、质量度不低的文章为什么没有很快的获得收录和排名。因为完全重建策略需要一定的周期,你的文档知识信息只是被抓取入库了,需要等待文档到达一定数量后重新建立索引。
(3)合并文件策略。合并文件策略是在首先存在一个指定大小的内存上,当内存慢时再和老文档的倒排索引合并,生成新索引。合并文件策略比完全重建策略显示的更快。在合并文件策略中需要遍历老索引和“增量索引”,当出现新文档时,会将新文档排在老索引的倒排索引之后;当发现该文档已经存在于老索引之中,则放弃该文档,重新遍历新文档。
         在对文档进行比较的时候,根据第一点我们可知,文档的信息表上记录的信息非常丰富。只要信息表上的信息和老索引的信息有差别,就有机会进入倒排索引中,所以我们才强调一定要对复制的文档进行再次排版,如文字内容、关键词位置、颜色、字体等,增加文档的区别度;另外,并不是所有的文档都适用合并文件策略,只有那些大网站和高质量站点才会优先适用合并文件策略,这也是为什么那些网站收录更快的原因。(PS:大网站、高质量网站转载你内容的时候,并不是完全不变的复制采集,肯定做了相关的排版改动)
        通过上面的介绍,我想你应该也明白了,为什么有些人总是牛逼哄哄的说,根本不需要原创,我复制别人的文章,照样有收录有排名。关键点就是高质量站点以及对文档的改动。
       以上就是黄雀SEO之前写的文章,虽然有大段引用别人的内容。但是关于内页排名的思考却是我自己的!关于内页排名其实有一点是非常重要但我在文中却没有提及的,那就是评论型的内容。一篇文章写完了,如果能有很多不同IP的有价值评论,则更加凸显了这篇文章的价值。卢松松的网站为什么排名那么好?不仅仅是因为他的网站权重高,文章下面几十条相关的评论也是非常重要的方面。当然,我们的文章很少有人评论这也是事实,但我们可以自己想办法造出“相关评论”啊!而且我们“造”出的“相关评论”内容更加可控,不会有垃圾评论。且一篇文章评论的多了,也会引起别人的评论,这样人气会越聚越多,给网页带来更多的权重,形成良性发展!

99%的人还阅读了:
如何做好站内优化?
怎么优化自己的网站?(方法对了,网站排名自然好)
SEO是什么?(一句话明白SEO)

转载请注明:文章来源于郑州黄雀SEO http://www.zrd.cc/seoyouhua/50.html