N

公司新闻

EWS CENTER

怎么解决百度只收录新网站首页,不收录内页?


    现在的情况是网站页面在google上的收录正常,而在百度上只收录了首页,这个很容易解释,因为gg和baidu采用的是不同的算法,收录数肯定会有差异。那为什么百度不收录内页?我们可以先去看看网站访问日志,发现Googlebot(google蜘蛛爬虫)和BaiDuSpider(百度搜索引擎机器人)都是基本上每天都会来网站爬一次,也就是说百度蜘蛛并没有将网站抛弃,而是把站点列入了每天都要爬行的任务列表中。

    从上面的分析我们得出一个最恰当的原因就是,百度搜索引擎对一个新网站都有一个审核期,根据站长们的经验,这个审核期可长可短,一般短到7天,长到3个月都有可能。在审核期内,百度搜索引擎蜘蛛爬虫会抓取新网站适当的页面加入索引数据库,只是暂时不显示在搜索结果中罢了。一旦通过百度的新站审核期,瞬间将会有大量的网站内页被百度收录。所以如果新网站内页暂时没有被百度收录,也不用太担心,只要一直坚持做好每日更新等本职就OK了。除非你的网站存在下面的问题:

    1. 新网站优化过度:检查你的网站首页和内页是否优化过度,是否关键词密度过高,堆叠严重的问题,是否做了一些作弊手段。是否经常修改meta标签优化,如描述语description和网站标题title。新网站一般都存在这样的问题,就是早期会不断地调整标题和meta标签以提高用户和搜索引擎友好度,我的网站也是这样,一直在作相关的调整,百度搜索引擎对此是比较敏感的,所以最好在网站上线前,本地测试的时候就将这些优化工作做好,确定上线以后,忌一直修改。

    2. 网站重复页面问题:一方面百度搜索引擎(google也一样)会检查你的页面是否属于内容采集站,复制了大量的站外内容。如果有这样的问题,最好尽快在首页添加一些原创文章或者经过稍作修改的“伪原创”内容页面的链接。另外一方面是站内的重复页面问题,首先检查是否存在url网址规范化问题,另外检查你的网站内部两个不同页面的相似度是否过高,这也会引起搜索引擎的反感,尽量减少页面上的这种重复性内容,比如google在网站管理员指南中提到,页面底部大量的版权声明文字可以放到一个单独的页面中,页面底部只设置一个超级链接即可,这样就大大减少了重复页面相似度。不过搜索引擎技术越来越先进,蜘蛛爬虫能够应用对高相似度网页的消重技术进行内容索引(也就是搜索引擎算法中,机器人会将站内的多个页面进行分析比较,提取出内容一样的网页模板文字,然后将这些重复内容消去,对内容不一样的文章正文进行排名算法索引)。Google等在这方面的技术应用比较成熟,但考虑到其他搜索引擎,还是应当尽量减少重复文字。

    3. 链接:包括外部链接和网站内部链接;网站内部链接设置是否合理,检查网站是否存在死链接,最好能够提交网站地图sitemap给搜索引擎;外部链接,根据一些站长经验,在新网站的首页添加指向大站(如百度)的外部链接能够加快首页和内页被收录的数量。同时还要将自己的网站链接发到外部网站中去,增加自己网站高质量的外部链接。最好检查是否加入了垃圾链,应当避免。

    4. 其他原因:除了上面几个百度不收录内页的主要原因,还有其他各种各样的原因,比如你的网站主题是否合法,网站架构混乱,死链接过多,网站域名曾经被K,网站空间不稳定或者有不良记录,网站弹窗广告过多,存在木马等等…

    如果上面这些问题都解决了,那么就不怕百度不收录内页了,最后就耐心等待搜索引擎全面收录你的页面吧。


文章来源:http://www.18tr.com