互联网技术 · 2024年2月15日

请务必及时清理历史sitemap文件

最近很多朋友都收到过“百度站长平台:请及时清理历史sitemap文件”的邮件了吧,不过这次比较特殊大部分人都是受到了信息,百度出算法都没有给我们发过短信,这个发了短信为什么?因为要清除我们这边的数据,怕误删,以此提醒,下面代代SEO就为大家详细讲下这个是什么意思,我们站长应该如何应对。

百度原文邮件提示:

尊敬的搜索合作伙伴:

您好!为了提升站点新资源的处理效率,避免旧数据过多造成站点数据抓取与处理异常,请于11月9日之前尽快删除超出站点配额的历史sitemap文件(包括普通收录与死链数据)。如到期未处理,系统将统一删除。感谢您的关注与支持!

这则消息主要表达的意思就是:如果你是一个老网站,在长周期运营的过程中,如果自己提交了大量的sitemap地图文件,超出了百度搜索资源匹配的给到的配额,我们最好合理性的选择去删除一部分,否则截止到规定时期,系统可能会自动从最早的开始删除。其中,代代提醒大家:核心目的主要是:节省网站匹配的数据提交资源,目的是希望站长把现有的配额分配到给网站有价值的目标URL。

什么是历史sitemap文件!

这个文件就是我们网站地图,提交到百度的站长平台去引导收录,这个是以前的收录方法,现在很少人在用这个技术,因为百度后来出了智能推送,自动推送,快速收录和普通API推送这类。所以sitemap,使用的人并不多,只不过之前很多人使用,使用后,一直存在在站长平台也没有删除。所以引发了百度的持续抓取,浪费抓取量,也会误判一些网站,值得注意的是,百度还提到配额问题,每个网站可以提交sitemap配额都是不同的,有的是10000,有的是10万,这个目前没有准确查询接口,不过可以通过普通提交配额可以进行估算。

什么是误判网站?

代代SEO举个例子,加入这个网站是5年前被人在运营的,上传提交了很多sitemap,然后一直在保留,等你接手以后哪,就直接运营了,内容被你改了,很多以前的内容都丢失了,但是站长平台还有很多以前的sitmap,索引数据,百度一样会去抓取,当百度识别里面的链接80%都是死链,无法访问的时候,很容易降低你当前站点的评分,从而引发降权,这个大家了解吧。

百度的用意!

这个我们不得不说,sitemap,很多人提交了以后,就不管了,其实sitemap是有一定生效周期的,如果抓取过了,就没有必要去持续提交了,如果我们的站长平台都保留大量的sitemap,百度会浪费很大一部分的抓取量,在抓取的时候很容易出异常,毕竟有很多链接是不存在的,所以会造成网站排名波动,或者百度数据库的异常情况,所以删除对我们站长,和百度都有好处,我也是比较支持百度这样去做。

最后代代SEO要说一下,如果你发现百度抓取率较低,你可以使用sitemap,或者网站层级比较多的情况下,但是提交一个月以后,如果百度那边提示抓取数量和你sitemap数量差不多的时候,就要删除,重新提交新的,这个是目前比较正确的做法,一般新站提交sitemap,或者层级超过3级别的网站提交的比较多,但是目前主流的做法是直接去用API提交每一条链接,效果会更加快速一些,好了,就讲解到这里吧。

文章来源:代代SEO博客

来源地址:https://www.daidaiseo.com/seoan/10930.html

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册