360搜索蜘蛛不遵守robots.txt协议规则，小网站不爬，大网站禁了还要收录！

有点咸 • 2025年 1月 17日下午10:18 • 站长 • 406 次阅读

360搜索不收录网站，很多站长都是经历过的，其实就是人家看不上小网站，去360社区提交是没有什么用的，不要浪费那个时间，多花点时间给自己网站多搞点内容，慢慢的收录就会好起来。

而面对大网站，360是压根不管你的robots.txt协议，像是知乎，只允许了几个搜索引擎抓取，360蜘蛛和其它都是被禁止抓取的，但是用site:查知乎收录，有很多。

小红书也是一样的，小红书的robots.txt文件现在是禁止所有搜索引擎抓的，其它搜索引擎很守规矩，360搜索就还有几百个收录不删干净，感觉它的数据库很乱没法控制似的。

360搜索的蜘蛛，即360Spider，在早期确实存在不遵守robots.txt规则的情况。这个问题在2012年至2016年间引发了广泛的讨论和争议，特别是与百度之间的“3B大战”，期间360被指控违反了Robots协议，强行抓取百度的数据和其他网站上的内容，这违背了行业规范并可能涉及侵权行为。

Robots协议（也称为Robots Exclusion Protocol或REP）是一个用于告知搜索引擎哪些页面可以被抓取、哪些不可以的标准。它不是法律要求，而是互联网业界普遍接受的一种惯例。尽管如此，大多数搜索引擎都尊重这一协议，并按照网站管理员通过robots.txt文件所设定的规则进行抓取活动。

关于360Spider不遵守robots.txt的问题，有几点需要注意：

行业惯例：虽然Robots协议不是强制性的法律法规，但它已经被视为一种行业标准。当一个搜索引擎选择忽视这些规则时，可能会引发其他网站管理员和服务提供商的不满，因为它可能导致隐私泄露、服务器负载增加等问题。
法律观点：如上述信息中提到的，多位法律专家认为360的行为涉嫌侵犯著作权、法人数据库以及构成不正当竞争等违法行为。如果内容源网站明确指定了不允许某些特定搜索引擎抓取其内容，而该搜索引擎仍然进行了抓取，则可能会面临法律责任。
技术手段：一些网站报告称，即使他们设置了robots.txt来限制360Spider，但360依旧会抓取那些不应该被访问的内容。此外，还有报道指出360可能使用了隐蔽的技术手段绕过了部分网站设置的保护措施。
官方立场：360方面则声称自己一直遵循各网站通过Robots协议做出的提示，并强调Robots协议并非行业规范，也不具备法律约束力。不过，这种说法并没有得到广泛认同。
后续发展：随着时间推移，尤其是在面对来自同行和公众的压力下，360可能已经调整了其做法以更好地遵守Robots协议。然而，具体的改变程度以及是否完全符合行业标准仍需进一步观察。

综上所述，360Spider曾经有过不遵守robots.txt规则的行为，这引发了行业内对搜索引擎道德底线和技术伦理的关注。对于网站所有者来说，确保自己的robots.txt文件正确配置是非常重要的，同时也可以考虑采取额外的安全措施来保护敏感数据免受未经授权的访问。如果你遇到类似问题，建议直接联系相关搜索引擎的支持团队，或者根据需要寻求法律咨询。

本文来自投稿，不代表首晒立场，如若转载，请注明出处：https://www.shoushai.com/p/986

喜欢 (0)

0 0

发表回复

登录后才能评论

我发现Bing对敏感内容是一点都不收录！

观察几个Bing（必应）收录比较好的网站，其实总的来说，必应对网站收录已经很友好了，新网站收录快，而且内容好的也很快给排名！但是，如果你发擦边内容，你会发现，它的上一篇文章和下一…

狗哥SEO
站长 2024年 12月 14日
593000
WordPress经常被黑客在目录中增加文件或修改文件内容，如何防护？

为防止黑客在 WordPress 目录中增加或修改文件内容，可从加强访问权限控制、保持软件更新、提升文件安全性等方面入手，具体防护方法如下：限制目录访问权限：在.htaccess…

七哥建站
站长 2025年 7月 6日
595000
2024年10月最新搜索引擎市场份额报告，百度真的快要没人用了吗！

据统计，国内搜索引擎市场，微软的Bing占据电脑端超过50%的份额，而在手机端也超过30%，百度正在一步一步毁了自己！

程序花园
互联网 2024年 11月 27日
11.4K015
为什么同一套网站模板，不同域名有的网站不收录，有的收录很多？

以下是影响网站收录的一些因素：综上所述，即使是同一套网站模板，不同域名的网站收录情况也会因为上述因素的不同而有所差异。为了提高网站的收录率，建议关注以上提到的各个方面，进行针对性…

首晒网
站长 2024年 5月 14日
438001
做网站还能赚钱吗？站长应该选择做英文网站

国外的搜索引擎，在国内能够使用的选择基本上只有Bing（必应），这是微软旗下的搜索引擎，大家不要小看它，流量虽然没有百度多，但是它自己产品少，收录网站多……

老站长
站长 2024年 11月 13日
423001
手机浏览器有时候首次访问网站会跳转到别的网站，怎么找到这个跳转的代码？

手机浏览器访问网站时发生意外跳转，通常由恶意重定向代码触发。这类代码可能隐藏在前端脚本、后端逻辑或第三方资源中。要定位这些代码，需结合技术分析和排查工具，以下是系统化的解决方案： …

七哥建站
站长 2025年 7月 12日
596000
前端

WordPress更换网站域名后不显示图片解决方法，那是因为数据库里还没更新

这个确实是可以的，但是还是比较耗费时间我觉得，之前我是这样换的，但是这次我没有这样去换，而是使用插件。

这个插件叫“Go Live Update Urls”，一个免费插件，非常好用，直接查找数据库里的字段进行替换……

首晒网
2024年 11月 7日
817002
百度没人用了吗？为什么关键词多流量那么少？

百度作为中国最大的搜索引擎之一，尽管在市场中占有一席之地，但流量的变化可能受到多种因素的影响。以下是可能导致百度流量减少的一些原因：总的来说，百度的流量减少可能是由于上述因素的综…

首晒网
站长 2024年 5月 11日
650000
2024年百度搜索引擎SEO怎么做？

话说现在搜索引擎都已经非常智能了，没必要设置TKD做SEO优化，你的描述写的不好，搜索引擎直接引用你文章其它内容的！新网站怎么做百度收录？这么来说吧，百度现在基本上只喜欢老网站…

首晒网
IT技术 2024年 4月 21日
376000
做网站想赚钱不要把重心放在美化模板上，最重要的永远是内容！

内容是网站成功的最关键因素。一个网站的内容质量直接影响到用户的体验、停留时间和回访率，进而影响网站的搜索引擎排名和商业价值。以下是一些关于网站内容的重要性的几个方面：

创客时代
互联网 2024年 11月 5日
273000
站长

不得了，关键词前十全是.cn域名，到底.cn和.com哪个域名后缀百度权重更高？

今天在爱站首页看到一个有意思的现象，百度关键词波动排行榜，不管是上升还是下降，全都是.cn域名做的网站，没有一个是.com，这就不得不让我怀疑，百度是要偏向.cn域名提高权重了。 …

七哥建站
2025年 6月 17日
238001
WordPress仿什么值得买主题SMZDM导致服务器CUP占用率100%的解决方法

导致服务器CUP占用率过高的可能性有很多，正常来说，你的网站被DDOS攻击了，或者是CC攻击，都会占用你服务器线程，导致你的CUP长期占用率高达100%，甚至直接宕机。但是还有一…

七哥建站
站长 2025年 7月 16日
555000
做网站哪些CMS源码好用？

在选择网站源码时，需要考虑多个方面以确保所选程序的适用性、安全性和可维护性。下面将推荐一些好用的网站源码：此外，在选择网站源码时，还需要注意以下几点：总的来说，不同的网站源码各…

首晒网
站长 2024年 5月 28日
508000
WordPress防AI爬虫的robots.txt正确写法

因为我自己网站是真的被Facebook爬虫和Amazonbot这两个狗东西爬崩溃过，所以我给每个WordPress都加上了robots.txt这个文件。大家可以去了解以下每个爬虫…

有点咸
后端 2025年 1月 17日
492000
都2024年了，现在发外链还能给网站增加权重吗？

现在发外链是否还有效果？还能够给网页增加权重，增加关键词搜索排名吗？还能够帮助网页快速收录吗？外链，或者称为回链，在搜索引擎优化（SEO）中扮演着比较重要的角色。它们被搜索引擎用…

首晒网
站长 2024年 7月 16日
426000
为什么我不建议新手站长选择做视频网站，来看看一个10万个4M短视频的网站每个月要多少钱

要搭建一个拥有 10 万个 4M 视频的短视频网站，服务器配置和成本需从存储、带宽、计算资源等多维度评估：一、存储需求 10 万个 4M 视频总容量为 400GB，建议采用分层存…

七哥建站
站长 2025年 7月 6日
583000
GitHub开源PHP源码调用DeepSeek搭建一个自己的AI网站教程

以下是基于GitHub开源项目搭建AI网站并集成DeepSeek API的完整指南，结合搜索结果中的关键信息进行技术整合：一、环境准备与框架选择技术栈选择前端框架：React…

AI先驱
AI 2025年 2月 13日
1.1K002
亚马逊爬虫Amazonbot根本无法使用iptables屏蔽IP段，太多了！

关于网友分享的被爬虫攻击，屏蔽IP段的方法，这篇文章里（https://www.shoushai.com/p/983）讲了两个蜘蛛爬虫，一个Facebook确实可以使用iptabl…

程序花园
后端 2025年 1月 18日
651000

360搜索蜘蛛不遵守robots.txt协议规则，小网站不爬，大网站禁了还要收录！

发表回复

猜你喜欢