狗哥SEO作者

26 文章

3 评论

18 问题

3 回答

0 粉丝

做网站、做搜索引擎关键词排名、做SEO～

【详细教程】网站的robots.txt怎么写？不会写你还不会抄吗？

狗哥SEO • 2025年 7月 27日上午9:01 • 站长 • 476 次阅读

robots.txt是指导各种爬虫是否允许爬取的一个信号，就是大多数爬虫是遵守这个规则的，里面写了不让它爬，他就不会爬了，当然了也有很多爬虫是不遵守规则的，不重要，一般小爬虫才不遵守规则。

我先教你们怎么写robots.txt文件，再教你们抄

先看两个写法例子：

User-agent: Baiduspider
Allow: /

User-agent:Baiduspider
Disallow:/

这两个都是写百度蜘蛛的，一个是从哔哩哔哩里复制的，另一个是从小红书里复制的，他们一个允许百度爬，一个不允许百度爬。

其中User-agent:后跟的就是你需要允许或禁止的爬虫，允许的话下一行就写就Allow: /，不允许下一行就写Disallow:/，Allow和Disallow就是英文允许和不允许的意思。

上面这样写是允许或不允许爬取网站的所有目录（地址），如果你指定不允许某个目录，也是可以的。

一般来说，禁止某个目录，这个目录一般是后台地址，所有蜘蛛都不允许爬的，假设后台地址是/admin，那么我们就这样写：

User-agent: *
Disallow:/admin/

其中*是通配符，所有蜘蛛都要看这条，如果你不允许的是某个文件而不是目录，假设是admin.php，那么就这样写：

User-agent: *
Disallow:/admin.php

User-agent:有指定某个蜘蛛的优先级高于*通配符，也就是允许和不允许可以同时存在，例如我只想让百度爬，其它蜘蛛全都禁止，那么这样写：

User-agent: Baiduspider
Allow: /

User-agent: *
Disallow: /

这个是哔哩哔哩的写法，所以你不用质疑它真实性，这样写就是能达到只允许百度爬的效果。

好了，学会了怎么写，下面教你怎么抄

抄就简单了啊，我们知道robots.txt文件都是放在根目录的，所以直接网址后加/robots.txt就能看到了，比如看哔哩哔哩的：

https://www.bilibili.com/robots.txt

太长了我就不复制过来了，它是禁止所有蜘蛛爬重要地址，然后允许一些搜索引擎的爬虫，最后在禁止其它所有爬虫，你想要相同效果，可以复制它的，最上面三行不要，或者改成你自己不允许所有爬虫爬的重要地址。

然后我们在看看小红书的，地址是：

https://www.xiaohongshu.com/robots.txt

这就简单多了，禁止所有爬虫爬，它先强调了禁止百度、搜狗、Google这些搜索引擎的蜘蛛爬，最后用通配符禁止所有爬虫爬，平台足够大，不需要搜索引擎作为入口，是可以这样写的。

各种版本robots.txt下载

怕麻烦不想写，可以下载现成的，有通用版和WordPress各种版本（默认禁止所有AI爬）：

各种robots.txt版本下载，通用版直接用，再详细教你网站的robots.txt文件怎么写

本文来自投稿，不代表首晒立场，如若转载，请注明出处：https://www.shoushai.com/p/1612

robots.txt 爬虫站长网站蜘蛛

喜欢 (1)

0 0

发表回复

登录后才能评论

2025年做什么语言的网站比较容易获得Google流量更容易赚钱？

在2025年，网站语言的选择需要结合目标市场、用户需求以及Google算法的趋势来综合判断。以下是关键分析及建议： 1. 英语：全球覆盖与高商业价值优势：英语仍是全球最主流的互联…

创客时代
站长 2025年 2月 10日
439000
为什么不建议再用百度搜索引擎？站长:是它先动的手！

先说一下，这事确实是百度先动的手！为什么百度现在这么难用？先来简单说下搜索引擎原理吧！比如某个页面有标题，是一篇文章，文章里面还有图片啥的，百度就会用自己的程序去爬这些网站，保…

首晒网
站长 2024年 4月 8日
568001
互联网上大家都喜欢浏览哪些类型的网站或软件？

互联网上人们喜欢浏览的网站类型非常多样，这取决于个人的兴趣和需求。以下是一些常见的网站类型：以上只是一部分常见的网站类型，实际上互联网上的网站类型千变万化，满足了人们在生活中的各…

首晒网
站长 2024年 5月 3日
362000
做网站还能赚钱吗？站长应该选择做英文网站

国外的搜索引擎，在国内能够使用的选择基本上只有Bing（必应），这是微软旗下的搜索引擎，大家不要小看它，流量虽然没有百度多，但是它自己产品少，收录网站多……

老站长
站长 2024年 11月 13日
406001
亚马逊爬虫Amazonbot根本无法使用iptables屏蔽IP段，太多了！

关于网友分享的被爬虫攻击，屏蔽IP段的方法，这篇文章里（https://www.shoushai.com/p/983）讲了两个蜘蛛爬虫，一个Facebook确实可以使用iptabl…

程序花园
后端 2025年 1月 18日
628000
网站模板中js文件疑似有跳转代码，怎么找到他？

要找到网站模板中疑似包含跳转代码的JavaScript文件，可以按照以下步骤逐步排查： 1. 全局搜索关键跳转函数在项目目录中，用代码编辑器（如VSCode）全局搜索以下常见跳转…

七哥建站
站长 2025年 7月 12日
612001
2024年百度搜索引擎SEO怎么做？

话说现在搜索引擎都已经非常智能了，没必要设置TKD做SEO优化，你的描述写的不好，搜索引擎直接引用你文章其它内容的！新网站怎么做百度收录？这么来说吧，百度现在基本上只喜欢老网站…

首晒网
IT技术 2024年 4月 21日
367000
都2024年了，现在发外链还能给网站增加权重吗？

现在发外链是否还有效果？还能够给网页增加权重，增加关键词搜索排名吗？还能够帮助网页快速收录吗？外链，或者称为回链，在搜索引擎优化（SEO）中扮演着比较重要的角色。它们被搜索引擎用…

首晒网
站长 2024年 7月 16日
416000
哪里买服务器便宜？阿里云腾讯云99元/年，华为云：都别玩了，38元/年！
这几年做网站服务器的成本是越来越低了，原因也就是各大服务器厂商在争抢用户。早期只有阿里云一家独大，其他服务商对它威胁不大，随着腾讯云、华为云的加入，服务器的价格是越来越低！可能…

首晒网
2024年 5月 1日 • 站长
502000
站长

不得了，关键词前十全是.cn域名，到底.cn和.com哪个域名后缀百度权重更高？

今天在爱站首页看到一个有意思的现象，百度关键词波动排行榜，不管是上升还是下降，全都是.cn域名做的网站，没有一个是.com，这就不得不让我怀疑，百度是要偏向.cn域名提高权重了。 …

七哥建站
2025年 6月 17日
228001
网站禁止js跳转非本站域名代码及部署教程

网站被挂马了，经常会跳转到其它网站，如果你也找不到导致恶意跳转的源代码，那么不妨试试直接加一个禁止跳转到其它恶意网站的代码。防跳转文件下载：https://pan.quark.c…

七哥建站
站长 2025年 7月 20日
549001
20个网站流量变现的方法和操作流程

网站流量变现是指通过将网站的访问量转化为经济收益的过程。以下是一些常见的网站流量变现方法：综上，网站流量变现的方法多种多样，关键在于找到适合自己网站内容和用户群体的变现途径。同时…

首晒网
站长 2024年 4月 28日
1.2K000
Snoopy.class.php爬虫抓取https链接第二层出错基础URL重复补全解决方法

最近在研究网页爬虫程序，选择了Snoopy这个爬虫，但是在抓取https的链接第二层链接时（即首页上的超级链接），抓取的链接出现以下错误，例：正确链接是https://www.ba…

七哥建站
后端 2025年 8月 30日
172000
Zblog恢复数据库Incorrect key file for table ‘zb_xxx‘; try to repair it解决方法

通过.sdi、.MYI、.MYD文件恢复数据库的方法就是直接创建个相同字段的表，复制文件替换进去即可。为了更简单，我个人更喜欢重新安装一遍代替创建表，作用是相同的。这边以Z-b…

首晒网
IT技术 2024年 6月 15日
323000
GitHub开源PHP源码调用DeepSeek搭建一个自己的AI网站教程

以下是基于GitHub开源项目搭建AI网站并集成DeepSeek API的完整指南，结合搜索结果中的关键信息进行技术整合：一、环境准备与框架选择技术栈选择前端框架：React…

AI先驱
AI 2025年 2月 13日
1.1K002
WordPress防AI爬虫的robots.txt正确写法

因为我自己网站是真的被Facebook爬虫和Amazonbot这两个狗东西爬崩溃过，所以我给每个WordPress都加上了robots.txt这个文件。大家可以去了解以下每个爬虫…

有点咸
后端 2025年 1月 17日
471000
做什么类型的网站流量高？分类目录是我做了这么久获得权重和流量最简单的网站

对于要做网站的个人站长来说，可能会觉得能够获得流量，获得关键词权重排名是最重要的一点，但是我告诉你，这只是开始。一旦你完成了这一步，最重要的问题就变成了流量变现。俗话说得好，选择…

七哥建站
站长 2025年 4月 12日
449002
为什么同一套网站模板，不同域名有的网站不收录，有的收录很多？

以下是影响网站收录的一些因素：综上所述，即使是同一套网站模板，不同域名的网站收录情况也会因为上述因素的不同而有所差异。为了提高网站的收录率，建议关注以上提到的各个方面，进行针对性…

首晒网
站长 2024年 5月 14日
423001

【详细教程】网站的robots.txt怎么写？不会写你还不会抄吗？

我先教你们怎么写robots.txt文件，再教你们抄

好了，学会了怎么写，下面教你怎么抄

各种版本robots.txt下载

发表回复

猜你喜欢