ClaudeBot是什么蜘蛛?怎么频闭?
互联网 10
ClaudeBot 是由 Anthropic 运营的网络爬虫,用于下载其 LLM(大型语言模型)的训练数据,为 Claude 等 AI 产品提供支持。
根据行业标准,Anthropic 使用各种数据源进行模型开发,例如通过网络爬虫收集的来自互联网的公开数据。作为 Anthropic 构建安全可靠的前沿系统和推动负责任的人工智能开发领域的使命的一部分。
ClaudeBot 搜集收集数据的原则:
Anthropic 的数据收集应该是透明的。用户代理令牌 ClaudeBot 标识了 Anthropic 的通用网络爬虫。
Anthropic 的抓取不应具有 侵扰性 或 破坏性 。Anthropic 的目标是通过深思熟虑地考虑抓取相同域的速度并在适当的情况下尊重抓取延迟来将干扰降到最低。
robots.txt协议屏蔽规则:
User-agent: ClaudeBot
Disallow: /