Anthropic的爬虫机器人无视网站反AI抓取政策遭吐槽

事件概述：
- Anthropic 的 ClaudeBot 网络爬虫频繁访问 iFixit 网站，涉嫌违反使用条款。
- iFixit CEO Kyle Wiens 表示，爬虫未经授权使用内容并占用开发资源，已采取措施限制爬虫访问。
相关反馈：
- Read the Docs 联合创始人 Eric Holscher 和 Freelancer.com CEO Matt Barrie 也报告了类似问题。
- Reddit 上几个月的帖子显示，Anthropic 的抓取活动增加，导致网站负担加重。
技术应对：
- iFixit 在 robots.txt 文件中添加 crawl-delay 扩展以限制爬虫访问频率。
- Linux Mint 网页论坛在今年4月因 ClaudeBot 抓取活动发生站点故障。
行业现象：
- AI 公司如 OpenAI 通常通过 robots.txt 文件拒绝爬虫访问，但该方法缺乏灵活性。
- Perplexity 公司被发现完全忽略 robots.txt 排除规则。
保护数据行动：
- 多家公司通过修改 robots.txt 文件尝试保护数据不被用于 AI 训练。
- Reddit 最近也在打击网络爬虫方面采取了行动。

近期新闻