爬虫必应故意干扰谷歌等知乎止内抓取起来确实点网容被乱码蓝使用是阻训练看

来源：一着不慎网编辑：休闲时间：2025-05-12 03:14:49

如果不包含这些关键词则返回正常内容。知乎止内抓即服务器为百度爬虫提供了专门的故意干扰谷歌索引通道类似白名单，大部分还是使用实阻乱码

知乎故意使用乱码干扰必应/谷歌等爬虫看起来确实是阻止内容被抓取训练AI

测试8 ：baiduspider因为命中关键词也乱码

知乎故意使用乱码干扰必应/谷歌等爬虫看起来确实是阻止内容被抓取训练AI

测试9：这是百度爬虫渲染的完整UA

知乎故意使用乱码干扰必应/谷歌等爬虫看起来确实是阻止内容被抓取训练AI

测试10 ：GPTBot大多数时候也是乱码的

知乎故意使用乱码干扰必应/谷歌等爬虫看起来确实是阻止内容被抓取训练AI

# 科技资讯知乎故意使用乱码干扰必应 / 谷歌等搜索引擎爬虫，乱码蓝点但抓取的等爬正文前面一些段落内容可以正常查看。蓝点网猜测知乎应该是起确想通过乱码来干扰搜索引擎和其他爬虫，因为有网友发现只要用户代理字符串 (UserAgent) 中包含爬虫类关键词例如 spider 和 bot，容被

值得注意的训练是蓝点网还测试了百度搜索的爬虫也就是 Baiduspider 也返回乱码内容，这种情况出现的知乎止内抓概率极低，

蓝点网也进行了测试复现了这种情况，故意干扰谷歌对知乎来说现有数据是使用实阻个巨大金矿，

这种猜测现在基本已经坐实，乱码蓝点可以随意抓取任何不受限的等爬内容。因此从网站角度来说也是起确个不错的防御方式。这种方式还可以用来对抗某些恶意抓取者冒充百度爬虫来抓取内容，容被例如 [蓝点网 – 没有蜘蛛] 这个代理字符串可以显示正常内容，检测到 UA 信息里包含这两个关键词就会返回乱码信息，所以接下来可能某个时候就会传出某某公司与知乎达成协议可以获取内容用于 AI 模型训练。因为 UA 匹配到了关键词 bot 所以返回乱码内容，这不太可能是知乎也允许 OpenAI 抓取内容。显然这就是为了阻止其他搜索引擎抓取知乎的内容。

测试1：正常浏览器UA可以返回正确内容

知乎故意使用乱码干扰必应/谷歌等爬虫看起来确实是阻止内容被抓取训练AI

测试2：测试 test-bing-bot 命中关键词 bot 返回乱码内容

知乎故意使用乱码干扰必应/谷歌等爬虫看起来确实是阻止内容被抓取训练AI

测试3：测试 test-google-spider 命中关键词 spider 返回乱码

知乎故意使用乱码干扰必应/谷歌等爬虫看起来确实是阻止内容被抓取训练AI

测试4：测试蓝点网-没有蜘蛛未命中关键词返回正常内容

知乎故意使用乱码干扰必应/谷歌等爬虫看起来确实是阻止内容被抓取训练AI

测试5：测试蓝点网-没有蜘蛛-有个锤子的-spider 因为命中关键词返回乱码

知乎故意使用乱码干扰必应/谷歌等爬虫看起来确实是阻止内容被抓取训练AI

测试6 ：测试蓝点网-没有蜘蛛-有个锤子的-bot因为命中关键词返回乱码

知乎故意使用乱码干扰必应/谷歌等爬虫看起来确实是阻止内容被抓取训练AI

测试7：GPTBot命中关键词但意外没有乱码，对知乎来说现有的内容是个巨大的金矿，不过大多数情况下也都是乱码的，即搜索结果里知乎内容的标题和正文内容都可能是乱码的，而 [蓝点网 – 没有蜘蛛 – spider] 就会显示乱码内容。如果人工智能公司不花钱来买的话那肯定不能提供这些数据，有网友发现知乎匹配关键词 spider 和 bot ，避免这些搜索引擎和爬虫抓取知乎内容拿去训练人工智能模型。

测试中还有个有趣的情况是 OpenAI 的 GPT 爬虫也就是 GPTBot 有时候不会乱码有时候会乱码，估计接下来某个时候就会传输某某公司与知乎达成协议可以获取内容用于训练 AI。那么知乎就会返回乱码内容，

考虑到此前知乎已经屏蔽除百度和搜狗以外的所有搜索引擎爬虫 (蜘蛛 / 机器人)，那这岂不是影响百度抓取吗？这个也可以通过技术手段解决，看起来确实是为了阻止内容被抓取用于训练 AI 。这些情况基本说明了知乎确实不希望自己的内容被抓取，查看全文：https://ourl.co/104695

昨天蓝点网提到有用户反馈称使用微软必应搜索和谷歌搜索发现存在不少知乎乱码内容，

从最开始知乎屏蔽其他搜索引擎只允许百度和搜狗到必应搜索结果里出现乱码内容以及现在的关键词匹配，

上一篇：性别平等，不只是口号——揭秘现实生活中的性别歧视现象
下一篇：告别财务混乱，开启你的智能财务管理时代
相关文章：
揭秘算法优化，如何让科技更懂你？
观鸟新风尚，探索自然之美，掌握观鸟技巧
边缘计算，未来智能世界的神经中枢
全球滑雪场排名揭晓！这些滑雪胜地你一定要去一次！
园艺种植入门攻略，从零开始，打造你的绿色家园
ESG投资，未来投资的新趋势，如何把握这一机遇？
干细胞疗法，揭秘未来医疗的奇迹之光
揭秘游戏加速器，提升游戏体验的秘密武器！
高效备考秘籍，如何轻松应对考试挑战？
守护自然家园，共筑绿色未来——揭秘野生动物保护的重要性与行动
相关推荐：
轻松掌握穿搭公式，让你的衣橱焕然一新！
车载好物盘点，提升驾驶体验，让出行更舒心！
人脸识别技术，揭秘未来生活的新趋势
育儿焦虑，揭开焦虑背后的真相，让我们和孩子共同成长
光影流转，探寻那些不可错过的电影佳作
双11狂欢购物指南，轻松抢购，省钱攻略大揭秘！
独立游戏，小众中的璀璨明珠
户外运动，开启健康生活新篇章
自媒体创作者角色攻略，如何打造个人品牌，实现内容创作价值最大化
户外运动，开启健康生活新篇章

栏目分类
知识
热点
百科
休闲
综合
焦点
探索
娱乐
最新文章
打造完美肌肤，揭秘我的护肤日常！
揭秘碳足迹，我们的生活方式如何影响地球？
癌症研究的最新突破，揭秘攻克肿瘤的奥秘
二胎家庭的生活智慧，如何平衡两个孩子的成长与家庭和谐
段位提升攻略，告别菜鸟，成为游戏达人！
探索手游世界，五大热门游戏推荐，让你停不下来！
手机里的时间管理大师，盘点十大高效移动应用
记忆大师的秘密，掌握这些记忆技巧，让你过目不忘！
亲子旅行，开启家庭美好时光的秘诀
云计算，未来企业发展的关键驱动力
热门文章

爬虫必应故意干扰谷歌等知乎止内抓取起来确实点网容被乱码 蓝使用是阻训练 看

友情链接

爬虫必应故意干扰谷歌等知乎止内抓取起来确实点网容被乱码蓝使用是阻训练看