保时捷梅雨季停地下车库半月发霉了,车主自嘲不想要了
2024-07-07 07:15:24
一键禁用 AI 模型爬虫机器人,Cloudflare 推出防火墙服务
IT 之家 7 月 5 日消息,网络服务商 Cloudflare 近日推出一款名为 "Bot Fight Mode" 的防火墙工具,站长们可以在控制台开启相关服务,从而防止自己网站的内容被用于训练 AI 的机器人爬虫扒取。
IT 之家注:爬虫是一种自动化的程序,可以在互联网上搜索和获取信息,目前许多厂商使用相关爬虫扒取各大网站信息用于训练 AI 模型,相关爬虫容易导致被扒网站产生大量异常流量,为此站长需支付高昂的网络带宽费用,同时也容易导致网站上大量原创 / 隐私内容泄露。
据悉,Cloudflare 推出的相关工具主要利用签名比对、启发式算法、机器学习和行为分析技术来辨别爬虫,站长还可以按照需要放行 " 好的 AI 机器人 " 抓取信息(此类 " 好的 AI 机器人 " 主要寻找网站的 robots.txt 来获取信息,通常不会对网站本身产生异常流量,也不会将网页所有数据直接用于全盘训练模型)。
互联网为许多大语言模型(如 OpenAI 的 GPT 模型和谷歌的 Bard)提供了大部分的训练数据,如今许多厂商为了刷自家 AI 模型分数,大肆通过网络爬虫 " 拿来式 " 地获取训练数据,从而让本应你情我愿的行为变得 " 污名化 ",各大网络商直接推出此类禁用 AI 爬虫的服务也在意料之中。
2024-07-07 07:15:24
2024-07-07 07:13:08
2024-07-07 07:10:52
2024-07-07 07:08:36
2024-07-06 10:19:11
2024-07-06 10:16:55
2024-07-06 10:14:39
2024-07-06 10:12:23
2024-07-06 10:10:07
2024-07-06 10:07:51
2024-07-06 10:05:35
2024-07-06 10:03:19
2024-07-06 10:01:03
2024-07-06 09:58:47
2024-07-05 07:43:11
2024-07-05 07:40:55
2024-07-05 07:38:39
2024-07-05 07:36:22
2024-07-05 07:34:06
2024-07-05 07:31:50