梅塔启动了Meta外部代理,一个绕过Robots.txt的网络爬虫来收集数据.
Meta 发布了一款名为 Meta External Agent 的新网络爬虫,用于从互联网收集数据,特别是来自新闻文章和在线讨论等公开展示内容的数据。 该爬行者收集Meta的AI模型的数据,绕过依靠机器人文件的标准网站保护措施。 这一举动表明,Meta致力于培训和改进其AI模式。
August 21, 2024
6 文章
Meta 发布了一款名为 Meta External Agent 的新网络爬虫,用于从互联网收集数据,特别是来自新闻文章和在线讨论等公开展示内容的数据。 该爬行者收集Meta的AI模型的数据,绕过依靠机器人文件的标准网站保护措施。 这一举动表明,Meta致力于培训和改进其AI模式。