Crawler

概述

参考:

Web crawler(网络爬虫),大家习惯性简称 Crawler(爬虫)。Web crawler 是一种可以系统浏览互联网的机器人,通常都是被搜索引擎用来抓取网络资源做成搜索索引。

Crawler 与 Reverse engineeringBrowser 都紧密相连。

学习资料

Spider Box # 爬虫逆向资源整合的网站

B 站视频

实用工具

WebDriver # 自动控制浏览器

Easy Scrapper 浏览器插件

https://github.com/NanmiCoder/MediaCrawler

  • 小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫

https://github.com/unclecode/crawl4ai

  • Crawl4AI 简化了异步网络爬行和数据提取,使其可供大型语言模型 (LLM) 和 AI 应用程序使用。

最后修改 July 9, 2025: web browser automation (5225171b)