Массовое извлечение структурированного контента с целых сайтов или разделов через Firecrawl: URLs, markdown, метаданные в одном запросе.

Firecrawl Crawl

Массовое извлечение контента со всего сайта или его раздела. Используйте, когда нужно обойти сайт, извлечь все страницы из раздела документации, или сказано «обойди», «получи все страницы», «извлеки всё из /docs».

Когда использовать

Нужен контент со многих страниц сайта (например, все /docs/)
Нужно извлечь целый раздел сайта
Шаг 4 в паттерне эскалации: search → scrape → map → crawl → interact

Быстрый старт

# Обход раздела docs
firecrawl crawl "<url>" --include-paths /docs --limit 50 --wait -o .firecrawl/crawl.json

# Полный обход с ограничением глубины
firecrawl crawl "<url>" --max-depth 3 --wait --progress -o .firecrawl/crawl.json

# Проверить статус запущенного crawl
firecrawl crawl <job-id>

Параметры

Параметр	Описание
`--wait`	Ждать завершения crawl перед возвратом
`--progress`	Показывать прогресс во время ожидания
`--limit <n>`	Максимальное число страниц для обхода
`--max-depth <n>`	Максимальная глубина следования по ссылкам
`--include-paths <paths>`	Обходить только URL, соответствующие этим путям
`--exclude-paths <paths>`	Пропускать URL, соответствующие этим путям
`--delay <ms>`	Задержка между запросами
`--max-concurrency <n>`	Максимальное число параллельных воркеров
`--pretty`	Красивый вывод JSON
`-o, --output <path>`	Путь к файлу вывода

Советы

Всегда используйте --wait, когда результаты нужны сразу. Без него crawl возвращает job ID для асинхронного опроса.
Используйте --include-paths для ограничения обхода — не обходите весь сайт, когда нужен только один раздел.
Crawl потребляет кредиты за каждую страницу. Проверьте firecrawl credit-usage перед большими обходами.

firecrawl-crawlмассовое извлечение сайтов

Установка

Firecrawl Crawl

Когда использовать

Быстрый старт

Параметры

Советы

Из того же репозитория