Массовое извлечение структурированного контента с целых сайтов или разделов через Firecrawl: URLs, markdown, метаданные в одном запросе.
npx -y skills add firecrawl/cli --skill firecrawl-crawl --agent claude-codeМассовое извлечение контента со всего сайта или его раздела. Используйте, когда нужно обойти сайт, извлечь все страницы из раздела документации, или сказано «обойди», «получи все страницы», «извлеки всё из /docs».
/docs/)# Обход раздела docs
firecrawl crawl "<url>" --include-paths /docs --limit 50 --wait -o .firecrawl/crawl.json
# Полный обход с ограничением глубины
firecrawl crawl "<url>" --max-depth 3 --wait --progress -o .firecrawl/crawl.json
# Проверить статус запущенного crawl
firecrawl crawl <job-id>
| Параметр | Описание |
|---|---|
--wait | Ждать завершения crawl перед возвратом |
--progress | Показывать прогресс во время ожидания |
--limit <n> | Максимальное число страниц для обхода |
--max-depth <n> | Максимальная глубина следования по ссылкам |
--include-paths <paths> | Обходить только URL, соответствующие этим путям |
--exclude-paths <paths> | Пропускать URL, соответствующие этим путям |
--delay <ms> | Задержка между запросами |
--max-concurrency <n> | Максимальное число параллельных воркеров |
--pretty | Красивый вывод JSON |
-o, --output <path> | Путь к файлу вывода |
--wait, когда результаты нужны сразу. Без него crawl возвращает job ID для асинхронного опроса.--include-paths для ограничения обхода — не обходите весь сайт, когда нужен только один раздел.firecrawl credit-usage перед большими обходами.