Полная настройка запуска LLM на AKS: проверка кластера, установка AI Runway оператора, деплой моделей и конфигурация inference endpoints.
npx -y skills add microsoft/azure-skills --skill airunway-aks-setup --agent claude-codeЭтот скилл проведёт пользователя от чистого Kubernetes-кластера до работающего AI-развёртывания модели. Следуйте шагам по порядку, если пользователь не указал skip-to-step N для возобновления с конкретного этапа.
Учёт стоимости: пулы GPU-узлов сопряжены со значительными затратами на вычисления (A100-80GB может стоить $3–5+/час). Убедитесь, что пользователь понимает финансовые последствия перед выделением GPU-ресурсов.
Этот скилл предполагает, что AKS-кластер уже существует. Если кластера нет, передайте задачу скиллу azure-kubernetes для его создания (с пулом GPU-узлов, если только CPU-инференс не подходит), затем вернитесь сюда.
| Параметр | Значение |
|---|---|
| Лучше всего подходит для | Полноценный онбординг AI Runway на AKS |
| CLI-инструменты | kubectl, make, curl |
| MCP-инструменты | Нет |
| Связанные скиллы | azure-kubernetes (настройка кластера), azure-diagnostics (диагностика) |
Используйте, когда пользователь хочет:
skip-to-step N начните с шага N; предполагайте, что предыдущие шаги выполнены| # | Шаг |
|---|---|
| 1 | Проверка кластера — проверка контекста, инвентаризация узлов, обнаружение GPU |
| 2 | Установка контроллера — развёртывание CRD + контроллера |
| 3 | Оценка GPU — обнаружение моделей GPU, проверка ограничений dtype/attention |
| 4 | Настройка провайдера — рекомендация и установка провайдера инференса |
| 5 | Первое развёртывание — выбор модели, развёртывание, проверка статуса Ready |
| 6 | Итоги — резюме, дымовой тест, следующие шаги |
| Ошибка / Симптом | Вероятная причина | Устранение |
|---|---|---|
| Нет контекста kubeconfig | Нет подключения к кластеру | Запустите az aks get-credentials или аналог |
| Контроллер в CrashLoopBackOff | Проблема конфигурации или RBAC | kubectl logs -n airunway-system -l control-plane=controller-manager --previous |
| Провайдер не готов | Ошибка загрузки образа или RBAC | kubectl logs <pod-name> -n <namespace> |
| ModelDeployment завис в Pending | Ошибка планирования GPU или провайдер не готов | kubectl describe modeldeployment <name> -n <namespace> |
Ошибки bfloat16 при инференсе | T4 или V100 не поддерживают bfloat16 | Добавьте --dtype float16 в аргументы сервинга |