Версия: 1.0.0
Дата: 2025-11-27
Статус: Операции
Процедуры диагностики проблем и восстановления системы.
☐ Все агенты доступны?
☐ Индексы актуальны?
☐ Нет критических gaps?
☐ Бэкапы выполнены?
☐ Структура валидна?
☐ Зависимости актуальны?
☐ Документация соответствует коду?
☐ Версии синхронизированы?
☐ Архитектура соответствует целям?
☐ Нет устаревших компонентов?
☐ Roadmap актуален?
☐ Метрики в норме?
ВХОД: Подозрение на проблему
1. СБОР СИМПТОМОВ
├── Что не работает?
├── Когда началось?
├── Что изменилось?
└── Есть ли ошибки?
2. ЛОКАЛИЗАЦИЯ
├── Какой компонент?
├── Какой уровень? (infra/platform/app)
└── Какой срез? (данные/код/конфиг)
3. АНАЛИЗ
├── Проверить логи
├── Проверить зависимости
├── Проверить версии
└── Проверить конфиги
4. ДИАГНОЗ
├── Корневая причина
├── Затронутые компоненты
└── Риски
5. ЛЕЧЕНИЕ
├── Немедленные действия
├── Долгосрочное решение
└── Превентивные меры
ВЫХОД: Диагностический отчёт
1. Поднять новый сервер
2. Установить зависимости: apt, python, docker
3. Восстановить workspace из git
4. Восстановить данные из hub (S3)
5. Восстановить БД из дампа
6. Перезапустить сервисы
7. Валидация
Время восстановления: ~1-2 часа
КАТАСТРОФА! Hub должен иметь репликацию.
1. Активировать реплику
2. Проверить целостность
3. Восстановить связи
1. Восстановить из зеркала (GitHub/GitLab)
2. Если нет зеркала — восстановить из workspace
3. Пересоздать историю из журналов
| Метрика | Описание | Норма | Критично |
|---|---|---|---|
| Coverage | % документированного кода | >80% | <50% |
| Consistency | Соответствие стандартам | >90% | <70% |
| Freshness | Актуальность документации | <7 дней | >30 дней |
| Complexity | Цикломатическая сложность | <10 | >20 |
| Dependencies | Глубина зависимостей | <5 | >10 |
| Gaps | Количество пробелов | <10 | >50 |
Связанные документы:
- ARCHITECT_MASTER.md — Главы 13-14
- operations/COMMANDS.md — Команды
- standards/INFRA_POLICY.md — Политика инфраструктуры