Бизнес-процессы в IT-компании¶
Для тех, кто только входит в профессию.
Структура команды¶
| Роль | Что делает |
|---|---|
| Backend / Frontend разработчики | пишут код фич |
| QA (тестировщики) | пишут тесты, валидируют, ловят баги |
| DevOps / SRE | инфраструктура, CI/CD, инциденты, обсервабилити |
| Продакт-менеджер | отвечает за «что делаем и зачем» |
| Аналитик | данные, метрики, A/B-тесты |
| Тимлид (TL) | технический руководитель команды |
Процессы¶
Задачи¶
Jira / YouTrack / Linear → спринт (обычно 2 недели) → планирование → оценка (story points / часы) → декомпозиция → исполнение → демо.
Code Review¶
- Минимум 1–2 апрува перед мерджем.
- Comments, не «approve без чтения».
- На review смотрят: правильность, читабельность, тесты, безопасность, соответствие конвенциям.
CI/CD¶
git push
↓
lint (golangci-lint)
↓
test (go test -race -cover)
↓
build (docker image)
↓
deploy stage (auto)
↓
manual approve → deploy prod
Инциденты¶
алерт (Prometheus → Slack/PagerDuty)
↓
oncall смотрит метрики (Grafana, Loki)
↓
если можно откатить → откат
если можно хотфикс → хотфикс
↓
резолв инцидента
↓
Post-mortem встреча: что случилось, что сделали, что меняем в процессе
Метрики для разговора¶
- Latency (p50/p99/p999) — время ответа сервиса.
- RPS / TPS — запросы / транзакции в секунду.
- Error rate — % ошибок.
- Availability — % времени работы (99.9%, 99.99%, ...).
- MTTR — mean time to recovery (минуты от инцидента до восстановления).
- MTBF — mean time between failures.
RED метрики (для каждого сервиса)¶
- Rate — RPS.
- Errors — % ошибок.
- Duration — p50/p99 latency.
Это минимальный набор, по которому видно «жив / болен» сервис.
USE для инфраструктуры¶
- Utilization — загрузка ресурсов (CPU, memory, диск).
- Saturation — очереди, ожидания, throttling.
- Errors — ошибки уровня железа / OS.
Что важно понимать на собесе¶
- Команда работает короткими итерациями.
- Тесты — не «проверка», а «контракт».
- CI зелёный = MR можно мерджить.
- Дежурство (oncall) — нормальная часть жизни SRE/backend.
- Post-mortem — про процессы, не про людей. «Никого не наказываем».
Что почитать дальше¶
- 📖 Accelerate — про метрики DORA.
- 📖 The Phoenix Project — DevOps-роман.
- 📖 Site Reliability Engineering (Google) — SRE-практики.