Перейти к содержанию

Бизнес-процессы в IT-компании

Для тех, кто только входит в профессию.

Структура команды

Роль Что делает
Backend / Frontend разработчики пишут код фич
QA (тестировщики) пишут тесты, валидируют, ловят баги
DevOps / SRE инфраструктура, CI/CD, инциденты, обсервабилити
Продакт-менеджер отвечает за «что делаем и зачем»
Аналитик данные, метрики, A/B-тесты
Тимлид (TL) технический руководитель команды

Процессы

Задачи

Jira / YouTrack / Linear → спринт (обычно 2 недели) → планирование → оценка (story points / часы) → декомпозиция → исполнение → демо.

Code Review

  • Минимум 1–2 апрува перед мерджем.
  • Comments, не «approve без чтения».
  • На review смотрят: правильность, читабельность, тесты, безопасность, соответствие конвенциям.

CI/CD

git push
lint (golangci-lint)
test (go test -race -cover)
build (docker image)
deploy stage (auto)
manual approve → deploy prod

Инциденты

алерт (Prometheus → Slack/PagerDuty)
oncall смотрит метрики (Grafana, Loki)
если можно откатить → откат
если можно хотфикс → хотфикс
резолв инцидента
Post-mortem встреча: что случилось, что сделали, что меняем в процессе

Метрики для разговора

  • Latency (p50/p99/p999) — время ответа сервиса.
  • RPS / TPS — запросы / транзакции в секунду.
  • Error rate — % ошибок.
  • Availability — % времени работы (99.9%, 99.99%, ...).
  • MTTR — mean time to recovery (минуты от инцидента до восстановления).
  • MTBF — mean time between failures.

RED метрики (для каждого сервиса)

  • Rate — RPS.
  • Errors — % ошибок.
  • Duration — p50/p99 latency.

Это минимальный набор, по которому видно «жив / болен» сервис.

USE для инфраструктуры

  • Utilization — загрузка ресурсов (CPU, memory, диск).
  • Saturation — очереди, ожидания, throttling.
  • Errors — ошибки уровня железа / OS.

Что важно понимать на собесе

  1. Команда работает короткими итерациями.
  2. Тесты — не «проверка», а «контракт».
  3. CI зелёный = MR можно мерджить.
  4. Дежурство (oncall) — нормальная часть жизни SRE/backend.
  5. Post-mortem — про процессы, не про людей. «Никого не наказываем».

Что почитать дальше

  • 📖 Accelerate — про метрики DORA.
  • 📖 The Phoenix Project — DevOps-роман.
  • 📖 Site Reliability Engineering (Google) — SRE-практики.