Skip to content

🛠 SRE Roadmap: Путь к надежности (SRE - Site Reliability Engineering)

SRE — это то, что происходит, когда вы просите программного инженера разработать и внедрить операционную функцию. На этом сайте собран путь развития от основ Linux до управления сложными распределенными системами.

🚀 Быстрый старт

Что такое SRE?

Site Reliability Engineering — это подход к эксплуатации, основанный на инженерных практиках и автоматизации. Наша цель — найти баланс между скоростью доставки фич и стабильностью системы.

Начните с понимания Linux, сетей и того, как работают процессы под капотом.

Перейти к основам →

Метрики, логи и трассировка. Если вы это не измеряете — вы это не контролируете.

Изучить мониторинг →

Как реагировать на алерты и проводить Post-mortem без поиска виноватых.


💡 Важные концепции

Запомните

100% доступности не существует. Это недостижимая и слишком дорогая цель. Используйте Error Budgets.

Инструментарий SRE (нажми, чтобы развернуть)
  • IaC: Terraform, Ansible, Pulumi
  • CI/CD: GitHub Actions, GitLab CI
    • Container Orchestration: Kubernetes, Nomad
    • Observability: Prometheus, VictoriaMetrics, Grafana

📊 Статистика и Тэги

Посмотрите наши последние обновления в блоге или отфильтруйте контент по тегам ниже.

Все теги