Dungeons & Dragons для SRE

В прошлой жизни я работал фулл-тайм SRE, а по совместительству был драконорожденным паладином по имени Лорарат (Lorarath). На работе со своей командой я сопровождал тысячи систем, а вечерами пытался выжить в воображаемых битвах и спасти мир от ведьмы Морганы. Мне нравятся совместные игры: они позволяют выплеснуть эмоции и прочувствовать различные социальные процессы, важные для успешного и конструктивного взаимодействия. Игры позволяют практиковаться в поиске решения критических ситуаций в безопасной среде. Если весь процесс лишь плод вашего воображения, то становится проще, даже при проигрыше, взглянуть на себя со стороны, порадоваться новому опыту и достижению общей цели. В этой статье я хочу поделиться мыслями о своей работе, на которые меня навела игра в D&D, и о том, как это может помочь вам.

Создание вашей SRE-команды... больше, чем просто имя

SRE могут называть разными именами: «эксплуатация», «DevOps», «инфраструктурные инженеры», «системные администраторы». Но по сути это те, кто деплоит и сопровождает высокодоступные, масштабируемые и безопасные сервисы, решающие задачи бизнеса. Как правило, под этим подразумевают человека с обширным набором навыков, готового всегда взяться за решение любой задачи.

Игра в Dungeons & Dragons начинается с выбора класса персонажа. У класса  есть специализации, которые вы выбираете в зависимости от вашей игровой стратегии. Далее вы описываете своего героя с помощью листа персонажа и придумываете историю. В листе персонажа указываете характеристики и навыки, которые помогут вам справиться  с определенными игровыми ситуациями. Между навыками распределяете определенное количество баллов.

В игре вы собираете команду таким образом, чтобы каждый из участников выполнял свою роль, часто дополняя других. Вам не нужна команда, состоящая из одних «волшебников» или хакеров и слэшеров. Часто бывает, что мы идентифицируем себя только по имени роли: «SRE», «системный администратор». Но мне нужна разнохарактерная команда с различными навыками. Мне не нужны сотрудники с одинаковой экспертизой или характеристиками. Для достижения целей и реализации видения команды я ищу людей с навыками, дополняющими друг друга.

Разработка своего «листа персонажа»

В реальной жизни у нас нет прямого эквивалента «листу персонажа». Самый близкий аналог — резюме или профиль в LinkedIn. Но они не описывают весь опыт:

  • Отправка пул-реквестов в гитхабе.

  • Участие в хакатонах.

  • Посещение тренингов и конференций.

  • Ежедневное решение разнообразных проблем и задач.

Кроме того, если вы не тренируете навыки регулярно, то они ослабевают. Например, я не работал с Solaris более десяти лет и больше не говорю о нем как о своем навыке.

Если у SRE действительно был бы лист персонажа, то я думаю, что в нем должны присутствовать следующие три основные характеристики: коммуникация, сотрудничество и уверенность.

Давайте рассмотрим их подробнее и почему на их развитие стоит потратить усилия.

Коммуникация

Коммуникация — фундамент для успешного персонажа. Как SRE я сталкиваюсь с различными вопросами, требующих навыков коммуникабельности.

  • Количество общения. Как часто я должен напоминать коллегам о предстоящих регламентных работах? Как часто стоит обращаться к своему начальнику при выполнении работы? Как часто моя команда должна собираться, чтобы обсудить командные задачи?

  • Качество общения. Коммуникация может быть визуальной, письменной или устной. Часто проще передать информацию визуальными средствами, чем повторять одно и то же в тексте или в каком-либо другом виде.

  • Эффективность — степень, в которой ваши слова приводят к желаемым результатам. Эта наиболее сложная характеристика, так как эффективное общение требует глубокого понимания аудитории и владения ораторским искусством.

Сотрудничество

При работе над любым продуктом или сервисом необходимо понять, что вам требуется сделать, спланировать данную работу и выполнить ее. Неважно, кто будет исполнителем. Важно, чтобы все было сделано. 

Роль, которую я исполняю сегодня, не определяет того, кто я есть. Если я говорю: «Я SRE в Компании», то это всего лишь одна из моих характеристик, но не моя личность. Выполняя свою ежедневную работу, обращайте внимание на ценность, которую вы привносите в команду. Вместо того чтобы принимать и олицетворять свою личность с определенной ролью, осознайте, что иногда вы берете на себя роль, которая может сильно отличаться от той, к которой вы привыкли, и это часть вашего развития.

Есть разница между членами вашей команды и ролями, которые они играют. В игре вам комфортно говорить от имени своего персонажа, при этом ведя отдельный, иногда метаразговор, со своими товарищами по команде. Похоже, что социальная среда стремится к гомеостазу, и вы, возможно, естественным образом приписываете упрощенный нарратив действиям своих коллег. Осознание того, что каждый сотрудник выполняет только роль в команде, которая не отражает всех его навыков, позволяет организовать работу более эффективно.

Другими словами, никогда не говорите «ну, они просто ИМЯ_РОЛИ и не могут этого сделать» или «это не моя работа».

Уверенность

Третья основная характеристика вашего SRE-персонажа — это уверенность. Уверенность — это черта характера, которая заставляет вас идти на риск (или не идти). 

Иногда в игре вы понимаете, что идете неправильным путем или отправляете слабых игроков на передовую, а они получают серьезные повреждения. Ошибки неизбежны. Наши заказчики в «реальном мире» постоянно преподносят нам сюрпризы. К тому же бывают баги в программном обеспечении, поломки оборудования, или просто кто-то может запустить неправильную команду в продакшене, перепутав терминал.

Совместные игры учат командному преодолению неудач, сохраняя сплоченность, необходимую для успеха. Хотя, конечно, если из-за коллеги вы попадете в плен к гигантскому пауку, то вам это сильно не понравиться. Тем не менее в игре можно выплеснуть свои эмоции, чтобы в рабочих ситуациях вести себя достойно. 

В игре мы развиваем воображение. Нам нужно держать в голове всю картину и принимать решения, не забывая главную цель игры и анализируя текущую игровую ситуацию. К тому же еще есть, например, неигровые персонажи (NPC, non-playing character), с которыми можно пообщаться и получить важную информацию. В работе также не забывайте про не-продакнш инженеров (NPE, non-production engineers). Они могут не сопровождать продакшн-окружение, но обладать ценной информацией, которая будет вам полезна.

Заключение

Итак, эта статья вдохновила вас на использование коллективных игр для тимбилдинга, создание вашей команды с навыками, дополняющими друг друга, а также на описание работы SRE или системного администратора с помощью листа персонажа. Отлично. Но помимо «листа персонажа» вам потребуется соответствующая визуализация. Когда сотрудник выполняет определенные виды работ, можно увеличивать счетчик данного «навыка». Также можно собирать дополнительную информацию о git-коммитах, сборках пакетов и решении инцидентов для отслеживания прогресса во времени. Таким образом, вы можете быть уверенным, что тратите время на развитие действительно нужных вам навыков.

Если вы хотите попробовать D&D, загляните в местные магазины игрушек или соответствующие группы. В комплектах для начинающих часто бывают заранее сконфигурированные персонажи, с помощью которых можно начать игру, не разбираясь во всех тонкостях игрового процесса.


Материал подготовлен в рамках курса «SRE практики и инструменты».

Всех желающих приглашаем на бесплатное demo-занятие «Три слова на три буквы: SLA, SLO, SLI». На этом уроке мы:
— Обсудим, как SRE оценивает риски, управляет ими и использует лимит времени недоступности сервиса для того, чтобы объективно принимать решения.
— SLI, SLA, SLO — фундаментальные понятия для SRE. Рассмотрим каждый из этих понятий и определим показатели для сервиса.

Регистрация на занятие здесь.