Затраты на IT-инфраструктуру становятся все более непрозрачными, особенно в условиях сложных и развивающихся систем. Важно наладить контроль над расходами, чтобы сохранить устойчивость, подчеркивает Александр Опрышко, сооснователь и управляющий партнёр KTS.
Согласно исследованию «СТРИМ Консалтинг», российский рынок IT-услуг достиг 681 млрд рублей в 2023 году и, по прогнозам, может вырасти до 1,9 трлн рублей к 2028 году. IT-инфраструктура, в свою очередь, остается одним из наиболее быстрорастущих направлений расходов. В данной статье мы обобщим практики, применяемые в KTS для оптимизации затрат как на облачные, так и на локальные инфраструктуры. Также мы обсудим важные аспекты FinOps, роль аудита и распространенные ошибки, которых следует избегать для обеспечения успешной оптимизации.

Затраты на IT-инфраструктуру включают вычислительные ресурсы, хранилища, системы безопасности, администрирование и техническую поддержку. Именно в этой области часто возникают проблемы с контролем, особенно в динамичных или распределенных командах. Например, в 2023 году по данным компании КРОК, стоимость корпоративного софта в России увеличилась на 10–20%, и этот тренд продолжится и в 2024 году.
По расчетам экспертов проекта «Кибериспытание», бизнес уже тратит на IT-инфраструктуру до 500 млн рублей, и эти расходы будут удваиваться каждые несколько лет. При этом 64% работодателей, согласно опросу компании «Консоль», сталкиваются с нехваткой квалифицированных сотрудников на средние и старшие позиции, что отрицательно сказывается на управляемости инфраструктурой. Оптимизация затрат на инфраструктуру при отсутствии контроля может привести к серьезным последствиям, что подчеркивает актуальность обсуждаемых тем.
В последние годы разработаны различные методики для системного управления затратами, и в компании KTS мы обычно фокусируемся на трех ключевых уровнях. Первый из них — FinOps. Это не просто процесс сокращения расходов в облачной среде, а полноценная система, которая обеспечивает распределение ответственности и прозрачность.
FinOps объединяет финансы, IT и разработку, что позволяет бизнесу лучше управлять IT-бюджетом и находить возможности для экономии. Мы подготовили отдельный материал, который подробно объясняет, как этот подход способствует управлению затратами.
Следующий уровень — фуллстек-FinOps, который дополняет базовые принципы сбором метрик в реальном времени, предоставляет отчеты по проектам и позволяет автоматически привязывать затраты к командам. Важным элементом является создание единого центра управления гибридной инфраструктурой.
Платформа Yandex Cloud предлагает встроенные инструменты для внедрения принципов FinOps. Она позволяет настраивать бюджеты и уведомления, определять теги и структуру отдельного биллинга, а также использовать детализированную аналитику для контроля расходов. Эти функции помогают упростить начало работы и содействуют постепенному внедрению культуры FinOps в командах.
Многие компании переходят от крупных капитальных вложений (CapEx) к операционным расходам (OpEx). Например, облачные платформы предлагают модель «плати по мере использования», при которой бизнес оплачивает только фактически использованные ресурсы.
Оценка инфраструктуры позволяет выявить дублирующие компоненты, лишние лицензии и устаревшие сервисы. На основе этих результатов компании могут мигрировать в более эффективные среды, обратиться к open-source решениям или пересмотреть условия с провайдерами. Создание кросс-функциональной группы, состоящей из представителей IT, финансов и разработок, позволяет совместно планировать, контролировать и пересматривать расходы на инфраструктуру.
Инфраструктура должна быть организована с использованием тегов, что позволяет классифицировать ресурсы по проектам, командам, бизнес-направлениям и средам, таким как development, test и production. Это помогает точно отслеживать, кто использует ресурсы и для каких целей.
Важно установить финансовые лимиты и настраивать уведомления о приближении к пороговым значениям, а также автоматические действия при превышении лимитов, например, временное отключение ресурсов. Такие меры предотвращают неожиданные перерасходы ресурсов.
Создание дашбордов с ключевыми метриками, такими как распределение расходов по тегам и уровень утилизации, позволяет своевременно выявлять аномалии и оптимизировать использование ресурсов. Однако перед внедрением новых DevOps-практик и методов оптимизации необходимо тщательно просчитать окупаемость подобных инициатив.
Необдуманные шаги, такие как резкое снижение размеров инстансов или отказ от резервирования, могут негативно сказаться на производительности и привести к сбоям в работе критически важных систем. Поэтому критично важно вести детальную аналитику облачного потребления.
Без ясного распределения финансов не удастся эффективно выявить неиспользуемые или недостаточно используемые ресурсы. Если отсутствует политика тегирования, при которой ответственность за расходы возлагается на конкретные команды или проекты, риск перерасхода значительно возрастает, что может привести к финансовым потерям.
Наконец, не следует игнорировать аспекты безопасности и отказоустойчивости — стремление снизить затраты не должно ставить под угрозу защиту данных и надежность систем.
Риски инцидентов, приводящие к увеличению расходов, становятся серьезной проблемой для бизнеса. Мы сталкивались с такими ошибками во время аудита инфраструктуры одного из клиентов, о котором расскажем ниже. Аудит инфраструктуры является эффективным инструментом для снижения издержек и повышения производительности, поскольку он помогает выявить дублирующие, неэффективные решения и уязвимости в автоматизации и масштабируемости.
В одном из примеров, крупная мебельная компания России обратилась с запросом на помощь в адаптации своей инфраструктуры к перепадам нагрузки, сокращении ресурсов и упрощении процессов поддержки. Наш аудит состоял из двух направлений: оценка технического состояния и управление процессами.
Клиенту требовалась инфраструктура, способная справляться с изменяющимися нагрузками, требующая минимального внимания, чтобы команда из 1-2 инженеров могла эффективно её поддерживать. Однако, инфраструктура была построена на разрозненных виртуальных машинах без единой архитектурной концепции, с использованием устаревших технологий. Облачные решения использовались крайне редко, что усложняло возможное управление и масштабирование. В результате применения локального хранилища вместо управляемого наблюдались рост затрат и снижение эффективности использования ресурсов.
Далее во время аудита мы исследовали совокупность всех этих аспектов, что позволило нам сформулировать выводы и предложения по оптимизации инфраструктуры, направленные на дальнейшее развитие бизнеса.
Принцип «Infrastructure as Code» (IaC) применялся только частично, что усложняло сопровождение и увеличивало вероятность ошибок при изменениях. Автоматизация релизов фактически отсутствовала: процессы сборки и выкладки сервисов оставались ручными или только частично автоматизированными, что особенно затрудняло развертывание в новых средах.
Система мониторинга была реализована лишь в интерфейсе, без фиксации в коде конфигурации и ведения истории изменений. Это затрудняло понимание активных алертов и покрытие инфраструктуры, что, в свою очередь, увеличивало нагрузку на инженеров при поиске инцидентов.
Сервисы взаимодействовали напрямую, что создавало проблемы с безопасностью, так как использовались белые IP-адреса, увеличивающие потенциальные уязвимости. Облачные инструменты для сетевой безопасности не применялись. Пиковые нагрузки часто приводили к сбоям из-за нехватки ресурсов; инфраструктура не была готова к масштабированию, и приходилось или поддерживать избыточный запас, или терпеть потерю доступности, так как автоскейлинг не был реализован.
В ходе аудита выявлены базовые уязвимости, такие как отсутствие централизованной аутентификации, истории изменений и слабый контроль доступа. Управление доступами было либо формальным, либо полностью отсутствовало, что создавало риски как для внутренней безопасности, так и обеспечения соблюдения регуляторных требований. Ожидается, что внедрение предложенных шагов позволит сократить инфраструктурные расходы до 30%.
Вместе с командой клиента мы продолжаем поэтапное внедрение предложенных изменений. Оптимизация расходов представляет собой непрерывный процесс, в который вовлечены как бизнес, так и технические команды. Даже простые действия, такие как внедрение тегов или настройка бюджетов, способны принести значительные результаты, особенно в крупных распределённых системах.
Если вы только начинаете разбираться в своей инфраструктуре, начните с аудита. Если вы уже применяли различные методы оптимизации, но не достигли успеха, возможно, дело в системных ошибках.
Первым шагом должно стать измерение текущих расходов и анализ их динамики, что поможет выявить проблемные области. Далее важно искать инструменты для эффективной работы с этими расходами. Если вас интересуют возможности облачных технологий для оптимизации бизнеса, рекомендуем подписаться на телеграм-канал Yandex Cloud, чтобы быть в курсе актуальных тенденций.
Сегодня приоритетом становится оптимизация бизнеса, которая переходит в новый формат. О традиционных методах сокращения расходов и кадров расскажет Михаил Беляев, руководитель образовательного направления Битрикс24. Я также искал примеры того, как компании из различных секторов сокращают затраты для обеспечения своей прибыльности.
Некоторые из российских предприятий внедряют современные технологии для значительной экономии.
IT-инфраструктура представляет собой «кровеносную систему» бизнеса, но многие управляющие доверяют ее управление специалистам, не уделяя должного внимания процессам. Это может привести к серьезным последствиям: от финансовых убытков до утечек данных. Чтобы избежать таких катастроф, важно поддерживать контроль над IT-системами.
Важнейшим аспектом здесь является управление системными ошибками и инцидентами. Качество и своевременность ИТ-сервисов формируют доверие клиентов и влияют на восприятие продукта. Системные ошибки или баги могут нарушить выполнение SLA и снизить ценность услуг. Поэтому важно внедрять методики и подходы, которые помогут управлять этими рисками.
Согласно исследованию международной консалтинговой компании Arthur D. Little, телеком-операторы могут сэкономить до 20% ИТ-бюджета, не теряя при этом инновационности и качества. В условиях постоянной конкуренции и растущих расходов внимание к оптимизации бизнес-процессов и логистики становится неотъемлемой частью успешного ведения бизнеса.
Конкретные примеры и инструменты дадут возможность улучшить эффективность компаний и предотвратить сбои в работе, что критически важно в сегодняшних реалиях.