Какие факторы влияют на развитие дата-инноваций
|
Родион Мартынов
Руководитель отдела по анализу данных компании «Синимекс»
Если ответить в двух словах, как развивать дата инновации-сегодня, то также как и другие инновации: прагматично отслеживая "цикл хайпа" и учитывая лучшие практики в применении к собственному бизнесу. Дата-инновации развиваются стремительно как вширь, так и вглубь, важно не терять прикладной фокус их применения и не делать инновации ради их инновационности без измеримой оценки потенциального применения. Это можно назвать «инновацией от проблемы": сформулировать не как "у нас есть нейросеть, куда бы ее пристроить?", а с ключевых бизнес-вызовов: "Как снизить отток клиентов?" или "Как оптимизировать цепочку поставок?", используя современные решения.
|
Фундамент дата-инноваций
Стартовой точкой развития подходов, основанных на данных, является безусловно наличие непосредственно данных, их полнота и качество, это «кровеносная система», фундамент — построение хранилищ данных, внедрение процессов обеспечения качества и управления данными, создание единой точки правды, поскольку тезис «некачественные данные ведут к некачественным выводам» всегда будет сохранять свою актуальность.
Факторы влияния
Тормозит развитие в первую очередь кадровый голод, инженерия данных очень динамичная сфера ИТ, развиваются СУБД, платформы, фреймворки, методологии работы с данными. Необходимо очень быстро бежать чтобы хотя бы просто стоять на месте.
Сказываются также ограничения по доступу к современному «железу» — есть сложности с закупкой мощных GPU, специализированных процессоров, а также с использованием топовых управляемых сервисов мировых облаков (хотя российские облака активно развиваются), но в России традиционно более популярны решения, развернутые на собственных серверах.
Также заметный тормоз — «сырые» данные и низкая культура данных. Классическая проблема: данные разрознены, нет единых справочников, метаданных, контроля качества. Наведение порядка — это 80% усилий в любом проекте.
Можно упомянуть и низкий на текущий момент уровень зрелости самого бизнеса в подходе, основанном на данных - бизнес ждет быстрой отдачи, не готов инвестировать в долгосрочную инфраструктуру и фундамент. Много «точечных» пилотов, которые не становятся промышленными решениями.
Однако, с другой стороны, текущие ограничения работают и как мощнейшие драйверы роста.
Геополитическая ситуация и импортозамещение выступают как мощнейший катализатор. Компании вынуждены быстро развивать собственные компетенции, создавать внутренние решения и адаптировать open-source инструменты. Государственные гранты и поддержка в рамках «Цифровой экономики» также работают как ускоритель.
Уход крупных западных вендоров и активное развитие open-source инструментов становятся де-факто отраслевым стандартом и позволяют строить современные решения без прямой зависимости от вендоров.
Экономическая ситуация, конкуренция и сокращение маржинальности заставляют бизнес искать точки роста в оптимизации (логистика, запасы, ценообразование) и повышении конверсии (персонализация, рекомендации).
Спрос на специалистов по работе с данными породил рост числа курсов, программ переподготовки, развитие внутренних центров компетенций — компании понимают потребность в подобных ресурсах.
Цифровизация госсектора и регулируемых отраслей. Требования по отчетности, мониторингу и контролю создают спрос на системы сбора и анализа данных (например, в ФНС, строительстве, ЖКХ, и тд.).
Критичные и преодолимые факторы
Критичные (требуют системных изменений): Дефицит кадров, низкая data-культура. Решаются долгой работой по построению образовательных программ, перестройке процессов и мотивации.
Преодолимые (решаются внутри компании): «Сырые» данные, синдром быстрых результатов — это вопрос правильного управления, приоритизации и наличия сильных CDO.
Работающие дата-практики лидеров
Лидеры внедряют практики автоматизации пайплайнов данных и моделей, что сокращает время вывода решений в промышленную эксплуатацию.
Широко применяется как децентрализация в виде Data Mesh (данные как продукт, ответственность за домен передается бизнес-командам, а центральная команда предоставляет инфраструктуру и стандарты), так и централизация на Data Platform (единые платформы данных как сервис для бизнес-юнитов).
Существуют и активно применяются инструменты быстрого прототипирования на LowCode/NoCode платформах для быстрого получения PoC и обоснования экономического эффекта для бизнеса с целью дальнейшего развития и масштабирования гипотезы.
Повсеместное внедрение BI и Self-Service Analytics: Доведение дашбордов и интерактивных отчетов до конечных бизнес-пользователей, снижая порог входа в технологию и как следствие нагрузку на аналитиков.
Активное использование инструментов анализа данных в прикладных задачах, таких как распознавание документов, речевая аналитика в анализе тональности обращений в кол-центрах, контроль качества на производствах, уже зарекомендовало себя и укоренилось в рабочих бизнес-процессах.
Области с максимальной отдачей
Лидером традиционно является финтех, сложно представить современный банк с низким уровнем цифровизации. Телеком не отстает, далее ритейл и e-commerce, страховые компании, промышленность, логистика.
Преодолимые (решаются внутри компании): «Сырые» данные, синдром быстрых результатов — это вопрос правильного управления, приоритизации и наличия сильных CDO.
Дата-технологии 2026: как выбрать стек
При выборе стека на горизонте 2026 года в российских условиях нужно делать ставку на устойчивость, адаптивность и кадровый резерв.
Приоритет №1: Сообщество и доступность кадров. Выбирайте технологии с активным глобальным, и, что не менее важно, локальным комьюнити. Если на технологию сложно найти специалиста или обучить своего — это огромный риск. Примеры с сильным сообществом в РФ: Python, Apache Spark, Airflow, ClickHouse, Postgres, Kafka.
В первую очередь open-source, но с коммерческой поддержкой. Основа стека должна быть на открытых технологиях. Однако для критичных компонентов стоит рассматривать российских вендоров, которые предлагают корпоративную поддержку, SLA и доработки под требования. Это снижает операционные риски.
Зрелость и стабильность vs. «хайп». В 2026 году в промышленную эксплуатацию стоит брать технологии, прошедшие проверку боем, а не новейшие фреймворки недельной давности. Следите за трендами, но внедряйте их обдуманно.
Интегрируемость и экосистема. Технология не должна быть «вещью в себе». Оценивайте, насколько хорошо она стыкуется с другими компонентами вашего стека (например, через REST API, коннекторы), есть ли готовые коннекторы к вашим источникам данных.
TCO (совокупная стоимость владения) и операционные расходы. Включает не только лицензии, но и стоимость развертывания, поддержки, обучения команды. Часто простой и понятный инструмент с умеренной производительностью оказывается выгоднее «монстра», требующего уникальных экспертов.
Итоговый совет
Стратегия выбора — «прагматичный open-source». Стройте стек вокруг проверенных, популярных в комьюнити инструментов, но для уровня крупных организаций заключайте контракты с компаниями-интеграторами или вендорами, которые могут обеспечить поддержку и развитие. Начинайте с бизнес-задачи, а не с технологии, и выбирайте тот стек, который быстрее и надежнее приведет к измеримому результату.