18.10.2021
Аналитика данных: как адекватно оценить реальные ожидания промышленности от применения этого инструмента, они завышены или, напротив, занижены?
Возможность извлечения практической пользы из больших данных, кажется, сегодня не подвергается сомнениям. И множество отечественных предприятий уже умеет их собирать и обрабатывать. Однако баланс между ожиданиями и результатом не всегда однозначен. Тезисами на эту тему делится Михаил Толмачев, глава центра компетенций по компьютерному зрению практики по анализу данных в EPAM.
1. Негативное отношение к аналитике нередко связано и с тем, что с данными на многих предприятиях привыкли работать не в рамках всех бизнес-процессов, а локально, в отдельных подразделениях. Многие пробуют строить свои дата-платформы, но в России еще нет компаний, которые бы полностью управлялись с помощью единого унифицированного инструмента. В практике зачастую превалирует использование разрозненных систем, а содержащиеся в них данные достаточно тяжело сравнивать друг с другом. Причем для сравнения: это касается и финансового сектора, громко заявляющего об активности в сфере применения аналитических инструментов в обработке больших данных.
2. По факту сегодня механизмы интеграции конкретных аналитических моделей в производственные и бизнес-процессы до конца еще не отработаны. Следствием этого является недопонимание многими потенциальными потребителями технологических тонкостей этих процессов. Отсюда и отсутствие видения реальной пользы от внедрения продуктов по сбору и обработке данных.
3. Завышенные ожидания индустрии от того, что в итоге сделает аналитик. Предприятия хотят 100-процентной точности предсказаний и работоспособности модели в режиме 24/7. Неискушенные в IТ-повестке специалисты рассуждают примерно так: если что-то поменяется внутри данных, то система сама чудесным образом адаптируется. Увы, это часто не так. Особенно при резких изменениях на производстве и во внешней конъюнктуре, адаптация к которым аналитических систем – процесс не такой простой, как может показаться на первый взгляд.
4. Каждый проект сопряжен с высокими трудозатратами. Для примера: один из типичных проектов по внедрению аналитики занял год сотрудничества и потребовал участия порядка 300 разработчиков.
5. Проблемой также является качество данных. При запусках аналитических проектов нередко выявляется наличие неглубокого погружения бизнеса в проблематику своих данных. Часть из них запутана и задублирована, а каких-то может и не быть вовсе. И на то, чтобы собрать некоторые данные для аналитики, иногда требуется до полугода. В таких случаях проект рискует затянуться. Со временем сотрудники начинают понимать пользу аналитики, становятся ответственнее и стараются поддерживать чистоту и полноту данных: заполняют все необходимые поля, вносят информацию о контрагентах, проставляют галочки в нужных местах. Но так случается не со всеми и не всегда.
6. Еще одна причина – российская бизнес-специфика. Ее неплохо иллюстрируют отличия от зарубежных подходов. На Западе при реализации проектов, связанных с большими данными, искусственным интеллектом и машинным обучением, проще относятся к инвестициям в те или иные направления, если видят в них перспективу. Заказчики понимают, что за искусственным интеллектом будущее, и не боятся экспериментировать, инвестировать в НИОКР, и в результате все окупается сторицей. В России, напротив, хотят начинать с малого, быстро при этом получая результаты. Есть и разница в организации инфраструктуры. Это, например, касается развития облачных технологий. Российская индустрия в отличие от западной не спешит массово заходить в облака. А вот зарубежные IТ-подразделения убедились в том, что обслуживание собственного парка серверных мощностей – большая головная боль. Проще покупать виртуальные ресурсы у IТ-гигантов, которые неплохо умеют обслуживать масштабный облачный кластер.
1. Вначале это обследование текущего состояния с целью зафиксировать общий уровень аналитической зрелости, сформировать видение целевых продуктов и платформы. Для этого нередко используется дескриптивная аналитика, или, проще говоря, взгляд в прошлое. Чтобы эффективно управлять жизненным циклом аналитических продуктов,нужна дата-платформа, которая даст возможность собирать, обрабатывать и анализировать информацию из различных систем, позволит получить комплексное представление о том, что происходило в производственных процессах, каким был расход материалов на выпуск продукции и многое другое.
2. Далее следует добавление инструментов предиктивной аналитики. На основе данных о прошлом предприятия и анализа аспектов его функционирования можно разрабатывать аналитические модели, в том числе на основе искусственного интеллекта, для прогнозирования будущих событий, например, какой объем материалов потребуется в следующем квартале, что позволит оптимизировать оборотный капитал.
1. Первое и главное условие – заинтересованность ключевых лиц и участников производственного процесса – от топ-менеджмента подразделений до линейного персонала. В противном случае программа трансформации успешной не станет.
2. Важным параметром является информативность. В части общего видения создаваемого инструмента необходима обратная связь от всех заинтересованных лиц.
3. Психологическая готовность к тому, что средний цикл жизни технологии сейчас объективно составляет от 3 до 5 лет. Именно по этой причине на рынке пока нет единого устоявшегося продукта, который мог бы закрыть все потребности бизнеса.
4.Также компаниям, которые хотят извлекать больше ценности из больших данных, необходимо учитывать тенденцию к построению инфраструктуры в облаках, ведь разворачивать сервисы при таком формате достаточно дорого. К этому нужно быть готовым. Для успешного внедрения тех или иных инициатив нужно подбирать правильные технологии, которые лучше всего лягут на экосистему компании.
5. Люди всегда важнее технологий. Иллюстрация такого утверждения – следующий кейс. На одном из производств использовался дорогой компонент, который необходимо добавлять в расплав стали, и модель была построена на основе требований к плавке. Она учитывала физические и химические процессы, а потом делала вычисления и предсказывала расход компонента, а также рекомендовала оптимальный объем, который нужно добавлять рабочим. Потенциальная экономия от реализации идеи огромна. Но на практике вышло иначе: компьютер ключевого сотрудника не задействовался, а технолог продолжал добавлять материал, основываясь на своем опыте, не имея никакого понятия о методике внедряемого процесса.
6. Компания должна быть крупной с большим и сложным бизнесом, распределенной структурой, большим количеством контрагентов и тысячами клиентов. Ситуация такова, что большие данные пока удел гигантов рынка, ведь у представителей малого бизнеса просто банально может не оказаться того объема данных, при котором имеет смысл разрабатывать единую дата-платформу и собственные дата-решения. Такие проекты являются дорогостоящими, и возврата инвестиций от них при скромном масштабе бизнеса ожидать не стоит.
Сегодня в каждом секторе можно насчитать 5–10 предприятий, являющихся лидерами по внедрению дата-решений, и промышленность логично приходит к работе с данными в тех кейсах, где хорошо виден экономический эффект. Поэтому нужно, чтобы компании уходили от практики разрозненных проектов с отдельными командами разработчиков и аналитиков, когда результаты их работы, наборы данных и аналитические модели не используют другие подразделения. Для получения эффекта нужен производственный конвейер дата-проектов с унифицированной для разных команд средой разработки, сбора, хранения и обработки данных, едиными инструментами и правилами.
При подготовке публикации использовались материалы CNews.