4 шага к успешному внедрению искусственного интеллекта
Для большинства людей искусственный интеллект — это что-то прямо из (неизбежного) будущего, в котором — в крайних антиутопических видениях — умные роботы захватят мир. На самом деле решения на основе ИИ уже стали частью нашей жизни. Многие из них мы используем каждый день, часто даже не осознавая этого. Так является ли искусственный интеллект просто еще одной технологией, аналогичной всем другим ИТ-системам и приложениям? И как именно выглядит процесс внедрения такого решения?
Оглавление
- В чем разница между ИИ и другими ИТ-проектами?
- Знакомство с проблемой и ожиданиями клиента
- Проверка бизнес-гипотезы с шага 1 и построение бизнес-кейса
- Реализация решения
- Обслуживание системы
- Возможные пути проекта внедрения ИИ-решения
В чем разница между ИИ и другими ИТ-проектами?
Основные различия между проектами, связанными с искусственным интеллектом, и другими проектами по внедрению программного обеспечения связаны с степень разработки месторождения и наш опыт создания и применения тех или иных решений, а не различия в природе самого искусственного интеллекта.
Это означает, что некоторые решения разрабатывались и совершенствовались в течение многих лет. В мире ИТ у нас было достаточно времени, чтобы создать для них надежные процессы и методы, в то время как другие все еще находятся в стадии разработки. экспериментальная фаза – используют ли они искусственный интеллект или нет.
Хорошим примером этого является OCR или Оптическое распознавание символов, который считывает текст с изображений и преобразует текст в редактируемый формат. OCR (позже ICR — Интеллектуальное распознавание символов) использует механизмы искусственного интеллекта, однако реализация этой технологии не представляет особой сложности, и, наверное, мало кто даже задумывается о том, какой механизм за ней стоит. Как онлайн-сервис OCR доступен с начала 2000-х годов.
Тем не менее, решения AI/ML, используемые в больших масштабах, все еще являются относительно новой областью, поэтому большинство таких проектов носят научно-исследовательский характер. Их можно сравнить с исследовательскими экспедициями: очень рискованными, полными неизведанного и постоянно возникающими проблемами, ожидающими своего решения. При этом они характеризуются очень высокой вероятностью выхода из строя.
Стоит отметить, что данные играют чрезвычайно важную роль в проектах AI/ML. В типичном ИТ-проекте относительно простые наборы данных анализирует человек, который на этой основе выстраивает соответствующие алгоритмы. В проекте AI/ML мы имеем дело с проблемами, в которых данных так много и они настолько сложны, что мы не в состоянии справиться с ними, применяя обычные алгоритмы.В этом случае данные также играют гораздо более важную роль в самом процессе построения решения, чем в других реализациях — именно данные определяют, как искусственный интеллект будет использовать их с различными моделями, которые мы пробуем.
Именно эта зависимость от данных и относительно ранняя стадия развития области ИИ/МО имеют решающее значение для того, чтобы почти 80% проектов терпят неудачу. Однако те реализации, которые доходят до конца и оказываются успешными, приносят огромные, измеримые преимущества.
Так как же сбалансировать желание использовать самые современные решения, использующие AI/ML, с явным страхом заниматься проектами, которые с большой вероятностью провалятся, да еще и принесут немалые затраты?
Ответ на этот вопрос правильно спроектированный процесс внедрения решений на основе ИИ, который разработан таким образом, чтобы максимально точно определить потребности и ожидания клиентов и минимизировать риск провала проекта.
В следующей части статьи мы представим основные этапы проекта внедрения решения на базе ИИ. Для лучшей иллюстрации воспользуемся примером.
Шаг 1 – знакомство с проблемой и ожиданиями клиента
В самом начале мы создаем бизнес-гипотеза (гипотетический бизнес-кейс), который будет проверен на следующем этапе процесса. На основе интервью с заказчиком, определяем задачу, определяем исходные допущения проекта и эффектов, которые удовлетворяли бы заказчика по качеству, а также удельный доход от инвестиций (ROI) – измеримая прибыль и выгоды. Определяем с заказчиком, какой эффект от ИИ-решения он считает успешным.
Стоит отметить, что преимущества не обязательно должны заканчиваться экономией в результате использования ИИ-решения в одном конкретном процессе (в нашем примере это будет процесс чтения документов).
В расчетах также следует учитывать косвенные выгоды – в результате того, что, например, люди, вовлеченные в процесс, которым теперь будет заниматься ИИ-решение, могут посвятить свое время другим задачам. Мы также можем искать прибыль в других местах в компании, в других процессах, которые будут косвенно улучшены за счет использования искусственного интеллекта.
После определения проблемы, ожидаемых результатов внедрения решения с использованием искусственного интеллекта и доступного клиенту бюджета мы представляем доступные варианты решения. Не все проблемы можно и нужно решать с помощью искусственного интеллекта..
Как мы уже упоминали, проекты с использованием ИИ обременены риском, поэтому мы всегда стараемся найти альтернативные решения это может работать лучше в данном случае. То, что клиент обращается к нам с идеей решить свою проблему с помощью искусственного интеллекта, еще не означает, что это лучший вариант. Из-за трудоемкости, стоимости и высокой неопределенности проектов ИИ мы рекомендуем такие реализации только в тех случаях, когда они действительно могут принести заказчику гораздо больше пользы, чем другие альтернативы.
Однако стоит отметить, что многое зависит от стратегии заказчика — одна компания может не решиться на использование ИИ, потому что сможет добиться аналогичной окупаемости инвестиций более традиционными средствами, а другая, несмотря на схожие условия, решит продолжить реализацию AI/ML, поскольку они рассмотрят престиж это связано с тем, что такое решение является важным фактором их бизнес-стратегии.
На шаге 1 также принимаем первоначальный взгляд на данные которые есть у клиента, которые позже будут использоваться для питания системы ИИ. Среди прочего, мы проверяем:
- сколько данных они имеют в своем распоряжении,
- как долго они собирали данные,
- с какой скоростью и в каких количествах его можно собирать.
В самом начале сотрудничества, в котором мы де-факто только осознаем тему, заказчик узнает:
- как выглядит процесс внедрения решения AI/ML,
- что Возможные результаты на каждом этапе процесса,
- какие потенциальные риски связаны с каждым из них.
Автоматизация процесса ввода данных, содержащихся в документах, в систему – пример
Проблема
У клиента есть большое количество документов (правовых актов) которые необходимо ввести в систему. Задача – прочитать соответствующую категории данных содержащиеся в правовых актах, т.е. имена владельцев или адреса собственности. На основе этих данных будет работать искусственный интеллект. Масштаб задачи настолько велик, что ручной ввод данных был бы очень трудоемким. трудоемкий а также кропотливый.
Шаг 1 – создание бизнес-гипотезы
Чтобы оценить, какое решение лучше для заказчика и стоит ли в данном случае внедрять решение на базе ИИ, мы рассмотрели, с какими типами и объемами данных мы имеем дело:
- Сколько страниц документов необходимо вводить в систему в месяц?
- Сколько атрибутов (категорий данных) необходимо заполнить для каждого документа?
- Как до сих пор выглядел процесс ввода данных документа?
- Сколько времени и работы было затрачено?
Мы посмотрели на альтернативные решения к той же проблеме и какова будет их экономическая эффективность по сравнению с решением на основе ИИ. Например, будет ли более рентабельным
- продолжить существующую практику ввода данных из документов в систему вручную?
- передать ввод данных специализированной внешней компании?
После расчета затрат, связанных с каждым из этих вариантов, и рассмотрения бюджета, клиент решил пойти с внедрением искусственного интеллекта.
Шаг 2 – Проверка бизнес-гипотезы из шага 1 и построение бизнес-кейса
Предположим, что после проверки первоначальных предположений, определения бюджета и начальной рентабельности инвестиций, а также рассмотрения альтернативных путей решения проблемы заказчик принимает решение о внедрении решения на основе искусственного интеллекта.
В этот момент начинается следующий этап (назовем его Шаг 2). Это все еще ранняя стадия проекта, на которой проверяются бизнес-гипотезы и предположения из шага 1. Мы все еще далеки от фактического построения решения ИИ.
На втором этапе мы создаем бизнес-кейс – бизнес-обоснование реализованного проекта, которое представляет предположения и рентабельность реализации. Мы также проверяем предварительная рентабельность инвестиций рассчитывается на предыдущем шаге — создании бизнес-гипотезы. Мы анализируем текущие затраты на проект и на основе этой информации определяем, можем ли мы вписаться в предполагаемый бюджет.
Природа проектов ИИ делает их сложно точно определить стоимость проекта. Однако такие попытки необходимы, поскольку бюджет является одним из факторов, сильно влияющих на решение о внедрении ИИ. Если у клиента нет достаточных средств, переход к последующим этапам проекта не имеет особого смысла.
Если ограниченный бюджет — единственное, что стоит на пути к полной реализации, другой вариант — использовать искусственный интеллект только в ограниченной степени. Таким образом, клиент остается в рамках бюджета и получает решение какой-то части своей проблемы. Такой выход может принести достаточно пользы, чтобы рассмотреть этот вариант.
На этом этапе клиент предоставляет нам данные, которые мы используем для создания прототипа модели ИИ и которые будут использоваться ИИ на этапе производства. Именно в этот момент мы оцениваем, какое значение имеют эти данные в контексте проблемы, которую мы пытаемся решить. Мы также определяем средства, которые мы будем использовать для извлечения ценности из этих данных, чтобы их можно было правильно использовать в решении ИИ.Если на данном этапе мы не уверены в этих средствах, проводим соответствующие тесты.
Для повышения шансов на успех проекта очень важно, чтобы заказчик позаботился не только о предоставлении большого объема данных, но и особенно данные хорошего качества. Распространено заблуждение, что больших объемов данных достаточно, чтобы модели ИИ работали хорошо.
Гораздо важнее качество этих данных. Очень важно, чтобы были отдельные рабочие места для людей, чья основная обязанность — проверять качество данных, которые будут использоваться в машинном обучении или моделях ИИ.
Что именно означает хорошее качество данных? Среди прочего важно, чтобы выборка была репрезентативной для всех собранных данных, чтобы в данных не было пробелов, чтобы они поступали из той же среды, что и данные, используемые в производственной среде, и чтобы данные не обрабатывались. (обработанные данные могут нести меньше информации, чем исходные данные).