Простой способ объяснить, как построить систему ИИ
В моем предыдущем блоге это объясняет, как машины учатся (насколько это возможно).
В этом блоге мы рассмотрим как построить систему ИИ. Точно так же мы не будем погружаться в технические детали, так как блог написан для понимания основы.
Создание системы искусственного интеллекта отличается от традиционного компьютерного программирования, когда программное обеспечение не самосовершенствуется автоматически.
Принципы хорошего ИИ-движка:
Кроме того, важно понимать, что создание систем ИИ стало не только меньше сложный но и многое более дешевый. Одним из примеров является машинное обучение Amazon. Это помогает автоматически классифицировать продукты в вашем каталоге, используя данные описания продукта в качестве обучающего набора.
Популярные статьи об ИИ:
Дело в точке: Представьте, что вы потратили 20 часов вычислительного времени на создание своих моделей и получили 890 000 прогнозов в реальном времени за один месяц. Это обошлось бы вам всего в 100 долларов.
Чтобы охватить этот короткий текст, мы сосредоточимся на машинном обучении (ML), поскольку это область, которая получает большинство приложений. Следует отметить один важный момент: хорошее понимание статистики — полезное начало в ИИ.
Этапы разработки системы ИИ
- Определите проблему.
- Подготовьте данные.
- Выберите алгоритмы.
- Тренируйте алгоритмы.
- Выберите определенный язык программирования.
- Запуск на выбранной платформе.
1. Определите проблему
Прежде всего, самые важные вопросы, которые следует задать: (1) «что вы пытаетесь решить для?” (2) “Каков желаемый результат?”
Однако мы должны постоянно напоминать себе, что ИИ не может быть панацеей в себе. Это инструмент, а не само решение. Существует несколько методов и множество различных проблем, которые необходимо решить с помощью ИИ.
Подумайте об этой аналогии, которая помогает объяснить вышесказанное. Если вы хотите приготовить вкусное блюдо, вы должны точно знать, что вы собираетесь готовить, и все ингредиенты, которые вам понадобятся.
2. Подготовьте данные
Мы должны смотреть на данные. Данные делятся на две категории, структурированный а также неструктурированный.
Структурированные данные соответствует жесткому формату, чтобы обеспечить согласованность в обработке, а также простоту аналитики. то есть запись клиента с именем, фамилией, датой рождения, адресом и т. д.
Неструктурированные данные все остальное.Данные хранятся в неоднородном шаблоне. Он может включать аудио, изображения, изображения, слова и инфографику. — примеры, такие как электронная почта, телефонный разговор, сообщение WhatsApp, WeChat.
Одной из величайших полезностей и достижений искусственного интеллекта было предоставление компьютерам возможности анализировать неструктурированные данные и получать доступ к гораздо большей вселенной информации, чем к миру структурированных данных.
Часто мы думаем, что ключевыми элементами ИИ являются сложные алгоритмы. Но на самом деле наиболее важной частью наборов инструментов ИИ является очистка данные. Для специалистов по данным вполне нормально тратят 80% своего времени на уборку, перемещать, проверять, организовывать данные еще до фактического использования или написания единого алгоритма.
Предприятия и крупные фирмы имеют массивные проприетарные базы данных. Данные могут быть не готовы для ИИ, и очень часто данные хранятся в разрозненных хранилищах. Это может привести к дублированию информации, некоторые из которых могут совпадать, некоторые могут противоречить. Хранилища данных могут в конечном итоге ограничить фирму в получении быстрой информации из своих внутренних данных.
Перед запуском моделей мы должны убедиться, что данные были организованы и очищены. На практике нам приходится проверять согласованность, определять хронологический порядок, добавлять метки там, где это необходимо, и так далее.
В общем, чем больше мы обрабатываем данные, тем больше у нас шансов получить результат для решения поставленной нами задачи.
3. Выберите алгоритм
Мы не будем вдаваться в технические подробности (выходящие за рамки этого письма), но важно, по крайней мере, понимать различные распространенные типы алгоритмов, которые также зависят от выбранного вами типа обучения.
По сути, классификация — это предсказание метки, а регрессия — предсказание количества.
Примером использования алгоритма классификации, вероятно, будет сценарий, если вы хотите понять, существует ли вероятность дефолта по кредиту.
Примером использования алгоритма регрессии, вероятно, будет сценарий, если вы хотите количественно оценить ожидаемые убытки по этим просроченным кредитам. В этом контексте вы ищете ценность. Какую сумму в долларах я ожидаю потерять в случае неуплаты кредита?
Как только мы определили проблему, мы можем выбрать алгоритм.
Эти примеры упрощены и на практике далеки от реальности. Существуют и другие алгоритмы, которые мы можем выбрать в контролируемом обучении, такие как случайный лес, наивная байесовская классификация, Машина опорных векторов а также логистическая регрессия.
Тем не менее эти примеры помогут вам понять типы алгоритмов в ИИ.
2. Неконтролируемое обучение и обучение с подкреплением
Типы алгоритмов были бы разными, и мы могли бы классифицировать их по нескольким различным категориям, таким как кластеризация, когда алгоритм пытается сгруппировать объекты вместе, ассоциация, когда он находит связи между объектами, уменьшение размерности, когда он уменьшает количество переменных для уменьшения шума.
4. Обучите алгоритмы
После выбора алгоритмов нам нужно обучить модель, где мы вводим данные в модель. Важным шагом здесь является точность модели. Хотя общепринятых или интернационализированных пороговых значений не существует, жизненно важно установить точность модели в рамках вашей системы выбора. Установка минимально приемлемого порога и применение большой статистической дисциплины являются ключевыми, мы должны переобучить модель, поскольку вполне естественно, что модели могут нуждаться в некоторой тонкой настройке. Рассмотрим событие, при котором предсказуемость модели снижается. Поэтому вам необходимо переработать модель и проверить все различные шаги, которые мы упоминали ранее.
5. Итак, какой язык программирования лучше всего подходит для ИИ?
Короткий ответ: это зависит от ваших потребностей и множества факторов. Как вы знаете, существует множество языков программирования, от классического C++ и Java до Python и R.Python и R являются более популярными языками программирования, поскольку они предлагают пользователям мощный набор инструментов, включая обширные библиотеки машинного обучения. Одной из очень полезных библиотек является NLTK — набор инструментов на естественном языке, написанный на Python вместо того, чтобы программировать все это самостоятельно.
6. Выбранные платформы
Выберите платформу, которая предоставляет все услуги, вместо того, чтобы покупать собственный сервис, базу данных и т. д.
Готовая платформа — машинное обучение как услуга — была одной из самых полезных частей инфраструктуры, которая способствовала распространению машинного обучения. Эти платформы созданы для упрощения и облегчения машинного обучения, часто предлагают расширенную облачную аналитику, которую можно использовать с несколькими алгоритмами и несколькими языками.
Быстрое развертывание также является ключом к успеху MLaS. Платформы обычно помогают с такими проблемами, как предварительная обработка данных, обучение модели, прогнозирование оценки, но они различаются, и некоторые предварительные оценки являются ключевыми.
От писателя: Подпишитесь на мой блог, чтобы не пропустить последний блог. Я веду блог о технологиях, которые мне нравятся (не обо всех технологиях), устойчивом развитии, менеджменте и пути предпринимателя! Не стесняйтесь хлопать в ладоши за мой блог, который вам понравился. Продолжать вести свой блог — это источник вдохновения и энергии!