66 просмотров

Задавайте правильные вопросы: как машинное обучение улучшает ваши знания

Хороший специалист по данным немного похож на хорошего журналиста: он умеет задавать вопросы так точно и так, что не может быть расплывчатого, вводящего в заблуждение ответа. Наука о данных заключается в том, чтобы задавать эти острые, конкретные вопросы о ваших данных, и методы, используемые в машинном обучении, ведут вас к этим четким ответам, требуя, чтобы вы точно выяснили, что именно вы хотите знать, прежде чем начать.

Чем искусственный интеллект и машинное обучение отличаются от бизнес-аналитики?

Пока революция в науке о данных не изменила правила игры, большинство компаний использовали аналитику данных или бизнес-аналитику (BI), чтобы задавать критические вопросы о своей эффективности.

Платформа науки о данных

BI — отличный инструмент, который можно использовать, когда вы хотите проанализировать исторические тенденции и выяснить, насколько хорошо вы справлялись в прошлом. Это полезная отправная точка для обоснования вашего решения продолжать делать то же самое или предупредить вас о том, что вы должны попробовать что-то еще. Это здорово, когда вы хотите превратить огромные наборы данных в отчеты, информационные панели и визуализации, которые вы можете понять.

BI также обладает некоторыми возможностями прогнозирования, хотя и ограниченными: вы можете извлекать полезные идеи и шаблоны из прошлого, которые помогают вам принимать более разумные решения. По крайней мере, при условии, что более широкий бизнес-контекст на самом деле не изменился. Если сейчас все сильно отличается от того, что было год назад, эти идеи будут ограничены.

Статья в тему:  Что такое вселенная, расширяющаяся в reddit

Это главная проблема с BI: он позволяет вам смотреть только назад. Вы можете получить ответы на заранее заданные вопросы, но вы не можете погрузиться в неизвестность и выяснить, что может сработать, если вы не пробовали это раньше и не преуспели. Чтобы действительно продвинуться вперед, вам нужно смотреть вперед — и здесь на помощь приходит машинное обучение (и автоматизированное машинное обучение).

Как лучше задавать вопросы с помощью ИИ и машинного обучения

В отличие от анализа данных, используемого в BI, алгоритмы машинного обучения представляют собой сложные математические модели, которые используют исторические данные для прогнозирования будущих результатов. Эти модели часто объединяют данные из нескольких источников для выявления закономерностей и возникающих тенденций с гораздо большей точностью и чувствительностью к множеству внешних факторов, чем может когда-либо достичь BI. Это означает, что вы действительно принимаете решения на основе данных — не просто экстраполируя опыт прошлого, а моделируя сценарии, которых еще не было. Это помогает во всем: от принятия решения о том, можно ли доверять клиенту кредит, до прогнозирования того, какие сегменты вашей клиентской базы будут определенным образом реагировать на предлагаемую рекламную кампанию.

Более того, машинное обучение становится все более доступным.По мере того, как все больше и больше организаций получают возможность воспользоваться преимуществами, не нанимая огромную команду специалистов по данным, становится все более очевидным, что автоматизированное машинное обучение сделает BI излишним для многих. Тем не менее, наука о данных, искусственный интеллект и машинное обучение могут дать вам ценные ответы только в том случае, если вы знаете, какие вопросы задавать в первую очередь.

Какие вопросы вы можете задать с помощью машинного обучения?

Статья в тему:  Почему вырубка лесов может способствовать глобальному потеплению

Классифицировать входящие данные

Классификация данных позволяет выяснить, принадлежат ли они к предопределенной группе, предсказывающей тот или иной результат. Например, вы можете задать вопрос «Какова вероятность того, что этот клиент совершит покупку?». С точки зрения машинного обучения, вы на самом деле спрашиваете: «Указывает ли профиль/поведение этого клиента на черты, которые мы обычно видим у других в категории покупателей?»

Классификация также может быть использована для идентификации аномалии а вместе с этим подозрительное поведение. Таким образом, это помогает ответить на такие вопросы, как «Мошенническая ли это транзакция?» или «Это кибератака?»

Проверить гипотезу

Это способ исследования результатов ваших данных применительно к новой ситуации. Например: «Если мы упомянем еду в теме письма, будет ли открываться больше писем?»

Выберите и определите функцию

Выбор признаков — это способ точно определить, какой именно аспект данных предсказывает определенный результат. Это особенно полезно для распознавания лиц и других типов обработки изображений. Например: «Нарушает ли этот тип фотографии нашу политику сообщества?»

Предсказать сценарий

С прогнозированием сценариев вы анализируете несколько будущих результатов в разных условиях. Это означает, что вы можете создать множество возможных сценариев, предсказывая, что произойдет в каждом из них. Например: «Сэкономим ли мы деньги, если сократим одну из наших продуктовых линеек?» или «Повлияет ли изменение конкретной цены на наши доходы от этих рекламных акций?»

Статья в тему:  Почему пролог используется в искусственном интеллекте

Определите стратегию оптимизации

Это вопросы, связанные с вопросами минимизации и максимизации — те, которые кажутся простыми вопросами, но на самом деле на них очень сложно ответить, и необходимо учитывать множество сопутствующих факторов. Например : «Каким маршрутом должны следовать наши водители доставки?»

Кластеризация наблюдений

Кластеризация — это способ категоризации данных на основе коллекций общих наблюдений. Например, вопрос может быть таким: существуют ли определенные «типы» людей, которые делятся нашими сообщениями на Facebook?

Снижение размерности

Это способ свести сложные данные к наиболее важным ключевым показателям, чтобы выявить тенденции и сделать прогнозы на будущее. Например, это может помочь ответить на вопрос «Какая из этих книг станет бестселлером?».

Заключительные мысли: формулировка ваших вопросов

ИИ и машинное обучение могут быть развернуты по всей воронке с огромными преимуществами для вашего бизнеса, но понять, как сформулировать ваши вопросы, — это полдела. Важно понимать, какие вопросы можно задавать по данным, чтобы вы могли перевести их в модели машинного обучения. Также важно убедиться, что выбранные вами наборы данных подходят для этих вопросов, а если нет, то что вы думали о том, где получить высококачественные внешние данные, необходимые для работы этих моделей машинного обучения. Вы можете получить ответы, которые вам нужны, вам просто нужно быть умным в вопросах, которые вы задаете.

голоса
Рейтинг статьи
Статья в тему:  Как защитить свой дом от радиоактивных осадков
Ссылка на основную публикацию
Статьи c упоминанием слов:

0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x