61 просмотров

Понимание функций в ИИ

Каждое преобразование данных, которое мы делаем в искусственном интеллекте, направлено на преобразование входных данных в наиболее репрезентативный формат, необходимый для задачи, которую мы стремимся решить… Это преобразование выполняется с помощью функций.

Модель машинного обучения преобразует входные данные в осмысленные выходные данные. Процесс, который «научился” от знакомства с известными примерами входов и выходов.

Таким образом, ML-модель «учится а функция» который сопоставляет свои входные данные с ожидаемым выходом.

f (x) = y_шляпа

Таким образом, центральная проблема в машинном обучении и глубоком обучении заключается в осмысленном преобразовании данных: другими словами, в изучении полезных представлений имеющихся входных данных — представлений, которые приближают нас к ожидаемому результату… (Франсуа Шолле)

Давайте рассмотрим игрушечный пример…

У нас есть таблица с несколькими точками данных, некоторые из которых относятся к «белому» классу, а другие — к «черному».Когда мы рисуем их, они выглядят так…

Как видите, у нас есть несколько черных и белых точек. Допустим, мы хотим обучить алгоритм машинного обучения, который может принимать координаты (х, у) точки и вывести, является ли эта точка черной (класс 0) или белой (класс 1).

Нам нужно как минимум 4 вещи

  • Входные данные в данном случае(х, у) координаты каждой точки
  • Соответствующий выходы или цель (черный или белый)
  • Способ измерения производительности, скажем, метрика как точность.
  • Алгоритм, который соответствует задаче, скажем, типа Логистическая регрессия.

В конечном счете, то, что нам нужно здесь, — это новое представление наших данных из модели, которое четко отделяет белые точки от черных точек. Период!

Статья в тему:  Как продавать искусственный интеллект компаниям

Это новое представление может быть как простым, как изменение координат, так и сложным, как применение полиномиальной, рациональной или комбинации логарифмических, тригонометрических и экспоненциальных функций к исходным данным.

Предположим, что после некоторой оптимизации и удачи наш алгоритм выучил 3-е представление выше, которое удовлетворяет правилу:

0, белые точки имеют значения ≤ 0>

Это означает, что наша модель изучила представление наших данных, которое можно обозначить как ‘функция’ ( ф из Икс, написано как ф(Икс)), который сопоставляет входные данные с выходной целью таким образом, что:

е (х) = 0 ("Черный", если х > 0)

е (х) = 1 ("Белый", если х ≤ 0)

Будем надеяться, что с помощью этой функции модель сможет обобщить и классифицировать будущие невидимые данные о черных и белых точках.

Так что, черт возьми, такое функция на самом деле?

Представьте, что вы находитесь в курьерской службе во Флориде, США, и отправляете посылку. Икс, в место в Сиднее, Австралия… Агент вводит вес посылки Wx и расстояние Дх из Флориды в Сидней и пишет вам плату С, от 500 долларов.

Это просто означает заряд С 500 долларов, это функция расстояния Дх и вес Wx посылки Икс.

Далее предположим, что калькулятор стоимости просто применяет скрытую функцию. ЧАС, на расстояние и вес любой посылки, чтобы получить заряд.

Вся эта транзакция может быть записана как функция е(х) так что:

Статья в тему:  В чем проблемы искусственного интеллекта

f(x) = H(Dx, Wx)

Другими словами, С данный Икс является результатом функции е(х), который выполняет скрытую функцию ЧАС, который применяет некоторые вычисления к Дх а также Wx.

Это то же самое, что:

С = Н(Дх, Шх)

Что то же самое, что:

$500 = Скрытая_функция(Расстояние-посылки-x, Вес посылки-x)

Таким образом, понятие функций вездесуще, а функции окружают нас повсюду. Мы можем представить несколько конструкций через функции. Например, можно сказать, что…

Хорошая жизнь – это функция здорового образа жизни и богатства

Если мы обозначим час для здорового образа жизни и ж для богатства и Икс для хорошей жизни мы можем нетривиально записать это отношение как:

f (х) = ч + ш

Немного вычислений…

Исчисление — это математика, описывающая изменения в функциях…

Функции, необходимые для изучения исчисления:

Не углубляясь в исчисление, давайте посмотрим на определение функции:

Функция — это отношение особого типа, в котором каждый элемент первого множества (домен) относится ровно к одному элементу второго множества (диапазон).
Для любой функции, когда мы знаем вход, результат определен, поэтому мы говорим, что выход функции является функцией входа.

Например, область квадрата определяется длиной его стороны, поэтому мы говорим, что область (выход) является функцией длины его стороны (ввод).

Для любой функции, когда мы знаем вход и правило, выход определен, поэтому мы говорим, что выход функции является функцией входа.

Это просто означает, что любая заданная функция ф состоит из набора входов (домен), набор выходов (диапазон), и правило для назначения каждого входа ровно одному выходу.

Статья в тему:  Как искусственный интеллект связан с сенсорными экранами

Функция сопоставляет каждый элемент в домене ровно с одним элементом в диапазоне.Хотя каждый вход может быть отправлен только на один выход, два разных входа могут быть отправлены на один и тот же выход (см. 3 и 4, сопоставленные с 2 выше).

Вещественные, натуральные и отрицательные числа:

Давайте быстро освежим наши знания вышеизложенного, так как невозможно выполнять какие-либо действия в ИИ без чисел…

1. Реальные числа:

Множество действительных чисел — это множество чисел в пределах от отрицательной бесконечности до бесконечности.

В интервальной записи это можно записать как Икс является действительным числом, если Икс внутри:

(-инф, инф): меньше отрицательной бесконечности и меньше бесконечности

Набор вещественных чисел — это надмножество всех видов чисел, от дробей до чисел с плавающей запятой и отрицательных и положительных чисел произвольного размера.

2. Натуральные числа:

Набор натуральных чисел — это набор положительных чисел из диапазона (0, бесконечность)

[, инф): включает 0, но меньше бесконечности.

Икс|0≤ х>: х, учитывая, что 0 ≤ х

3. Отрицательные числа:

Множество отрицательных чисел — это множество всех чисел, меньших 0

(-инф, 0): Меньше отрицательной бесконечности и меньше 0.

Изучение домена и диапазона функций:

Учитывая некоторую функцию, как мы можем определить ее домен а также диапазон? Как мы можем выяснить, какие допустимые входные данные может принимать такая функция и какие допустимые выходные данные она может производить?

Статья в тему:  Какие предсказания за последние 60 лет об искусственном интеллекте

Функция первая:

е (х) = макс (0, х)

Приведенное выше выражение означает, что для любого заданного входа Икс, функция возвращает максимальное значение между а также Икс.

Без дальнейших ограничений мы можем считать, что Икс любое заданное число такое, что:

Следовательно домен этой функции является набор действительных чисел. А так как выход этой функции минимум и максимум любого заданного числа, мы можем обозначить диапазон этой функции как множество Натуральные числа [0, инф) или .

График функции:

Давайте построим приведенную выше функцию, используя диапазон чисел от -10 до 10.

Функция, которую мы изучали, является популярной Выпрямленная-линейная-единица. АКА Функция активации Relu. Relu очень простой, но очень мощный.

Возможно, кульминацией Relu является его успешное применение для обучения глубоких многослойных сетей с нелинейной функцией активации с использованием обратного распространения… Ссылка

Функция вторая:

Приведенное выше выражение означает, что для любого заданного входа Икс, функция возвращает квадратный корень из (х + 3) + 1.

Чтобы найти домен, нам нужно обратить внимание на правило функции. Здесь у нас есть квадратный корень функционировать как часть правила. Так что это автоматически сообщает нам выражение в пределах квадратный корень должно иметь минимальное значение 0. Поскольку мы не можем найти квадратный корень из отрицательных чисел.

Итак, чтобы найти домен, мы должны спросить… Какое значение Икс мы должны добавить к 3 чтобы получить как минимум ?

Статья в тему:  Как квантовые компьютеры помогают искусственному интеллекту

х + 3 = 0… Следовательно: х = -3

Следовательно домен функции Икс| х ≥ -3>, или же [-3, инф).

С помощью правила и домена мы можем легко найти диапазон. Если подставить минимальное значение -3 в качестве Икс. Тогда функция будет оцениваться как sqrt из , который , плюс 1, который 1. Следовательно диапазон является [1, инф) или же <>≥ 1>.

Для любой функции, когда мы знаем вход и правило, выход определен, поэтому мы говорим, что выход функции является функцией входа.

Функция третья:

Приведенное выше выражение означает, что для любого заданного входа Икс, функция возвращает 1/(1 + е, возведенный в минус Икс), куда е это число Эйлера = 2.71828.

Так как же нам вычислить область определения этой функции?

Глядя на функцию, мы видим, что Икс на самом деле экспонента, чья база является е. Следовательно Икс на самом деле может принимать любое значение независимо. Это потому, что домен из экспоненциальная функция на самом деле является набором всех действительных чисел, если база не является и != 1.

Так что насчет диапазона?

Понимание того, что домен может принимать любое значение, приводит нас к правило. Первое, что мы замечаем, это показатель отрицательного Икс. Поскольку показатель является 1, показатель степени отрицательного числа должен быть в пределах [0, 1).

Итак, если экспоненциальная часть возвращается , мы получаем 1 / (1 +0) = 1. Если он возвращает любое другое значение в, куда < v 1, мы получаем 1 / (1 + в) => некоторое значение (0, 1).

Статья в тему:  Как Alphabet использует искусственный интеллект, чтобы изменить опыт клиентов

Следовательно диапазон является (0, 1] или

Ага! функция, которую мы только что исследовали, — это Сигмовидная функция активации, это шляпа, которую мы кладем на Линейная регрессия функция для преобразования его в Логистическая регрессия функция подходит для Двоичная классификация задачи.

Построение сигмоиды:

Подробнее о сигмовидной:

y_шляпа = w1x1 + w2x2 + b

Приведенное выше уравнение обозначает множественная линейная регрессия с 2 переменными х1 а также х2, умноженный на вес w1 а также w2 плюс предвзятость б. Если мы конвертируем т_шляпа от непрерывного числа, такого как температура, вес и т. д., до дискретного двоичного числа, например [0, 1] обозначая два класса, мы можем просто применить сигмовидная функционировать, чтобы т_шляпа, установить порог, как 0.5 разграничить оба класса, и у нас есть полностью функциональный Модель логистической регрессии (log_reg).

log_reg = сигмоид (т_шляпа)… => Сигмоид(w1x1 + w2x2 + б)

Кроме того, мы можем легко расширить сигмовидная функция для Функция софтмакс.

Softmax идеально подходит для многоклассовой классификации. В softmax мы вычисляем показатель степени (е повышен до [у1, у2…у5]) для каждого выходного класса.

Если у нас есть 5 классов, у нас есть вектор из 5 элементов, [у1, у2у5]

Итак, складываем все показатели и делим каждый показатель на общую сумму показателей. Это дает 5 различных вероятностей, которые в сумме дают 1.0. Значение с наивысшей оценкой вероятности становится прогнозом (т_шляпа)

Функция четвертая:

Приведенное выше выражение означает, что для любого заданного входа Икс, функция возвращает значение 3 / (Икс-2).

Статья в тему:  Как инстаграм использует искусственный интеллект

Итак, как же определить область определения этой функции? Другими словами, какие значения Икс сделает это выражение действительным?

Без каких-либо других ограничений, Икс должен быть в состоянии взять на себя любой Настоящий номер кроме 2. Это потому что 3 / (2–2) является незаконным и вызовет ZeroDivisionError.

Следовательно домен является (Икс != 2), или же Икс| Икс != 2>.

Чтобы найти диапазон, нам нужно найти значения у такое, что существует действительное число Икс в домене со свойством, которое (3 / (Икс+2)) = у.

С Икс может быть любым действительным числом, кроме 2. А также 3 разделить на (любое действительное число плюс 2) не может быть равно .

Поэтому диапазон (у != 0) или же у| у != 0>.

Резюме

Последний пример выше был довольно сложным, но он следует той же общей схеме поиска легальных элементов домена на основе правила. Затем сопоставьте эти элементы с диапазоном.

Функции чрезвычайно важны для программирования в целом и ИИ в частности. Когда мы собираем модели, импортируем библиотеки с множеством других функций или пишем свои по мере необходимости. Давайте осознавать домен, правило а также диапазон наших функций. Прикрепите удобочитаемую строку документации к каждой функции, за исключением того, что имя и имена переменных не требуют пояснений.

Спасибо за ваше время.

Ваше здоровье!

Кредит:

Обо мне:

Лоуренс — специалист по данным в Tech Layer, увлеченный честным и объяснимым искусственным интеллектом и наукой о данных. Я держу оба Специалист по науке о данных а также Продвинутый специалист по науке о данных сертификаты IBM. и Udacity AI Наноградус. Я провел несколько проектов с использованием библиотек ML и DL, я люблю как можно больше кодировать свои функции, даже когда существующих библиотек предостаточно. Наконец, я никогда не прекращаю учиться, исследовать, получать сертификаты и делиться своим опытом с помощью проницательных статей…

Не стесняйтесь найти меня на: —

Статья в тему:  В чем разница между искусственным интеллектом и экспертной системой

«Понимание функций в ИИ» изначально было опубликовано в журнале «Навстречу ИИ» на Medium, где люди продолжают обсуждение, выделяя и отвечая на эту историю.

голоса
Рейтинг статьи
Ссылка на основную публикацию
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x