Индуктивный алгоритм обучения
Индуктивный алгоритм обучения (ILA) — это итеративный и индуктивный алгоритм машинного обучения, который используется для генерации набора правил классификации, который создает правила формы «ЕСЛИ-ТО» для набора примеров, создавая правила на каждой итерации и добавление к набору правил. Основная идея: В основном есть два метода извлечения знаний: сначала от экспертов в предметной области, а затем с помощью машинного обучения. Для очень большого объема данных эксперты предметной области не очень полезны и надежны. Поэтому мы движемся к подходу машинного обучения для этой работы. Использование машинного обучения. Один из методов — воспроизвести логику экспертов в виде алгоритмов, но эта работа очень утомительна, занимает много времени и стоит дорого. Таким образом, мы движемся к индуктивным алгоритмам, которые сами генерируют стратегию выполнения задачи и не нуждаются в отдельных инструкциях на каждом этапе. Необходимость ILA при наличии других алгоритмов машинного обучения: ILA — это новый алгоритм, который был необходим даже тогда, когда были доступны другие методы обучения с подкреплением, такие как ID3 и AQ.
- Необходимость была вызвана подводными камнями, которые присутствовали в предыдущих алгоритмах, одним из основных подводных камней было отсутствие обобщения правил.
- ID3 и AQ использовали метод создания дерева решений, который был слишком специфичным, его было трудно анализировать, и он был очень медленным для решения основных задач короткой классификации.
- Алгоритм на основе дерева решений не мог работать для новой задачи, если некоторые атрибуты отсутствовали.
- ILA использует метод создания общего набора правил вместо деревьев решений, которые преодолевают вышеуказанные проблемы.
АЛГОРИТМ ILA: Общие требования при запуске алгоритма: —
- перечислите примеры в виде таблицы «Т», где каждая строка соответствует примеру, а каждый столбец содержит значение атрибута.
- создайте набор из m обучающих примеров, каждый из которых состоит из k атрибутов и атрибута класса с n возможными решениями.
- создать набор правил R с начальным значением false.
- изначально все строки в таблице не помечены.
Шаги в алгоритме: — Шаг 1: разделить таблицу «T», содержащую m примеров, на n подтаблиц (t1, t2,…..tn). Одна таблица для каждого возможного значения атрибута класса. (повторите шаги 2-8 для каждой подтаблицы) Шаг 2: Инициализируйте счетчик комбинаций атрибутов ‘ j ’ = 1. Шаг 3: Для подтаблицы, над которой ведется работа, разделите список атрибутов на отдельные комбинации, каждая комбинация с «j» отдельными атрибутами. Шаг 4: Для каждой комбинации атрибутов подсчитайте количество вхождений значений атрибутов, которые появляются под одной и той же комбинацией атрибутов в непомеченных строках рассматриваемой подтаблицы и в то же время не появляются под той же комбинацией атрибутов другой подтаблицы. -столы. Назовите первую комбинацию с максимальным количеством вхождений максимальной комбинацией ‘ MAX’. Шаг 5: Если «MAX» = = null, увеличьте «j» на 1 и перейдите к шагу 3. Шаг 6: Отметьте все строки подтаблицы, в которых работают, в которых появляются значения «MAX», как классифицированные. Шаг 7: Добавьте правило (ЕСЛИ атрибут = «XYZ» -> ТО решение ДА/НЕТ) в R, чья левая часть будет иметь имена атрибутов «МАКС» со значениями, разделенными И, а его правая часть содержит значение атрибута решения, связанное с подтаблицей. Шаг 8: Если все строки отмечены как классифицированные, перейдите к обработке другой подтаблицы и перейдите к шагу 2. В противном случае перейдите к шагу 4. Если подтаблицы недоступны, выйдите с набором правил, полученным до этого момента. Пример, показывающий использование ILA предположим, что набор примеров имеет атрибуты Тип места, погода, местоположение, решение и семь примеров. Наша задача состоит в том, чтобы сгенерировать набор правил, определяющих, при каких условиях принимается решение.
Пример № | Тип места | погода | расположение | решение |
---|---|---|---|---|
я) | холмистый | зима | куллу | Да |
II) | гора | ветреный | Мумбаи | Нет |
3) | гора | ветреный | Шимла | Да |
IV) | пляж | ветреный | Мумбаи | Нет |
В) | пляж | тепло | Гоа | Да |
VI) | пляж | ветреный | Гоа | Нет |
VII) | пляж | тепло | Шимла | Да |
шаг 1 подмножество 1
с.но | тип места | погода | расположение | решение |
---|---|---|---|---|
1 | холмистый | зима | куллу | Да |
2 | гора | ветреный | Шимла | Да |
3 | пляж | тепло | Гоа | Да |
4 | пляж | тепло | Шимла | Да |
подмножество 2
с.но | тип места | погода | расположение | решение |
---|---|---|---|---|
5 | гора | ветреный | Мумбаи | Нет |
6 | пляж | ветреный | Мумбаи | Нет |
7 | пляж | ветреный | Гоа | Нет |
шаг (2-8) на итерации 1 выбрана погода в столбцах 3 и 4, а отмечены строки 3 и 4. в R добавлено правило ЕСЛИ погода теплая, то решение — да. на итерации 2 Выбран тип места столбца строки 1, а строка 1 отмечена. правило добавляется в R, ЕСЛИ тип места холмистый, то решение — да. на итерации 3 Расположение столбца строки 2 выбрано, а строка 2 отмечена. правило добавляется в R, если местоположение — Шимла, то решение — да. на итерации 4 Расположение столбца строки 5 и 6 выбрано, а строки 5 и 6 отмечены. правило добавляется в R, если местонахождение Мумбаи, то решение — нет. на итерации 5 выбран тип места столбца строки 7 и погода, а строка 7 отмечена. Правило добавляется в R, ЕСЛИ тип места — пляж И погода ветреная, то решение — нет. наконец, мы получаем набор правил: — Набор правил
- Правило 1: ЕСЛИ погода теплая, ТО решение да.
- Правило 2: ЕСЛИ тип места холмистый, ТО решение да.
- Правило 3: ЕСЛИ местоположение Шимла, ТО решение да.
- Правило 4: ЕСЛИ место Мумбаи, ТО решение НЕТ.
- Правило 5: ЕСЛИ тип места пляж И погода ветреная, ТО решение НЕТ.