Что такое среда задач в искусственном интеллекте
и еще 3 присоединились минуту назад.
51 тыс. просмотров
Свойства среды задач.
написано 3.3 года назад пользователем teamques10 39к | изменено 12 месяцев назад пользователем binitamayekar 5,5к |
ДОБАВИТЬ КОММЕНТАРИЙ ПОДЕЛИТЬСЯ РЕДАКТИРОВАТЬ
2 ответа
3,6 тыс. просмотров
написано 3.3 года назад пользователем teamques10 39к |
Мы можем определить довольно небольшое количество измерений, по которым можно классифицировать задачи.
1] Полностью наблюдаемый против частично наблюдаемого.
Если сенсоры агентов дают ему доступ к полному состоянию среды в каждый момент времени, то мы говорим, что среда задачи полностью наблюдаема. Среда задачи эффективно полностью наблюдаема, если датчики обнаруживают все аспекты, которые имеют отношение к выбору действия, релевантность зависит от показателя производительности. Полностью наблюдаемые среды удобны тем, что агенту не нужно поддерживать какое-либо внутреннее состояние, чтобы отслеживать мир. Окружающая среда может быть частично наблюдаемой из-за шумных и неточных датчиков, отсутствующих в данных датчиков.
Пример: Вакуумный агент только с локальным датчиком загрязнения не может сказать, есть ли грязь в других квадратах.
2] Детерминированный против стохастического.
Если следующее состояние среды полностью определяется текущим состоянием и действием, выполняемым агентом, то мы говорим, что среда детерминирована, в противном случае она является стохастической.
3] Эпизодический против последовательного.
В среде с эпизодическими задачами опыт агента делится на атомарные эпизоды, каждый из которых состоит из того, что агент воспринимает, а затем выполняет одно действие. Важно отметить, что следующий эпизод не зависит от действий, предпринятых в предыдущих эпизодах. В эпизодической среде выбор действия в каждом эпизоде зависит только от самого эпизода. Многие задачи классификации являются эпизодами.
Пример: Агент, который должен обнаруживать дефектные детали на сборочной линии, основывает каждое решение на текущей детали, независимо от предыдущих решений, более того, текущее решение не влияет на дефектность следующей детали. В последовательных средах текущее решение может повлиять на все будущие решения.
Пример: Шахматы и вождение такси являются последовательными, и в обоих случаях краткосрочные действия могут иметь долгосрочные последствия.
Эпизодическая среда намного проще, чем последовательная, потому что агенту не нужно думать наперед.
4] Статика против динамики.
Если среда может изменить белый цвет, который обсуждает агент, то мы говорим, что среда является динамической для этого агента, в противном случае она статична. Со статической средой легко иметь дело, потому что агенту не нужно постоянно смотреть на мир, пока он принимает решение о действии, и ему не нужно беспокоиться о течении времени. Динамические среды постоянно спрашивают агента, что он хочет делать, если он еще не решил, это считается решением ничего не делать. Если сама среда не меняется с течением времени, но изменяется показатель производительности агентов, то мы говорим, что среда является полудинамической.
Пример: Вождение такси явно динамично, другие автомобили и само такси продолжают двигаться, пока алгоритм вождения колеблется, что делать дальше.Шахматы с часами представляют собой полудинамический кроссворд, а головоломки статичны.
5] Дискретный и непрерывный.
Различие между дискретным и непрерывным может быть применено к состоянию окружающей среды, к тому, как обрабатывается время, а также к восприятию и действиям агента.
Пример: Среда с дискретным состоянием, такая как игра в шахматы, имеет конечное количество различных состояний, шахматы также имеют дискретный набор восприятий и действий.
Вождение такси — это проблема непрерывного состояния и непрерывного времени: скорость и местоположение такси и других транспортных средств проходят через диапазон непрерывных значений и, в частности, гладко во времени. Действия таксиста также непрерывны. Вход с цифровых камер является дискретным.
6] Один агент против нескольких агентов.
Различие между средой с одним агентом и средой с несколькими агентами может показаться достаточно простым.
Пример: Очевидно, что агент, решающий кроссворд в одиночку, находится в среде с одним агентом, а шахматы — в среде с двумя агентами. Chess — это соревновательная многоагентная среда. В условиях вождения такси предотвращение столкновений максимизирует эффективность. Из всех агентов, так это частично кооперативная многоагентная среда.
Среда задач | Наблюдаемый | Определяет | Эпизодический | Статический | Дискретный | Агент |
---|---|---|---|---|---|---|
Кроссворд | От корки до корки | Определяет | Последовательный | Статический | Дискретный | Одинокий |
шахматы с часами | От корки до корки | Стратегический | Последовательный | Статический | Дискретный | Мульти |
Покер | Частично | Стратегический | Последовательный | Статический | Дискретный | Мульти |
Нарды | От корки до корки | Стохастический | — | Статический | Дискретный | Мульти |
Вождение такси | Частично | Стохастический | Последовательный | Динамический | Против | Мульти |
Медицинский диагноз | Частично | Стохастический | Последовательный | Динамический | Против | Одинокий |
Анализ изображения | От корки до корки | Детерминированный | Эпизодический | Полу | Против | Одинокий |
Робот для подбора деталей | Частично | Стохастический | Эпизодический | Динамический | Против | Одинокий |
Реферальный контроллер | Частично | Стохастический | Последовательный | Динамический | Против | Одинокий |
Интерстис репетитор английского языка | Частично | Стохастический | Последовательный | Динамический | Дискретный | Мульти |
Примеры задачной среды и их характеристики.