Рассуждения с факторами достоверности | Искусственный интеллект
Байесовское рассуждение предполагает наличие информации о статистической вероятности возникновения определенных событий. Это затрудняет работу во многих областях. Факторы уверенности — это компромисс с чисто байесовскими рассуждениями.
Этот подход успешно используется, особенно в экспертной системе MYCIN. MYCIN — медицинская диагностическая система, которая диагностирует бактериальные инфекции крови и назначает лекарства для лечения.Здесь мы представляем его использование в качестве примера вероятностного рассуждения. Его знания представлены в форме правил, и каждое правило имеет связанный с ним фактор достоверности.
Например, правило MYCIN выглядит примерно так, если:
а) при окраске по Граму микроорганизм грамотрицательный,
(б) Морфология организма палочковидная, а
(c) Аэробность организма является анаэробной, тогда есть наводящие доказательства (0,5), что идентичность организма — Bacteroides.
а) окраска микроорганизма грамположительна,
(b) Морфология организма кокковая,
(c) Конформация роста организма представляет собой скопления, тогда есть наводящее свидетельство (0.7), что микроорганизм является стафилококком.
Это знание в форме правил представлено внутри в простой в использовании структуре списка LISP:
($ И (ТО ЖЕ CNTXT ГРАМПУС ГРАМПУС)
(ТО ЖЕ САМОЕ CNTXT MORPH COCCUS)
(ТО ЖЕ САМОЕ СООТВЕТСТВИЕ CNTXT)
(ЗАВЕРШЕНИЕ CNTXT IDENT STAPHYLO COCCUS TALLY 0,7)
Интерпретацию можно отложить до тех пор, пока читатель не познакомится с LISP.
MYCIN использует эти правила, чтобы рассуждать в обратном направлении о клинических данных, доступных для его цели обнаружения значительных болезнетворных организмов. Как только он находит идентичность таких организмов, он пытается выбрать терапию, с помощью которой можно лечить заболевание (заболевания).
Чтобы понять, как MYCIN использует неопределенную информацию, нам нужны ответы на два вопроса:
«Что означают факторы уверенности?» и «Как MYCIN объединяет оценки неопределенности в каждом из своих правил для получения окончательной оценки достоверности своих выводов?» Еще один вопрос, на который нам необходимо ответить, учитывая наши наблюдения о неподатливости чисто байесовских рассуждений: «На какие компромиссы идет техника MYCIN и какие риски связаны с этими компромиссами?» На все эти вопросы мы сейчас ответим,
Фактор уверенности (CF [h, e]) определяется двумя компонентами:
1. MB [h, e] — мера (от 0 до 1) веры в гипотезу h при наличии свидетельства e.MB измеряет степень, в которой данные подтверждают гипотезу. Он равен нулю, если доказательства не подтверждают гипотезу.
2. MD [h, e] — мера (от 0 до 1) неверия в гипотезу h при наличии свидетельства e. MD измеряет степень, в которой данные подтверждают отрицание гипотезы. Он равен нулю, если доказательства подтверждают гипотезу.
Из этих двух показателей мы можем определить фактор уверенности как:
CF [h, e] = MB[h, e] – MD[h, e]
Поскольку любое конкретное свидетельство либо поддерживает, либо опровергает гипотезу — (но не то и другое), и поскольку каждое правило MYCIN соответствует одному доказательству (хотя это может быть составное свидетельство), для каждого правила достаточно одного числа. определяют как MB, так и MD и, следовательно, CF.
CF правил MYCIN предоставлены экспертами, которые пишут правила. Они отражают оценки экспертом силы доказательств в поддержку гипотезы. Однако, по мнению MYCIN, эти CF необходимо комбинировать, чтобы отразить действие нескольких доказательств и нескольких правил, применяемых к проблеме. На рис. 7.4 показаны три комбинированных сценария, которые нам необходимо рассмотреть.
На рис. 7.4(а) несколько правил предоставляют доказательства, относящиеся к одной гипотезе. На рис. 7.4(b) нам нужно рассмотреть наше убеждение в наборе нескольких утверждений, взятых вместе. На рис. 7.4 (c) выходные данные одного правила обеспечивают входные данные для другого.
Какие формулы следует использовать для выполнения этих комбинаций?
Прежде чем мы ответим на этот вопрос, нам нужно сначала описать некоторые свойства, которым мы хотели бы удовлетворять объединяющие функции:
1. Поскольку порядок сбора доказательств произволен, функции объединения должны быть коммутативными и ассоциативными.
2. До тех пор, пока не будет достигнута определенность, дополнительные подтверждающие доказательства должны увеличивать MB (и аналогично для опровергающих доказательств и MD).
3.Если неопределенные выводы соединены вместе, то результат должен быть менее определенным, чем любой из выводов по отдельности.
Приняв желательность этих свойств, давайте сначала рассмотрим сценарий на рис. 7.4 (а), в котором несколько свидетельств объединяются для определения CF одной гипотезы.
Показатели веры и неверия в данную гипотезу, два наблюдения S1 и С2 вычисляются из:
Один из способов сформулировать эти формулы на английском языке состоит в том, что мера веры в h равна 0, если в h не верят с уверенностью. В противном случае мера доверия к h при двух наблюдениях — это мера доверия при наличии только одного наблюдения плюс некоторое приращение для второго наблюдения. Это приращение вычисляется, сначала беря разницу между 1 (уверенностью) и верой, данной только первому наблюдению.
Это различие является наибольшим, что может быть добавлено вторым наблюдением. Затем разница масштабируется верой в h с учетом только второго наблюдения. Тогда можно дать соответствующее объяснение и формуле вычисления неверия. Из MB и MD можно вычислить CF. Однако, если объединить несколько источников подтверждающих доказательств, абсолютная величина CF увеличится. Если будут представлены противоречивые данные, абсолютное значение CF уменьшится.
Предположим, мы сделали начальное наблюдение, соответствующее рис. 7.4 (а), которое подтверждает наше мнение о h при MB = 0,3. Тогда MD [ч, с1] = 0 и CF [ч, с1] = 0,3 Теперь сделаем второе наблюдение, которое также подтверждает h, при MB [h, s2] = 0.2.
На этом примере мы можем видеть, как небольшие подтверждающие данные могут накапливаться, чтобы создавать все более крупные факторы уверенности.
Далее давайте рассмотрим сценарий на рис. 7.4(b), в котором нам нужно вычислить фактор достоверности комбинации гипотез. В частности, это необходимо, когда нам нужно знать фактор достоверности антецедента правила, содержащего несколько предложений (как, например, в приведенном выше правиле стафилококка).Коэффициент достоверности комбинации может быть вычислен из его MB и MD.
MYCIN использует для MB соединение и разъединение двух гипотез, как указано ниже:
Аналогично можно вычислить MD.
Наконец, нам нужно рассмотреть сценарий на рис. 7.4(с), в котором правила связаны друг с другом, в результате чего неопределенный результат одного правила обеспечивает входные данные для другого. Решение этой проблемы также будет учитывать случай, когда мы должны присвоить меру неопределенности первоначальным входным данным.
Это может/или произойти, например, в ситуациях, когда доказательство является результатом эксперимента или лабораторного теста, результаты которого не совсем точны. В таком случае фактор уверенности гипотезы должен учитывать как силу, с которой доказательства предполагают гипотезу, так и уровень уверенности в доказательствах.
MYCIN предоставляет правило цепочки, которое определяется следующим образом. Пусть MB'[h, s] будет мерой доверия к h при условии, что мы абсолютно уверены в правильности s. Пусть e будет доказательством, которое заставило нас поверить в s (например, фактическое чтение лабораторных приборов или результаты применения других правил).
Поскольку исходные CF в MYCIN являются оценками, которые даются экспертами, пишущими правила, на самом деле нет необходимости давать более точное определение того, что означает CF, чем то, которое мы уже дали.
Первоначальная работа, тем не менее, предоставила его, определив MB (который можно рассматривать как пропорциональное уменьшение недоверия к h в результате e) как:
Оказывается, эти определения несовместимы с байесовским взглядом на условную вероятность. Однако небольшие изменения в них делают их совместимыми.
В частности, мы можем переопределить MB как:
Аналогичным образом следует изменить и определение MD.
Благодаря такой интерпретации исчезает какой-либо фундаментальный конфликт между методами MYCIN и методами, предложенными байесовской статистикой. Чистая байесовская статистика обычно приводит к неуправляемым системам.В правилах MYCIN CF представляет вклад отдельного правила в веру MYCIN в гипотезу. В некотором смысле это представляет собой условную вероятность.
Но в байесовском P (H|E) описывает условную вероятность H, данную при единственном доступном свидетельстве, E (и совместные вероятности в случае большего количества свидетельств). Таким образом, байесовская статистика проще, но не лишена ошибок. Но MYCIN работает с большей точностью.
Формулы MYCIN для всех трех комбинированных сценариев на рис. 7.4 предполагают, что все правила независимы. Бремя обеспечения независимости (по крайней мере, в той мере, в какой это имеет значение) лежит на авторе правил. Каждый из комбинационных сценариев уязвим, когда это предположение о независимости нарушается.
Это можно проанализировать, повторно рассмотрев сценарий на рис. 7.4 (а). Наш пример правила имеет три антецедента с одним CF, а не с тремя отдельными правилами; это делает ненужными правила комбинирования. Автор правила сделал это, потому что три антецедента не являются независимыми.
Чтобы увидеть, какую разницу может иметь предположение о независимости MYCIN, предположим на мгновение, что вместо этого у нас есть три отдельных правила и что CF каждого из них равен 0,6. Это может произойти и по-прежнему будет соответствовать комбинированному CF 0,7, если три условия существенно перекрываются. Комбинирование неопределенных правил.
Если мы применим формулу комбинации MYCIN к трем отдельным правилам, мы получим:
Это существенно отличается от истинного значения, выраженного экспертом, равного 0,7.
Теперь давайте рассмотрим, что происходит, когда нарушается независимость допущений в сценарии рис. 7.4(c).
Рассмотрим конкретный пример (придомовой лужайки), в котором:
S: Разбрызгиватель был включен прошлой ночью
W: трава мокрая утром
Р: прошлой ночью шел дождь
Мы можем написать правила в стиле MYCIN, которые описывают прогностические отношения между этими тремя событиями:
р1: Если разбрызгиватель остался включенным прошлой ночью
то есть убедительное свидетельство (0.9) того, что
трава будет мокрой этим утром
В одиночку, Р1 могут точно описать мир. Но теперь рассмотрим второе правило:
р2: Если трава мокрая сегодня утром
тогда есть наводящие доказательства (0,8), что дождь шел в последний раз справа
В одиночку, Р2 имеет смысл, когда дождь является наиболее распространенным источником воды на траве. Но если два правила применяются вместе, используя правило MYCIN для цепочки,
MB [W, S] = 0,8 [разбрызгиватель указывает на влажность)
МБ [R, W] = 0,8. 0,9 = 0,72 [мокрый предполагает дождь]
Другими словами, мы считаем, что пошел дождь, потому что мы считаем, что разбрызгиватель остался включенным. Мы получаем это, несмотря на тот факт, что, если известно, что разбрызгиватель был оставлен включенным и был причиной намокания травы, то на самом деле почти нет доказательств дождя (потому что мокрая трава была объяснена разбрызгивателем).
Одним из основных преимуществ модульности системы правил MYCIN является то, что она позволяет нам рассматривать отдельные предшествующие/последовательные отношения независимо от других. В частности, это позволяет нам говорить о следствиях предложения, не возвращаясь назад и не рассматривая свидетельства, которые его подкрепляли.
К сожалению, этот пример показывает, что такой подход таит в себе опасность всякий раз, когда обоснование убеждения важно для определения его последствий. В этом случае нам нужно знать, почему мы считаем, что трава мокрая (потому что мы наблюдали, что она мокрая, а не потому, что мы знаем, что разбрызгиватель был включен), чтобы определить, является ли мокрая трава свидетельством того, что только что прошел дождь.
Слово предостережения; этот пример иллюстрирует особую структуру правил, которая почти всегда вызывает проблемы и ее следует избегать. Наше правило R описывает причинно-следственную связь между влажностью и разбрызгивателем (разбрызгиватель вызывает мокрую траву). Линейка1 хотя, похоже, на самом деле описывает обратную причинно-следственную связь (мокрая трава вызвана дождем и, таким образом, является доказательством его причины).
Мы можем сформировать цепочку доказательств от причины события:
Но доказательства не должны использоваться для поиска причины или симптома события без какой-либо новой информации. Чтобы избежать этой проблемы, многие системы, основанные на правилах, либо ограничивают свои правила одной структурой, либо четко разделяют два типа, чтобы они не мешали друг другу. Байесовская сеть предлагает системное решение этой проблемы.
Мы можем обобщить это обсуждение факторов уверенности и систем, основанных на правилах, которое очень полезно, но будет оценено только после того, как вы закончите с экспертными системами. Этот подход делает серьезные предположения о независимости, что делает его относительно простым в использовании; в то же время предположения создают опасности, если правила написаны неаккуратно и не учитывают важные зависимости.
Подход может служить основой практических прикладных программ. Так было в MYCIN. Это также было сделано в большом количестве других систем, которые были построены на платформе EMYCIN, которая представляет собой обобщение (часто называемое оболочкой) MYCIN со всеми выраженными специфичными для предметной области знаниями, без правил. Одна из причин полезности этой схемы, несмотря на ее ограничения, заключается в том, что оказывается, что в надежной в других отношениях системе используемые точные числа не имеют большого значения.
Другая причина заключается в том, что правила были тщательно разработаны, чтобы избежать основных ловушек, которые мы только что описали. Еще одна интересная особенность этого подхода заключается в том, что он довольно хорошо имитирует то, как люди манипулируют достоверностью.