Torna all'indice      Torna alla Home Page del corso

RETI DI BAYES
La teoria

 

In sistemi in cui non è possibile stabilire, in ogni istante, se un fatto sia vero, falso, oppure né l'una né l'altra cosa, può essere utile descrivere fatti non certi ma che sono suggeriti da una qualche evidenza. Sono in particolare problemi in cui il mondo presenta una vera casualità, come i giochi d'azzardo, e problemi in cui il mondo non è casuale, ma non perfettamente noto.
Tali problemi si possono modellizzare tramite le reti di credenze (o reti di Bayes) e le reti di decisione (o diagrammi di influenza).

Una rete di credenze è un grafo privo di cicli diretti in cui:

  • I nodi sono costituiti da un insieme di variabili casuali.
  • I nodi sono connessi da un insieme di archi che rappresentano le reciproche influenze causali.
  • Ogni nodo è caratterizzato da una tabella delle probabilità condizionate che quantifica gli effetti che i genitori hanno su di esso.

Il meccanismo di inferenza sulle reti di credenze calcola la distribuzione di probabilità a posteriori per un insieme di variabili di interrogazione, dati i valori esatti per alcune variabili di prova (evidenza).
Ogni nodo può servire sia come variabile di interrogazione che come variabile di prova, consentendo così quattro tipi distinti di inferenza:

  • Inferenze diagnostiche (dagli effetti alle cause).
  • Inferenze causali (dalle cause agli effetti).
  • Inferenze intercausali (fra cause di un effetto comune).
  • Inferenze miste (combinando due o più delle precedenti).

Costruita la rete che modellizza il sistema, l'obiettivo della sua analisi è di collezionare evidenza e modificare il suo comportamento in base a tale evidenza.
Per modellare tale comportamento è necessaria una teoria statistica dell'evidenza, che si costruisce sul teorema di Bayes:

dove, in un insieme di k ipotesi Hi mutuamente esclusive:
P(Hi | E) è la probabilità che l'ipotesi Hi sia vera data l'evidenza E;
P(E | Hi) è la probabilità di osservare levidenza E dato che l'ipotesi Hi è vera;
P(Hi) è la probabilità a priori che l'ipotesi Hi sia vera in assenza di evidenza specifica.

Questa equazione è alla base di tutti i moderni sistemi di Intelligenza Artificiale per l'inferenza probabilistica, poichè permette di esprimere l'indipendenza condizionale tra variabili senza ricorrere ad una estesa (e quindi difficilmente gestibile) tabella di distribuzione di probabilità congiunte, semplificando notevolmente il calcolo dei risultati delle interrogazioni.
Infatti, definita la topologia di una rete di credenze, è sufficiente specificare la tabella delle probabilità condizionate per ogni nodo, ed il processo di aggiornamento bayesiano (l'inferenza) incorpora prove un pezzo alla volta modificando la credenza precedente nelle variabili ignote.

Le reti di decisione estendono le reti di credenze incorporando le azioni e le utilità: le preferenze di un agente fra gli stati del mondo sono riassunte da una funzione di utilità, che associa ad ogni stato un singolo numero che ne esprime la desiderabilità. Le utilità si combinano con le probabilità delle azioni per fornire un'utilità attesa da ogni azione.
Massimizzando una funzione di utilità che riflette correttamente le misure di prestazione con cui viene giudicato il suo comportamento, un agente ottiene la miglior prestazione possibile.

In generale quindi queste reti si compongono con nodi di tre tipi:

  • Nodi possibilità: rappresentano variabili casuali, come per le reti di credenze.
  • Nodi decisione: rappresentano punti in cui l'agente ha la scelta di un'azione.
  • Nodi utilità: rappresentano il valore di utilità per l'agente in funzione degli attributi che l'hanno determinata.

L'agente seleziona le azioni valutando la rete di decisione per ogni possibile istanziazione del nodo decisione alla ricerca dell'utilità massima.



  Le reti di Bayes in pratica
 

  Torna all'indice     Torna alla Home Page del corso