MATHESIS - SEZIONE DI CATANIA

N° 3 - 1999 (ultimo numero dell'anno)

 

L'APPROCCIO SOGGETTIVO ALLA PROBABILITÀ:

DAI FONDAMENTI ALLE APPLICAZIONI*

1. Introduzione

Storicamente la teoria delle probabilità si è sviluppata secondo diverse impostazioni: classica, frequentista, assiomatica, soggettiva. L'impostazione assiomatica (a parte gli aspetti critici relativi alla opportunità o meno di postulare la s -additività) non dà un significato al concetto di probabilità. Inoltre, poiché presuppone l'assegnazione di una distribuzione di probabilità completa, può risultare "scomoda" in quelle applicazioni in cui si ha poca informazione. Solitamente nella scuola la probabilità viene introdotta sulla base della definizione classica o frequentista. Però tali definizioni, anche se utili da un punto di vista intuitivo, non sono esenti da critiche di carattere logico generale (circolarità) e sono applicabili solo in situazioni particolari. D'altra parte, tali definizioni possono essere recuperate, come possibili criteri di valutazione, nell'ambito dell'impostazione soggettiva sviluppata da Bruno de Finetti. Nell'impostazione soggettiva, che è applicabile in tutte le circostanze, si mantengono rigorosamente distinti gli aspetti oggettivi (concernenti gli eventi) da quelli soggettivi (concernenti le valutazioni probabilistiche), vale a dire la logica del certo dalla logica del probabile.

La metodologia di de Finetti ([9],[21]), basata sul principio di coerenza, consente di effettuare valutazioni probabilistiche su famiglie arbitrarie di eventi e numeri aleatori (condizionati e non) e quindi consente di limitarsi ai soli eventi e numeri aleatori su cui si ha un'informazione sufficiente. (cfr. [7], [11], [15], [14], [17], [20]). La verifica della coerenza di valutazioni probabilistiche (su eventi condizionati e non) e la loro estensione ad ulteriori eventi si può effettuare sfruttando procedimenti algebrici e di programmazione lineare (cfr. [2], [4], [5], [6], [12], [18]).

 

2. Criteri di valutazione e condizioni di coerenza

Nell'impostazione soggettiva le valutazioni di probabilità si possono esprimere operativamente utilizzando due criteri (equivalenti): criterio di penalizzazione; criterio della scommessa.

Sia F={E1, …, En} una famiglia di n eventi e P=(p1, …, pn) una assegnazione di probabilità su F, con pi=P(Ei), i=1,…,n. I casi possibili o costituenti, C1,…,Cm, con m£ 2n, relativi alla famiglia F si ottengono sviluppando l'espressione

.

Con il criterio della penalizzazione si considera la quantità aleatoria , che costituisce la penalizzazione corrispondente a P, e la valutazione P si dice coerente se non esiste un'altra valutazione P*= tale che, per la corrispondente penalizzazione , si abbia L*<L in corrispondenza ad ognuno dei costituenti C1,…,Cm. Con il criterio della scommessa, considerato il guadagno aleatorio , dove s1,…,sn sono n numeri reali arbitrari, la valutazione P si dice coerente se, per ogni scelta di s1,…,sn , risulta MinG£ 0£ MaxG. In altre parole, i valori possibili di G non devono avere lo stesso segno (tutti positivi o tutti negativi), altrimenti in una (ipotetica) combinazione di scommesse sugli eventi E1,…,En (con opportuni importi s1,…,sn , scelti dal banco), il giocatore (cioè l'individuo che assegna le probabilità) subirebbe una perdita certa.

Con riferimento ad un unico evento E, la cui probabilità secondo un certo individuo è P(E)=p, il guadagno aleatorio è G=s(|E|- p), s=0, e i valori possibili di G, corrispondenti ai due casi |E|=1, |E|=0, sono: s(1- p), - ps. La condizione di coerenza in questo caso particolare equivale alla disuguaglianza: p(1- p)³ 0, che è soddisfatta se e solo se: 0£ p£ 1. Come mostra il precedente ragionamento, dalla condizione di coerenza si ottengono come teoremi gli assiomi della probabilità.

1. P(E)³ 0, " E; 2. P(W )=1; 3. AB =Æ Þ P(AÚ B)=P(A)+P(B).

Ad esempio, considerando una valutazione probabilistica P=(p1,…,pn) su una partizione di n eventi {E1,…,En}, con il criterio della scommessa il guadagno G, se si sceglie s1=…=sn=1, ha l'unico valore possibile: , che dovendo essere uguale a zero implica: , da cui segue (come corollario) la proprietà additiva.

In generale gli eventi della famiglia F={E1, …,En} sono arbitrari e con possibili relazioni logiche fra di essi. In questo caso, data l'assegnazione di probabilità P=(p1,…,pn) su F e considerato il seguente sistema nelle incognite (non negative) l 1,…,l m

dove Ij rappresenta, per ciascun j, l'insieme degli indici h tali che ChÍ Ej, si dimostra che P è coerente se e solo se (S) è compatibile. Tale condizione di coerenza si può interpretare geometricamente associando ad ogni costituente Ch un vertice, Qh=(qh1,…, hn), dell'ipercubo unitario di Rn secondo la regola:

Allora, la compatibilità del sistema (S) equivale alla condizione PÎ I, dove I è l' involucro convesso dei punti Q1,…,Qm. Pertanto l'insieme delle assegnazioni coerenti di probabilità P su F coincide con I, che in generale è un sottoinsieme dell'ipercubo unitario e coincide con esso se e solo se m=2n, nel qual caso gli eventi E1,…,Em sono logicamente indipendenti.

Nelle applicazioni capita spesso, dopo aver valutato le probabilità p1,…,pn di n eventi E1,…,En, di dover assegnare la probabilità pn+1 di un ulteriore evento En+1, rispettando la condizione che la valutazione (p1,…,pn,pn+1), sulla famiglia {E1,…,En,…,En+1} sia coerente. Come valutare pn+1?

In base ad un risultato teorico di de Finetti, noto come teorema fondamentale per le probabilità, assumendo coerente (p1,…,pn), si ha: pn+1 coerente Û pn+1Î [p',p"]Í [0,1]. Ad esempio, date le probabilità P(A)=x, P(B)=y, la valutazione P(AÚ B)=z è un'estensione coerente di (x, y) se e solo se: Max{x,y}£ z£ Min{1,x+y}; mentre P(AÙ B)=p è un'estensione coerente se e solo se: Max{0,x+y- 1}£ p£ Min{x,y}. Per calcolare i valori p', p'' si utilizza il metodo del simplesso della programmazione lineare. Problematiche simili a quella precedente sono state studiate da vari autori (sia matematici che informatici) e risalgono addirittura a Boole (cfr. [16], [19]).

 

3. Valutazioni coerenti di probabilità condizionate

La condizione di coerenza si estende in modo opportuno al caso di eventi condizionati. Sia K una famiglia arbitraria di eventi condizionati e P:K® R una funzione a valori reali definita su K. Inoltre, considerata una sottofamiglia di n eventi condizionati F={E1|H1,…,En|Hn}Í K, sia P= (p1,…,pn), con pi=P(Ei|Hi), i =1,…,n. I casi possibili o costituenti, C0,C1,…,Cm, con m+1£ 3n, relativi alla famiglia F si ottengono sviluppando l'espressione Ù in= dove Osserviamo che Con il criterio di penalizzazione, la funzione P si dice coerente se, per ogni sottofamiglia finita F di K, considerata la penalizzazione aleatoria (corrispondente a P) non esiste un'altra valutazione P*= tale che, per la penalizzazione corrispondente a P*, si abbia L*£ L in corrispondenza ad ognuno dei costituenti C0,C1,…,Cm, con L*<L in almeno un caso.

 

4. Interpretazione geometrica

Ad ogni costituente Ch favorevole ad H0, cioè tale che h>0, si può associare un punto, Qh=(qh1,…,qhn), sulla superficie dell'ipercubo unitario di Rn secondo la regola:

Indicando con I l'involucro convesso dei punti Q1,…, Qm, si può allora dimostrare il seguente risultato ([11]).

Teorema. La funzione P è coerente se e solo se, per ogni sottofamiglia finita F di K, si ha PÎ I.

Osserviamo che la condizione PÎ I è equivalente alla compatibilità del seguente sistema nelle incognite (non negative) l 1,…,l m,

Adottando il criterio della scommessa, considerato il guadagno aleatorio associato alla famiglia finita FÍ K, , dove s1,…,sn sono n numeri reali arbitrari, la funzione P definita su K si dice coerente se, per ogni n=1,2,…, per ogni sottofamiglia finita F di K e per ogni scelta di s1,…,sn, risulta: MinG|H0£ 0£ MaxG|H0. Sfruttando un opportuno teorema di alternativa si può dimostrare che la condizione di coerenza abbinata al criterio della scommessa, relativa alla famiglia F, equivale alla compatibilità del sistema (S) e quindi alla condizione PÎ I. Pertanto, i due criteri sono equivalenti anche nel caso di eventi condizionati. Se P è coerente, si dice una probabilità condizionata su K. Infatti, dalla coerenza di P si ottengono tutte le proprietà delle probabilità condizionate.

Esempio 1. (Teorema delle probabilità composte). Data la famiglia F={A|H,B|AH,AB|H} e posto P=(x,y,z), con x=P(A|H), y=P(B|AH), z=P(AB|H), si ha

P coerente Û z=xy, 0£ x,y,z£ 1.

Infatti, nel nostro caso, i costituenti Ch, con h>0, associati ad F sono: C1=ABH, C2=ABcH, C3=AcBH, C4=AcBcH. I corrispondenti punti Qh, sono: Q1=(1,1,1), Q2=(1,0,0), Q3=Q4=(0,y,0). La coerenza di P impone che valga la condizione PÎ I, equivalente alla compatibilità del seguente sistema nelle incognite l 1,l 2,l 3.

 

l 1 +l 2 =x, l 1+ l 3y = y, l 1 = z, l 1+ l 2 +l 3 = 1, l h ³ 0, " h.

da cui segue z=xy, cioè: P(AB|H)=P(A|H)P(B|AH).

Esempio 2. (Relazione di inclusione tra eventi condizionati). Dati due eventi condizionati A|H,B|K, supponiamo: AHÍ BK, BcKÍ AcH, vale a dire:

A|H vero Þ B|K vero, B|K falso Þ A|H falso,

nel qual caso si dice che A|H implica B|K (e si scrive A|HÍ B|K).

Posto: P(A|H)=x, P(B|K)=y, con 0£ x,y£ 1, e assumendo A|HÍ B|K, si può dimostrare che: P=(x, y) coerente Û x£ y. Infatti, i costituenti Ch, h>0, sono: C1=AHBK, C2=AcHBK, C3=AcHKc, C4=AcHBcK, C5=HcBK, ed i punti Qh corrispondenti sono: Q1=(1,1), Q2=(0,1), Q3(0,y), Q4=(0,0), Q5=(x,1), il cui involucro convesso I coincide con il triangolo di vertici i punti (0,0), (0,1), (1,1), al quale P appartiene se e solo se: x£ y.

Ad esempio, per la famiglia F={A|H,B|AH,AB|H}, si ha: AB|HÍ A|H, AB|HÍ B|AH, e quindi: P(AB|H)£ P(A|H), P(AB|H)£ P(B|AH), come segue anche ricordando che per il teorema delle probabilità composte si ha: P(AB|H)=P(A|H)P(B|AH). Nell'impostazione soggettiva le probabilità condizionate si possono assegnare direttamente (con l'unica condizione che siano coerenti). Inoltre, non occorre fare alcuna ipotesi sulle probabilità degli eventi condizionanti, che possono essere (in parte o eventualmente anche tutte) nulle. Infatti, il valore P(E|H)=p espresso da un certo individuo con il criterio della scommessa è per definizione l'importo che egli è disposto a pagare, in una (ipotetica) scommessa su E|H, sapendo che riceverà 1, 0, oppure rispettivamente nei tre casi:

EH vero, EcH vero, Hc vero.

La probabilità P(H) non svolge, quindi, alcun ruolo e non occorre valutarla. Ovviamente, se P(H)>0 allora necessariamente ("teorema delle probabilità composte"): P(E|H)=P(EH)/P(H). Pertanto, la formula precedente non è una definizione, ma una possibile rappresentazione di P(E|H). D'altra parte, il fatto di poter considerare eventi di "probabilità nulla" è una caratteristica molto importante, senza la quale si avrebbe una drastica restrizione della classe delle valutazioni "ammissibili" di probabilità condizionate. Infatti, ignorando la possibile esistenza di eventi di probabilità nulla si riduce la possibilità di estendere in ogni caso un'assegnazione di probabilità condizionata. Inoltre, anche quando tale possibilità esiste, l'intervallo corrispondente può essere "più piccolo" di quello costituito da tutte le possibili estensioni coerenti.

La metodologia probabilistica basata sulla condizione di coerenza consente anche un approccio più generale alla relazione di indipendenza stocastica. Com'è noto, in base alla definizione usuale, due eventi A, B si dicono stocasticamente indipendenti se: P(AB)=P(A)P(B). Tale definizione, però, risulta controintuitiva quando gli eventi hanno probabilità uguale a 0 oppure 1. Per esempio, se P(A)=0 oppure 1 allora A è indipendente da se stesso, mentre una definizione "più naturale" dovrebbe comportare che ogni evento sia dipendente da se stesso. L'impostazione generale basata sulla condizione di coerenza consente di trattare in modo "naturale" le probabilità condizionate anche quando gli eventi condizionanti hanno probabilità nulla. Di conseguenza, è possibile definire in modo più generale l'indipendenza stocastica, eliminando gli aspetti controintuitivi della definizione classica ([8]).

 

5. Valutazioni coerenti di probabilità condizionate: alcuni algoritmi

Data una valutazione di probabilità P=(p1,…,pn), definita su F={E1|H1,…,En|Hn}, ricordiamo che una condizione necessaria di coerenza è la compatibilità di un opportuno sistema (S). Posto J={1,2,…,n} e indicando con S l'insieme delle soluzioni del sistema (S), introduciamo le funzioni

le quantità: Mj=maxF j(Ù ), jÎ J, e l'insieme di indici: I0={jÎ J: Mj=0}. Indicata con F0 la sottofamiglia associata a I0 e con P0 la corrispondente assegnazione di probabilità, si dimostra il seguente risultato:

P coerente Û

Iterando il teorema precedente, la coerenza di P si può verificare con la seguente procedura.

 

Algoritmo 1. Sia data la terna (J,F,P).

1. Verificare la compatibilità del sistema (S) associato alla coppia (F,P);

2. Se il sistema (S) non è compatibile, P non è coerente e la procedura si interrompe, altrimenti si determina l'insieme I0;

3. Se I0=Æ allora P è coerente e la procedura si interrompe, altrimenti si sostituisce la terna (J,F,P) con (I0,F0,P0) e si ripetono i passi 1-3.

Il teorema fondamentale di de Finetti può essere formulato anche con riferimento al caso degli eventi condizionati. A tale proposito, data una valutazione di probabilità P=(p1,…,pn), definita su una famiglia di eventi condizionati F={E1|H1,…,En|Hn}, sia pn+1 un'estensione di P ad un ulteriore evento condizionato {En+1|Hn+1}. Allora, si dimostra che esiste un intervallo [p',p'']Í [0,1] tale che l'assegnazione di probabilità (p1,…,pn,pn+1) sulla famiglia {E1|H1,…,En|Hn,En+1|Hn+1} è coerente se e solo se pn+1Î [p',p'']. L'intervallo [p',p''] può essere determinato con il seguente Algoritmo 2 ([4]), basato su un'opportuna modifica dell'Algoritmo 1.

 

Algoritmo 2. Sia data la terna (Jn+1,Fn+1,Pn+1), con

Jn+1={1,…,n+1}, Fn+1={E1|H1,…,En|Hn,En+1|Hn+1}, Pn+1=(p1,…,pn,pn+1),

con pn+1 incognito.

1. Sviluppare l'espressione Ù iÎ Jn+1 , determinando i costituenti Cr favorevoli all'evento H0=H1Ú Ú Hn+1 e i corrispondenti punti Qr, e costruire il seguente sistema nelle incognite l 1,…,l m,pn+1, associato alla terna (Jn+1,Fn+1,Pn+1):

2. Controllare la compatibilità del sistema (S) sotto la condizione pn+1=0 (rispettivamente pn+1=1). Se (S) non è compatibile si va al Passo 3, altrimenti si va al Passo 4;

3. Risolvere il seguente problema di programmazione lineare

calcolare: (rispettivamente: ) soggetto ai vincoli:

Il minimo g ' (rispettivamente il massimo g ") della funzione obiettivo coincide con p' (rispettivamente con p'') e la procedura si interrompe;

4. Calcolare, per ogni indice j, il massimo Mj della funzione F j, soggetta ai vincoli costituiti dal sistema S con pn+1=0 (rispettivamente pn+1=1). Si hanno i seguenti tre casi:

1. Mn+1>0; 2. Mn+1=0, Mj>0 " j¹ n+1; 3. Mj=0 per jÎ I0=JÈ {n+1}, con J¹ Æ .

Nei primi due casi si ha p'=0 (rispettivamente p"=1) e la procedura si interrompe. Nel terzo caso, definendo I0=JÈ {n+1}, si sostituisce la terna (Jn+1,Fn+1,Pn+1) con la terna (I0,F0,P0) e si ritorna al Passo 1.

La procedura si arresta in un numero finito di cicli determinando il minimo p' (rispettivamente il massimo p'') dei valori di pn+1 coerenti con (p1,…,pn).

 

6. Generalizzazioni: le probabilità imprecise

In molte applicazioni, quando si è in una situazione di conoscenza vaga, è più naturale esprimere valutazioni di probabilità imprecise ([23]), del tipo

(A): a 1£ P(E1| H1)£ b 1,…,a n£ P(En| Hn)£ b n.

La consistenza di una assegnazione probabilistica imprecisa richiede una opportuna generalizzazione del principio di coerenza. Una definizione possibile è la seguente:

La valutazione imprecisa A definita sulla famiglia F={E1|H1,…,En|Hn} si dice coerente se esiste una assegnazione di probabilità precisa coerente, P=(p1,…,pn), su F tale che

 

a 1£ p1£ b 1,…,a n£ pn£ b n

Ovviamente, se una valutazione P soddisfa le disuguaglianze precedenti non è detto che sia coerente. Inoltre, mentre l'insieme delle valutazioni precise coerenti su una famiglia di eventi non condizionati, {E1,…,En}, è convesso, per gli eventi condizionati tale proprietà non è più valida.

Ad esempio, se P1=(x1,y1,z1) e P2=(x2,y2,z2) sono due valutazioni coerenti sulla famiglia {A|H,B|AH,AB|H}, in generale la valutazione P=tP1+(1- t)P2, con tÎ [0,1], non è coerente. Quindi, l'insieme delle assegnazioni di probabilità precise P=(x1,…,xn) su F, con

(x1, …, xn)Î J = [a 1, b 1]´´ [a n, b n] ,

è in generale un sottoinsieme non convesso dell'intervallo J, contenuto nell'ipercubo unitario di Rn. Si dimostra tuttavia il seguente risultato:

 

Teorema. Se per ogni punto (x1,…,xn)Î V={a 1,b 1}´´ {a n,b n} la valutazione P=(x1,…,xn) è coerente, allora per ogni coppia (P1,P2), con P1Î V, P2Î V, e per ogni tÎ [0,1] il punto P=tP1+(1- t)P2 è una valutazione coerente. L'insieme (convesso)

 

{ P=tP1+(1- t)P2: (P1,P2)Î V´ V, tÎ [0,1]}

coincide con l'intervallo J. Una valutazione imprecisa A, tale che ogni PÎ J è coerente, si dice totalmente coerente (cfr. [14]).

Con riferimento all'estensione coerente di valutazioni di probabilità imprecise, una possibile versione del teorema fondamentale di de Finetti è la seguente: Data una valutazione imprecisa (coerente) A su una famiglia di n eventi condizionati ed un'estensione a n+1£ pn+1£ b n+1 di A ad un ulteriore evento condizionato En+1|H n+1, esiste un intervallo [p0, p0]Í [0,1] tale che l'estensione è coerente se e solo se risulta: [a n+1,b n+1]Ç [p0,p0]=Æ . Data una valutazione imprecisa A su F, l'Algoritmo 1 e l'Algoritmo 2 possono essere modificati rispettivamente in modo da poter verificare da un lato la coerenza di A e dall'altro determinare le estensioni coerenti di A calcolando i valori p0, p0 (cfr. [5]).

 

7. Applicazioni: database probabilistici

I sistemi di database permettono di gestire in modo efficiente l'informazione contenuta in grandi quantità di dati. I database relazionali sono una collezione di relazioni di dati (rappresentate mediante tabelle) che possono essere manipolate con vari tipi di operatori logici (selezione, proiezione, prodotto cartesiano, and, or, join, …). Tali operatori agiscono sulle tuple di dati delle relazioni contenute nel database producendo altre relazioni. Sulla base dell'algebra relazionale costruita con tali operatori si introduce un linguaggio che permette di "interrogare" il database relazionale con vari tipi di queries. Un uso più realistico dei database richiede che tali sistemi siano progettati in modo da poter rappresentare e gestire l'informazione incerta che è presente in (quasi) tutte le applicazioni . Da alcuni anni vengono studiati dei modelli di database probabilistici che hanno lo scopo di quantificare l'incertezza relativa ai dati contenuti nel database mediante delle assegnazioni di probabilità (precise o imprecise).

 

NomeFile

Rettangolo

Persona

(Immagine1)

((5,10), (35,40))

(John, 0.2, 0.25)

(Jim, 0.35, 0.4)

(Tom, 0.4, 0.45)

(Immagine1)

((35,40), (60,80))

(John, 0.6, 0.65)

(Jim, 0.2, 0.25)

(Ed, 0.1, 0.15)

La tabella precedente dice che la faccia presente in un dato rettangolo di una foto è quella di una certa persona X con una probabilità compresa in un certo intervallo. Si osservi che ogni rettangolo è individuato dal vertice (x1,y1) in basso a sinistra e dal vertice (x2,y2) in alto a destra, ad esempio : (5,10), (35,40).

 

Esempi di queries. Considerati gli eventi: A="La persona nel rettangolo (5,10), (35,40) è John"; H="La persona nel rettangolo (35,40),(60,80) è Jim oppure Ed"; K="La persona nel rettangolo (35,40),(60,80) è John oppure Jim", calcolare P(A|H) e P(A|K). Propagando le valutazioni probabilistiche presenti nella tabella si ottiene: 1/3£ P(A|H)£ 5/6, 0£ P(A|K)£ 5/17.

Nel Dipartimento di Matematica dell'Università di Catania è in fase di sviluppo un modello generale di database probabilistico (ProbEtna), che utilizza gli algoritmi precedenti con assegnazioni di probabilità imprecise ([3]).

 

8. Aspetti probabilistici nel ragionamento nonmonotono

Un settore di notevole importanza nel campo dell'Intelligenza Artificiale è quello relativo allo sviluppo e alle applicazioni di sistemi esperti, in particolare lo studio di sistemi intelligenti per l'implementazione automatica del ragionamento incerto nonmonotono. Osserviamo che, diversamente dalla logica matematica classica (monotona) in cui delle conclusioni raggiunte sulla base di certe premesse rimangono valide anche se si aggiungono altre premesse, la logica sottostante al ragionamento di senso comune è tipicamente nonmonotona. Gli esseri umani traggono conclusioni significative sulla base dell'informazione che possiedono e, in caso di informazioni aggiuntive, è possibile che alcune conclusioni siano ritenute non più valide.

 

Esempio. Dato un animale di nome Tweety, due conclusioni entrambe valide anche se opposte sono: Se Tweety è un uccello, allora Tweety vola; Se Tweety è un uccello ed è un pinguino, allora Tweety non vola.

Nei sistemi intelligenti il processo inferenziale nonmonotono viene sviluppato utilizzando una base di conoscenza ed un insieme di regole di inferenza. La base di conoscenza rappresenta l'informazione esplicita dell'esperto relativa all'applicazione considerata ed è costituita da un insieme di asserzioni condizionate del tipo "Se … Allora …" (in simboli: a Ž ; b ). Tale insieme da alcuni autori viene anche detto una relazione di conseguenza. Le regole di inferenza permettono di dedurre, a partire dall'insieme di asserzioni condizionate che costituiscono la base di conoscenza, altre asserzioni condizionate. Uno dei formalismi più interessanti ed ampiamente accettati per "catturare" il ragionamento nonmonotono, detto Sistema P, si basa sulle seguenti regole di inferenza ([1]):

1. a Ž ; a

2. ë a « b , a Ž ; g Þ b Ž ; g

3. ë b ® g , a Ž ; b Þ a Ž ; g

4. a Ù b Ž ; g , a Ž ; b Þ a Ž ; g

5. a Ž ; b , a Ž ; g Þ a Ù b Ž ; g

6. a Ž ; g , b Ž ; g Þ a Ú b Ž ; g Ž

Le precedenti regole di inferenza (insieme ad altre) sono state studiate in molti sistemi logici nonmonotoni, senza alcun riferimento a concetti probabilistici. Adottando la semantica proposta (nel 1936) da de Finetti per gli eventi condizionati, l'asserzione condizionata a Ž ; b viene interpretata da alcuni autori ([10]) come un oggetto condizionato b | a con tre valori logici: Vero, Falso, Indeterminato. Dal punto di vista probabilistico all'asserzione condizionata a Ž ; b viene attribuito il significato di un evento condizionato b | a la cui probabilità è prossima ad 1 : P(b | a )>1 - e (" e >0). Con tale interpretazione, le precedenti regole di inferenza assumono il seguente significato probabilistico:

  1. P(a | a )=1
  2. a º b , P(g | a )¾ 1 Þ P(g | b )¾ 1
  3. b Í g , P(b | a )¾ 1 Þ P(g | a )¾ 1
  4. P(g | a b )¾ 1, P(b | a )¾ 1 Þ P(g | a )¾ 1
  5. P(b | a )¾ 1, P(g | a )¾ 1 Þ P(g | a Ù b )¾ 1
  6. P(g | a )¾ 1, P(g | b )¾ 1 Þ P(g | a Ú b )¾ 1

L'interpretazione della 1. è ovvia, per la 2. e la 3. basta osservare rispettivamente che P(g | b )=P(g | a ) e P(g | a )³ P(b | a ). Per la 4., la 5. e la 6. si dimostra rispettivamente che:

,

,

.

Riprendendo l'esempio di Tweety e considerando gli eventi

b="bird", p="penguin", f="fly"

e la base di conoscenza K={f|b,b|p,Ø f|p}, si può verificare che: K implica Ø f|pÙ b (in simboli: Kë Ø f|pÙ b). Infatti con la sostituzione: p=a , b=b , Ø f=g si ha:

b|p=b | a , Ø f| p=g | a , Ø f| pÙ b=g | a b .

Allora, in base alla regola 5., si ha

,

cioè:

.

Vale a dire: b|p, Ø f| p Þ Ø f|pÙ b

Osserviamo che dal sistema di regole di inferenza precedenti si possono derivare altre regole, ad esempio:

 

a Ž ; b , a Ž ; g Þ a Ž ; b Ù g ,

la cui interpretazione probabilistica è la seguente:

P(b | a )¾ 1, P(g | a )¾ 1 Þ P(b Ù g | a )¾ 1

Infatti, utilizzando il teorema delle probabilità composte e la regola 5. si ottiene:

P(b | a )=P(g | a )=1- e Þ 1- 2e £ P(b Ù g | a )£ 1- e .

 

References

[1] E. W. Adams (1975), "The Logic of Conditionals", D. Reidel, Dordrecht, Netherlands.

[2] V. Biazzo (1997), "Algoritmi probabilistici per il trattamento dell'incertezza: implementazione con MAPLE V", Degree Thesis, Dip. di Matematica, Univ. di Catania, Italy.

[3] V. Biazzo, A. Ferro, A. Gilio, R. Giugno (1999), "A general probabilistic database model". Preprint.

[4] V. Biazzo, A. Gilio (1999), "A linear algorithm for the optimal propagation of conditional probability assessments: an implementation with Maple V", Contributi, 6, Dip. di Scienze, Storia dell'Architettura e Restauro, Univ. di Pescara, 8-21.

[5] V. Biazzo, A. Gilio (1999), "A generalization of the fundamental theorem of de Finetti for imprecise conditional probability assessments". Proc. of The First International Symposium on Imprecise Probabilities and their Applications (ISIPTA '99). Ghent, Belgium 30 June - 2 July 1999.

[6] G. Bruno, A. Gilio (1980), "Applicazione del metodo del simplesso al teorema fondamentale per le probabilità nella concezione soggettivistica", Statistica, 40, 337-344.

[7] G. Coletti (1994), "Coherent numerical and ordinal probabilistic assessments", IEEE Trans. on Systems, Man, and Cybernetics, 24 (12), 1747-1754.

[8] G. Coletti, R. Scozzafava (1996), "Characterization of coherent conditional probabilities as a tool for their assessment and extension", Journal of Uncertainty, Fuzziness and Knowledge-based Systems, 4 (2), 103-127.

[9] G. Coletti,R. Scozzafava (1998), "Zero probabilities in stochastical independence". Proceedings of the Seventh Int. Conf. on "Information Processing and Management of Uncertainty in Knowledge-Based Systems" (IPMU '98), Paris, July 6-10, vol. 1, pp. 788-794.

[10] B. de Finetti (1970), "Teoria delle probabilità", 2 voll., Ed. Einaudi, Torino (traduzione in inglese: Theory of Probability 1 (2), Chichester, Wiley, 1974 (1975)).

[11] D. Dubois, H. Prade (1994), "Conditional objects as nonmonotonic consequence relationships". IEEE Trans. on Systems, Man, and Cybernetics, 24 (12), 1724-1740.

[12] A. Gilio (1990), "Criterio di penalizzazione e condizioni di coerenza nella valutazione soggettiva della probabilità", Boll. Un. Mat. Ital., Vol. 4-B, n. 3, Serie 7, 645-660.

[13] A. Gilio (1995), "Algorithms for precise and imprecise conditional probability assessments", in "Mathematical Models for Handling Partial Knowledge in Artificial Intelligence", Coletti, G., Dubois, D., Scozzafava, R. (eds.), Plenum Press, New York, 231-254.

[14] A. Gilio, S. Ingrassia (1998). Totally coherent set-valued probability assessments. Kybernetika 34 (1), 3-15.

[15] A. Gilio, R. Scozzafava (1994), "Conditional events in probability assessment and revision. IEEE Trans. on Systems, Man, and Cybernetics 24 (12), 1741-1746.

[16] A. Gilio, R. Scozzafava (1988), "Le probabilità condizionate coerenti nei sistemi esperti", Atti delle Giornate di lavoro AIRO 1988 su "Ricerca Operativa e Intelligenza Artificiale", IBM, Pisa, 5-7 Ottobre, 1988, 317-330.

[17] T. Hailperin (1986), "Boole's Logic and Probability: A Critical Exposition from the Standpoint of Contemporary Algebraic Logic and Probability Theory", 2nd ed., Amsterdam: North-Holland.

[18] S. Holzer (1985), "On coherence and conditional prevision", Boll. Un. Mat. Ital. (6) 4, 441-460.

[19] F. R. Lad, J. M. Dickey, M. A. Rahman (1990), "The fundamental theorem of prevision", Statistica 50, 19-38.

[20] N. J. Nilsson (1986), "Probabilistic logic", Artificial Intelligence, 28, 71-88.

[21] E. Regazzini (1985), "Finitely additive conditional probabilities", Rend. Sem. Mat. Fis. Milano 55, 1985, 69-89.

[22] R. Scozzafava (1997), "La probabilità soggettiva, significato, valutazione, applicazioni", Masson, Milano, 4a ed..

[23] Walley. P. (1991), "Statistical reasoning with imprecise probabilities", Chapman and Hall, London.

Angelo Gilio