Predizione di un evento attraverso Naive Bayes OnLine

InformaticaGestionale.it propone ai suoi lettori il nuovo servizio online che sfrutta il teorema di Bayes per fare predizioni di qualsiasi tipo grazie ad un set di dati storici eseguiti su specifici attributi. L’obiettivo è predire un determinato target o valore a partire da un nuovo set di attributi.

Questo può essere utile in moltissimi campi di applicazione: dal sociale alla medicina, dalla manutenzione alla produzione industriale.

Ecco una carrellata di esempi:

lotti di produzione PC difettosi sulla base di attributi come temperatura (alta, media, bassa), velocità di produzione, tipo PC (standard, custom), qualità materiali (ottimo, scarso, buono). Riusciamo quindi ad identificare se un lotto sarà difettoso oppure no.
l’acquisto di un prodotto da parte di un potenziale cliente in base ad attributi quali dimensioni azienda (piccola, media o grossa), tipologia azienda (servizi o manifatturiera), prezzo del prodotto.
capire se una persona ha una determinata malattia sulla base di attributi quali sintomi, sesso, esami che determinano se l’individuo è malato oppure no.
capire se un macchinario industriale ha bisogno di manutenzione (in modo da prevenire eventuali guasti) sulla base del tempo di funzionamento, velocità di produzione, complessità del prodotto (semplice, medio, complesso).
…

Il modello matematico utilizzato è basato su record storici che sono stati preventivamente inseriti (training_set). In base a questi record è possibile predire una determinata condizione preventivamente inserita nel testing_set.

Il calcolo della probabilità condizionata per ognuna delle casistiche determina la probabilità che si verifichi l’evento 1 oppure l’evento 2.

La predizione verrà orientata sull’evento con più alta probabilità.

ad esempio:

Data la seguente traingin table, vogliamo predire il valore della riga segnata in giallo (testing table)

TIPO AUTO	TIPO GUIDA	TIPO STRADA	KM PERCORSI	PREZZO AUTO	TARGET
SUV	SPORTIVA	MISTO	4000	65000	NO MANUTENZIONE
UTILITARIA	PASSEGGIO	CITTA	80000	30000	MANUTENZIONE
SUV	PASSEGGIO	MISTO	15000	80000	NO MANUTENZIONE
UTILITARIA	SPORTIVA	CITTA	8000	20000	MANUTENZIONE
MONOVOLUME	SPORTIVA	MISTO	4000	65000	NO MANUTENZIONE
MONOVOLUME	LAVORO	CITTA	80000	40000	NO MANUTENZIONE
SUV	LAVORO	MISTO	250000	120000	MANUTENZIONE
UTILITARIA	LAVORO	AUTOSTRADA	70000	10000	MANUTENZIONE
*UTILITARIA*	*SPORTIVA*	*MISTO*	*200000*	*12000*	TO PREDICT

Secondo Naive Bayes il valore predetto è MANUTENZIONE : 3.6747338165603E-13

Se, invece di mettere 200.000 km percorsi mettiamo solo 20.000km allora la macchina risulta in NO MANUTENZIONE

qui l’esempio, potete provare a cambiare il testing set e visualizzare il valore predetto: ESEMPIO1

Clicca qui per la DEMO