InformaticaGestionale.it propone ai suoi lettori il nuovo servizio online che sfrutta il teorema diBayesper fare predizioni di qualsiasi tipo grazie ad un set di dati storici eseguiti su specifici attributi. L’obiettivo è predire un determinato target o valore a partire da un nuovo set di attributi.
Questo può essere utile in moltissimi campi di applicazione: dal sociale alla medicina, dalla manutenzione alla produzione industriale.
Ecco una carrellata di esempi:
- lotti di produzione PC difettosi sulla base di attributi come temperatura (alta, media, bassa), velocità di produzione, tipo PC (standard, custom), qualità materiali (ottimo, scarso, buono). Riusciamo quindi ad identificare se un lotto sarà difettoso oppure no.
- l’acquisto di un prodotto da parte di un potenziale cliente in base ad attributi quali dimensioni azienda (piccola, media o grossa), tipologia azienda (servizi o manifatturiera), prezzo del prodotto.
- capire se una persona ha una determinata malattia sulla base di attributi quali sintomi, sesso, esami che determinano se l’individuo è malato oppure no.
- capire se un macchinario industriale ha bisogno di manutenzione (in modo da prevenire eventuali guasti) sulla base del tempo di funzionamento, velocità di produzione, complessità del prodotto (semplice, medio, complesso).
- …
Il modello matematico utilizzato è basato su record storici che sono stati preventivamente inseriti (training_set). In base a questi record è possibile predire una determinata condizione preventivamente inserita neltesting_set.
Il calcolo della probabilità condizionata per ognuna delle casistiche determina la probabilità che si verifichi l’evento 1 oppure l’evento 2.
Lapredizioneverrà orientata sull’evento con più alta probabilità.
ad esempio:
Data la seguente traingin table, vogliamo predire il valore della riga segnata in giallo (testing table)
TIPO AUTO | TIPO GUIDA | TIPO STRADA | KM PERCORSI | PREZZO AUTO | TARGET |
SUV | SPORTIVA | MISTO | 4000 | 65000 | NO MANUTENZIONE |
UTILITARIA | PASSEGGIO | CITTA | 80000 | 30000 | MANUTENZIONE |
SUV | PASSEGGIO | MISTO | 15000 | 80000 | NO MANUTENZIONE |
UTILITARIA | SPORTIVA | CITTA | 8000 | 20000 | MANUTENZIONE |
MONOVOLUME | SPORTIVA | MISTO | 4000 | 65000 | NO MANUTENZIONE |
MONOVOLUME | LAVORO | CITTA | 80000 | 40000 | NO MANUTENZIONE |
SUV | LAVORO | MISTO | 250000 | 120000 | MANUTENZIONE |
UTILITARIA | LAVORO | AUTOSTRADA | 70000 | 10000 | MANUTENZIONE |
UTILITARIA | SPORTIVA | MISTO | 200000 | 12000 | TO PREDICT |
SecondoNaive Bayesil valore predetto èMANUTENZIONE: 3.6747338165603E-13
Se, invece di mettere 200.000 km percorsi mettiamo solo 20.000km allora la macchina risulta inNO MANUTENZIONE
qui l’esempio, potete provare a cambiare il testing set e visualizzare il valore predetto:ESEMPIO1
Clicca qui per la DEMO