Predizione di un evento attraverso Naive Bayes OnLine

InformaticaGestionale.it propone ai suoi lettori il nuovo servizio online che sfrutta il teorema di Bayes per fare predizioni di qualsiasi tipo grazie ad un set di dati storici eseguiti su specifici attributi. L’obiettivo è predire un determinato target o valore a partire da un nuovo set di attributi.

Questo può essere utile in moltissimi campi di applicazione: dal sociale alla medicina, dalla manutenzione alla produzione industriale.

Ecco una carrellata di esempi:

  1. lotti di produzione PC difettosi sulla base di attributi come temperatura (alta, media, bassa), velocità di produzione, tipo PC (standard, custom), qualità materiali (ottimo, scarso, buono). Riusciamo quindi ad identificare se un lotto sarà difettoso oppure no.
  2. l’acquisto di un prodotto da parte di un potenziale cliente in base ad attributi quali dimensioni azienda (piccola, media o grossa), tipologia azienda (servizi o manifatturiera), prezzo del prodotto.
  3. capire se una persona ha una determinata malattia sulla base di attributi quali sintomi, sesso, esami che determinano se l’individuo è malato oppure no.
  4. capire se un macchinario industriale ha bisogno di manutenzione (in modo da prevenire eventuali guasti) sulla base del tempo di funzionamento, velocità di produzione, complessità del prodotto (semplice, medio, complesso).

Il modello matematico utilizzato è basato su record storici che sono stati preventivamente inseriti (training_set). In base a questi record è possibile predire una determinata condizione preventivamente inserita nel testing_set.

Il calcolo della probabilità condizionata per ognuna delle casistiche determina la probabilità che si verifichi l’evento 1 oppure l’evento 2.

La predizione verrà orientata sull’evento con più alta probabilità.

 

ad esempio:

Data la seguente traingin table, vogliamo predire il valore della riga segnata in giallo (testing table)

 

TIPO AUTO TIPO GUIDA TIPO STRADA KM PERCORSI PREZZO AUTO TARGET
SUV SPORTIVA MISTO 4000 65000 NO MANUTENZIONE
UTILITARIA PASSEGGIO CITTA 80000 30000 MANUTENZIONE
SUV PASSEGGIO MISTO 15000 80000 NO MANUTENZIONE
UTILITARIA SPORTIVA CITTA 8000 20000 MANUTENZIONE
MONOVOLUME SPORTIVA MISTO 4000 65000 NO MANUTENZIONE
MONOVOLUME LAVORO CITTA 80000 40000 NO MANUTENZIONE
SUV LAVORO MISTO 250000 120000 MANUTENZIONE
UTILITARIA LAVORO AUTOSTRADA 70000 10000 MANUTENZIONE
UTILITARIA SPORTIVA MISTO 200000 12000 TO PREDICT

 

Secondo Naive Bayes il valore predetto è MANUTENZIONE : 3.6747338165603E-13

Se, invece di mettere 200.000 km percorsi mettiamo solo 20.000km allora la macchina risulta in NO MANUTENZIONE

qui l’esempio, potete provare a cambiare il testing set e visualizzare il valore predetto: ESEMPIO1

Clicca qui per la DEMO

Idempiere IOT: Esempio di digitalizzazione delle cartelle per studi professionali

La piattaforma che vi faremo vedere permette di virtualizzare (digitalizzare) cartelle cartacee per studi legali, commercialisti, cliniche, architettura ecc.

Ecco l’elenco delle principali funzionalità:

  • Anagrafica: Creazione di una cartella virtuale
    • inserimento anagrafica cliente,
    • prodotto
    • assegnazione della cartella ad un utente/dipendente dello studio
    • prezzo della prestazione
    • data prossimo incontro (es. incontro con l’avvocato o visita ambulatoriale o visita appartamento nel caso di uno studio di architettura…)
    • data prossima scadenza (es. udienza, esame clinico…)
    • inserimento di qualsiasi tipo di allegato
  • Stampa ed assegnazione del QRCode
    • il QRCode viene fornito direttamente dalla cartella virtuale. Sarà quindi possibile attaccare il QRCode al faldone cartaceo in modo da prelevare le informazioni attraverso uno smartphone
  • Flusso di stati: di default il sistema presenta 3 stati (accettazione, in progress e completo). Questo flusso è possibile personalizzarlo in modo che si adatti meglio alle proprie esigenze. Per ogni transazione devono essere soddisfatte alcune condizioni già preimpostate (come ad esempio l’inserimento dell’anagrafica cliente)
  • Analisi: nella dashboard iniziale il sistema presenta i giorni mancanti alla data del prossimo appuntamento, la conta dei faldoni virtuali per ogni stato, a chi sono assegnati i faldoni ed il prezzo totale guadagnato.

Per ulteriori informazioni visitare il sito www.interofthings.com

 

Era dei dati, chi li sfrutta meglio vince?

Da diverso tempo è in atto una trasformazione del web.

Il web inteso come insieme di informazioni, o meglio, insieme di documenti tra loro collegati sta evolvendo verso un web inteso come un insieme di dati tra loro collegati.

Nel web di documenti le informazioni sono esposte in modo da renderle perfettamente human-friendly, nel web di dati connessi le informazioni sono prevalentemente esposte in forma machine-friendly nel rispetto di standard come RDF, XML, JSON.

Ma perchè questa necessità? semplice, gli essere umani non riescono più da diverso tempo a gestire la grossa mole di informazioni che regna su internet e si stanno attrezzando per delegare la gestione alle macchine. Considerando poi che i dati costituiscono una grossa fonte di ricchezza, pare evidente che chi li gestisce meglio  avrà anche un ritorno economico non indifferente.

Ed è così che nascono tematiche come: Opendata, linkedOpenData, BigData, Internet of Things…

In realtà questa trasformazione prevede anche un’altra grande caratteristica: la capacità di interconnettersi con altre realtà siano esse pubbliche o private. Infatti, per far in modo che le grosse quantità di dati abbiano un senso, è necessario individuarne il contesto. Per individuare il contesto su cui opera un dato è necessario creare una connessione verso un altro dato.

In poche parole ogni singola entità, oltre a saper gestire le informazioni, deve anche essere in grado di interconnettersi con altre entità ed adottare standard comuni.

apertura vs chiusura

Molte grandi aziende hanno ormai iniziato ad adottare politiche di apertura verso il mondo esterno (condivisione dati, api per sviluppatori, utilizzo standard comuni). Molte altre, invece, mantengono comunque una linea di completa chiusura verso il mondo esterno custodendo gelosamente i propri dati.

Chi tra queste aziende avrà ragione, scriverà la storia.