Apprendimento ad albero decisionale

L’algoritmo ad apprendimento ad albero consiste nel trovare una serie di domande che consentono di suddividere il dataset dei dati sulla base della caratteristica che produce il massino guadagno informativo. Ad esempio, nel caso volessimo identificare se un campione di sangue è affetto da anemia perniciosa possiamo addestrare il modello ponendo domande sul volume medio dei globuli rossi (< 12?) e sulla quantità di vitamina B12 (<187?) (ovviamente non sono gli unici indicatori ed è un esempio solo illustrativo ma serve per avere un quadro della situazione). In base alle risposte possiamo etichettare i campioni nella classe corrispondente.

L’obiettivo è suddividere i campioni in modo da avere il massimo guadagno informativo IG.

Il guadagno informativo è descritto in questo modo:

IG(Dp,f)=I(Dp)-∑mj=1 Nj/Np I(Dj)

dove f è la carattersitica su cui si basa la suddivisione. Dp, Dj sono il datase del genitore e del j-esimo figlio. I è la misura di impurità. Np, Nj sono rispettivamente il numero di campioni dei genitori e del j-esimo figlio. Dall’equazione, minore è l’impurità dei figli e maggiore sarà il guadagno informativo.

Come individuiamo le impurità? generalmente vengono utilizzati 3 criteri di suddivisione o misure di impurità. Definendo p(i|t) come la proporzione dei campioni che appartengono al nodo t avremo:

Entropia Ih: è massima se tutti i campioni appartengono in maniera uniforme alle diverse classi. Considerando una classificazione binaria, sarà Ih= 1 se sono distruibuiti uniformemente per le due classi, quindi, p(i=1|t)=0,5. Sarà Ih=0 se tutti i campioni appartengono ad una o ad un’altra classe, quindi, p(i=1|t)=1 oppure P(i=0|t)=0. L’entropia cerca di massimizzare l’informazione reciproca all’interno di un albero.

Impurità di Gini Ig: cerca di minimizzare la probabilità di errori di classificazione. Maggiore è la mescolanza delle classi e maggiore sarà l’impurità di Gini.

Errore di classificazione Ie: utilizzato per la potatura di alberi decisionali. Se parto da un nodo padre e trovo un criterio di suddivisione che classifica tutti i campioni su una determinata classe, avrò diminuito le dimensioni dell’albero ma avrò aumentato l’errore di classificazione.

criteri di suddivisione dell’albero decisionale

TrackBPM: nuova tecnologia per la tracciabilità dei prodotti. Adatto per qualsiasi flusso aziendale e per qualsiasi prodotto

TrackBMP è un’app android che integra i prodotti OpenSource Adempiere + Configuratore di Processo + WebServices.

Il risultato è un’app interessante che esegue il tracking dei prodotti di qualsiasi tipo.

TrackBPM

punti di forza:

  1. gestione e creazione workflow semplice e veloce grazie al configuratore di processo
  2. gestione workflow flessibile per qualsiasi processo aziendale: tracking di automobili in riparazione (dalla prenotazione alla riparazione), tracking di cartelle cliniche per ospedali, tracking di prodotti postali…
  3. tracking dei prodotti aziendali su database centralizzato con informazioni riguardo lo stato del workflow, le informazioni generali del prodotto/item e lo storico del prodotto.
  4. possibilità di eseguire il checkIn sui prodotti attraverso l’app android TrackBPM e direttamente da tag NFC (o codici a barre)
  5. Visualizzazione delle informazioni su ogni prodotto/item in qualsiasi momento e con il proprio device mobile
  6. Costi di configurazione e di implementazione ridotti per via dell’impiego di software OpenSource.
  7. TrackBPM è adatto a qualsiasi realtà aziendale.
  8. Ottimizzazione e migliore organizzazione flussi informativi aziendali

Nell’esempio mostriamo l’utilizzo dell’applicazione TrackBPM in un processo già preimpostato sul configuratore di processo: la riparazione di automobili.

Nella figura l’utente Matt Smith con ruolo logistics esegue l’operazione di Information sull’item 1000020. L’applicazione risponde prelevando dati dal server centralizzato Adempiere e fornisce indicazioni circa lo stato attuale del prodotto. Nell’esempio si tratta di un automobile StationWagon in stato in repair.

Tutto configurabile sul configuratore di processo

infoItem

Matt Smith decide di controllare lo storico dello stesso prodotto.

storico

Nella figura di sopra notiamo che il prodotto ha subito tre transazioni:

  1.  stato Reservation: creato da David Brown (un operatore del call center) direttamente da un terminale web. Oltre allo stato ed alla data di ingresso è possibile visualizzare anche la descrizione rilasciata dall’operatore David Brown.
  2. stato In House: il prodotto è entrato in questo stato grazie al CheckIn effettuato dall’utente Matt Smith (della logistica) attraverso l’app TrackBPMTrackBPM ha eseguito il passaggio di stato da Reservation a In House grazie ad una condizione sul configuratore di processo legata al ruolo di chi effettua il check-in. In questo caso l’utente ha ruolo logistics ed é colui che registra l’ingresso del veicolo.
  3. Stato in repair: una volta che il prodotto (automobile) é entrato in azienda può andare in riparazione. Mario Rossi esegue il CheckIn ed inizia la riparazione. Il check-in esegue il passaggio di stato da in house a in repair sempre grazie al ruolo di chi lo ha effettuato. In questo caso Mario Rossi é il meccanico con ruolo labs che mette la vettura in riparazione.

Per approfondire e per un preventivo non esitare a contattarci.

 

Configuratore di processo

Il configuratore di processo è un plugin di Adempiere in grado di configurare ed implementare un processo operativo aziendale.

E’ possibile implementare un qualsiasi processo operativo ed è perfettamente integrato con tutte le principali funzionalità del gestionale ERP.

Leggi tutto “Configuratore di processo”

Il database: una risorsa importantissima per le imprese

Non si può parlare di gestionali aziendali senza spendere due parole sui database.

Il database, purtroppo, passa spesso inosservato agli occhi di chi acquista un gestionale aziendale eppure gioca un ruolo di fondamentale importanza sia nelle performance di tutto il sistema gestionale che di contenuto.

2000px-Applications-database Leggi tutto “Il database: una risorsa importantissima per le imprese”