Data Mining: softwere Java per analisi e gestione dati

In un precedente articolo, abbiamo già trattato l’importanza della gestione di grandi moli di dati e di come possa avere rilevanza all’interno delle procedure decisionali aziendali.  Possedere strumenti e conoscenze in questo ambito può diventare un fondamentale fattore competitivo all’interno del mercato globale attuale.
Adesso, la nostra nuova autrice, Giada, vi propone un esempio di software Java utilizzato nell’applicazione di tecniche di Data Mining attuato per osservare i comportamenti standard dei veicoli che attraversano un determinato tratto autostradale, per verificare eventuali comportamenti anomali.
(rimandiamo a  Mining analisi dati: come mai è così importante per le decisioni aziendali? )

Per approfondimenti e delucidazioni non esitate a contattarci!


Che cos’è il Data Mining?

 

Il Data Mining è un metodo che ha come obiettivo quello di estrapolare delle informazioni utili attraverso una mole considerevole di dati.
Il Data Mining si basa su due tipi di modelli:

Descrittivi: che hanno una descrizione dei dati facilmente comprensibile.

Predittivi: si basano su eventi ignoti o non ancora accaduti.

Analisi dei dati

Per questo articolo abbiamo analizzato i dati di traffico di una certa zona di Italia, tramite un database capace di raccogliere e analizzare i dati presenti. Un esempio concreto per capire cos’è il Data Mining.

Lo studio può essere suddiviso in tre fasi:

Analisi dati:
Lo studio si basa su dati ottenuti da particolari analisi, dove abbiamo potuto notare comportamenti anomali da parte di alcune vetture e situazioni particolari avvenute in specifici tratti di strada.

Elaborazione dati:
Dopo aver svolto il passaggio dell’analisi dati, il Data Mining si basa sull’elaborazione dei seguenti.
Per questo contenuto è stato usato uno script php da usare sul server attraverso il database

Interpretazione dei risultati:

Quest’ultima fase prevede appunto l’interpretazione dei risultati che abbiamo ottenuto attraverso le due fasi precedenti.

La fase antecedente all’ elaborazione dei dati, consiste in uno studio su come vengono analizzati. Ecco i risultati ottenuti:

-Record duplicati
-Rilevazioni basate su particolari targhe

-Alcune auto aventi la stessa targa, si trovano nello stesso istante in due varchi diversi

-Determinate auto non hanno le distanze coincidenti

Maggiore attenzione è stata riposta alla macchina numero 257, che nello stesso periodo di tempo sembrava presente su numerosi varchi.

Partendo da questi punti abbiamo deciso di creare un software java per verificare la correttezza dei dati.

L’ elaborazione dei dati forniti dal database è stata effettuata tramite il programma Script PHP, che è strettamente collegato al server dove è instaurato il database usato per analizzare i punti.

Una volta avviato il programma di Script PHP e dunque del server, è possibile distinguere due operazioni distinte:

Si va a creare una tabella
Che racchiude i tratti che soddisfano determinati requisiti

In seguito si modifica la cartella creata precedentemente per crearne un’altra basata sul passaggio di qualunque veicolo in uno specifico tratto di strada.

In seguito si crea una nuova tabella, per ottimizzare i dati ottenuti, tramite il comando SQL LEFT JOIN, mettendo in correlazione le tue tabelle già presenti sul database.

INTERPRETAZIONE RISULTATI FINALI

L’ ultima fase dello studio, si basa su un’analisi dei risultati ottenuti, tramite interrogazioni SQL al database. Infine si creeranno dei grafici con le relative statistiche ottenute alle prime 1000 targhe rilevate.

Lascia una risposta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *