- Consulting services
Matcher - AI duplicate removal: 7d Implementation
Matcher automatizza la pulizia dei dati trovando le righe duplicate (anche leggermente diverse) con algoritmi di machine learning. Si serve di Azure Container per lo sviluppo e Power BI per l'output.
This app is only available in Italian.
Matcher è uno strumento in grado di automatizzare il processo di pulizia dei dati, andando ad individuare le righe duplicate tramite algoritmi di machine learning. Si tratta di una soluzione rapida ed efficace per andare a migliorare la qualità del dato, identificando ad esempio all’interno delle anagrafiche i record appartenenti alla stessa entità. A differenza dei sistemi tradizionali di deduplica, Matcher si serve di un algoritmo di machine learning in grado di identificare non solo i record identici, ma anche record molto simili associabili alla stessa entità. Il servizio fa affidamento su Microsoft Azure Container per una gestione efficiente e sicura nonché per la distribuzione dell'output dell'algoritmo di intelligenza artificiale, mentre l'output vero e proprio viene reso disponibile in un sample di Microsoft Power BI.
UTILIZZO Questo strumento è utile per due tipologie principali di operazioni:
BENEFICI E PECULIARITA’
INPUT Per testare l’efficienza del prodotto occorre solamente fornire un file di qualche centinaio di righe, tra cui alcune ripetizioni.
DELIVERABLE Il modello identifica gruppi di istanze praticamente identiche, all’interno della base dati. Indicando quale tra le istanze è quella corretta, la base dati viene automaticamente deduplicata mantenendo la versione corretta di ciascuna istanza.
STEP DI IMPLEMENTAZIONE: