Skip to main content

Cos'è l'integrazione dei dati?

L'integrazione dei dati è la fusione di più fonti di dati in un'unica fonte di dati.Questa pratica richiede spesso molto tempo e coinvolta, poiché le diverse fonti di dati sono probabilmente incompatibili tra loro.Le cose semplici come i nomi di colonne diversi su un foglio di calcolo sono sufficienti per richiedere il riformattazione della data.Questo processo è più comune in situazioni in cui due gruppi hanno iniziato senza connessione, ma sono messi insieme dopo aver lavorato in modo indipendente.L'integrazione dei dati è diventata un argomento più importante a causa della prevalenza di fonti di dati gratuite e database online.

La parte dei dati dell'integrazione dei dati può essere quasi tutto purché sia memorizzato in un sistema informatico.Il contenuto effettivo dei dati è raramente importante quanto il modo in cui vengono archiviati i dati.Il più delle volte, i dati sono conservati in database, sistemi di informazione organizzati.Questi sistemi contengono voci e campi unici che consentono agli utenti di trovare rapidamente informazioni.

Il più grande ostacolo a qualsiasi processo di integrazione dei dati è i dati stessi.In molti casi, quando i dati sono stati impostati per la prima volta, non vi era alcuna intenzione di unire il set di dati con un altro.Ciò significa che anche se due set di dati possono riferirsi alla stessa cosa, sono totalmente incompatibili.

Quasi tutto renderà incompatibili i database.Qualcosa di semplice come una differenza nella presentazione, come l'ordine del campo o la larghezza della colonna, può essere sufficiente per prevenire una facile fusione.Quando i dati sono significativamente diversi, come un database che contiene più o meno informazioni, la fusione è molto più difficile.

Le due situazioni che richiedono l'integrazione dei dati più di ogni altra sono nel settore e nei campi di ricerca.Nel mondo degli affari, la fusione dei dipartimenti o delle aziende richiede la combinazione delle informazioni precedentemente separate in un'unica struttura.Questa forma di integrazione è generalmente molto difficile a meno che i gruppi originali non utilizzassero software simili e non avessero obiettivi di informazione simili.

Quando viene eseguita l'integrazione dei dati per scopi di ricerca, generalmente diventa molto più fluido.Quando un ricercatore dà accesso alle sue informazioni a un altro, le due parti stanno generalmente esaminando lo stesso processo.Ciò significa che utilizzeranno metodi simili per il catalogo e archiviare i loro dati.

In passato, l'integrazione dei dati era un'area relativamente minore di studi sui dati, ma questo è cambiato dalla prima parte del 21 ° secolo.Con i database online gratuiti che diventano più popolari e accurati, le aziende si stanno arrampicando per ottenere le loro informazioni in un formato condivisibile.Ciò consente loro di rilasciare le loro informazioni in forma pubblica e di integrare le versioni private di interfacce pubbliche ben note nei loro sistemi.