Was ist die Datenintegration?
Datenintegration ist die Verschmelzung mehrerer Datenquellen in eine einzelne Datenquelle.Diese Praxis ist oft sehr zeitaufwändig und involviert, da die verschiedenen Datenquellen wahrscheinlich nicht miteinander vereinbar sind.Dinge, die so einfach wie unterschiedliche Spaltennamen in einer Tabelle ausreichen, reichen aus, um das Datum -Reformating zu erfordern.Dieser Prozess ist am häufigsten in Situationen, in denen zwei Gruppen ohne Verbindung begannen, aber zusammengestellt werden, nachdem sie unabhängig gearbeitet haben.Die Datenintegration ist aufgrund der Prävalenz kostenloser Datenquellen und Online -Datenbanken zu einem wichtigeren Thema geworden.
Der Datenteil der Datenintegration kann fast alles sein, solange sie in einem Computersystem gespeichert sind.Der tatsächliche Inhalt der Daten ist selten so wichtig wie die Art und Weise, wie die Daten gespeichert werden.Meistens werden die Daten in Datenbanken, organisierte Informationssysteme, aufbewahrt.Diese Systeme enthalten eindeutige Einträge und Felder, mit denen Benutzer Informationen schnell finden können.
Die größte Hürde für jeden Datenintegrationsprozess sind die Daten selbst.In vielen Fällen, als die Daten zum ersten Mal eingerichtet wurden, gab es keine Absicht, den Datensatz jemals mit einem anderen zu verschmelzen.Dies bedeutet, dass zwei Datensätze, obwohl sie sich möglicherweise auf dasselbe beziehen, völlig inkompatibel sind.
Fast alles wird Datenbanken nicht kompatibel machen.Etwas so Einfaches wie ein Unterschied in der Präsentation, wie z. B. Feldreihenfolge oder Spaltenbreite, kann ausreichen, um eine einfache Fusion zu verhindern.Wenn die Daten erheblich unterschiedlich sind, wie z. B. eine Datenbank, die mehr oder weniger Informationen enthält, ist die Verschmelzung viel schwieriger.
Die beiden Situationen, die die Datenintegration mehr als jedes andere erfordern, sind im Geschäft und in den Forschungsfeldern.In der Geschäftswelt erfordert das Zusammenführen von Abteilungen oder Unternehmen die Kombination der zuvor getrennten Informationen in eine einzelne Struktur.Diese Form der Integration ist im Allgemeinen sehr schwierig, es sei denn, die ursprünglichen Gruppen verwendeten ähnliche Software und hatten ähnliche Informationsziele.
Wenn die Datenintegration für Forschungszwecke durchgeführt wird, wird sie im Allgemeinen viel reibungsloser.Wenn ein Forscher Zugang zu seinen Informationen an einen anderen gewährt, untersuchen die beiden Parteien im Allgemeinen denselben Prozess.Dies bedeutet, dass sie ähnliche Methoden verwenden, um ihre Daten zu katalogisieren und zu speichern.
In der Vergangenheit war die Datenintegration ein relativ geringfügiger Bereich von Datenstudien, aber dies hat sich seit dem Anfang des 21. Jahrhunderts geändert.Mit kostenlosen Online -Datenbanken werden die Unternehmen unternommen, um ihre Informationen in einem gemeinsam genutzbaren Format zu erhalten.Dies ermöglicht es ihnen, ihre Informationen in öffentlicher Form zu veröffentlichen und private Versionen bekannter öffentlicher Schnittstellen in ihre Systeme zu integrieren.