Skip to main content

Wat is schema -matching?

Schema -matching is een techniek die wordt gebruikt om twee of meer complexe databases of sets informatie in elkaar samen te voegen.Naarmate het gebruik van databases en elektronische informatieopslag groter en complexer wordt via internet, moeten er gedefinieerde methoden zijn voor het samenvoegen van sets van gegevens van de ene database naar de andere, en schema -matching is zo'n techniek.Het concept is eenvoudig, maar de realiteit van het samenvoegen van gegevens is redelijk complex.

De term schema -matching wordt synoniem gebruikt met schemamapping, omdat gebruikers daadwerkelijk gegevens toewijzen en niet overeenkomen met deze.Twee of meer databases worden in kaart gebracht en vergelijkbare aspecten van elke database worden in elkaar toegewezen.De meest gebruikelijke manier om gegevens samen te voegen, is door exacte referenties te gebruiken.Een voorbeeld van deze stijl van fuseren is het combineren van de naamkolom van de ene database met de naamkolom van een andere database.

Mening is meestal niet zo eenvoudig, voor mensen of computers.Met zoveel gegevens die moeten worden gefilterd, gecombineerd en gebruikt, is het hebben van één database in plaats van meerdere databases essentieel.Schema -mapping richt zich op het geautomatiseerd en efficiënter maken van dit vervelende proces.Een voorbeeld van waar schema -matching nodig is, zou kunnen zijn wanneer een database een belangrijk veld van studenten heeft en een andere database het vakgebied van de student heeft.Het is dezelfde informatie, maar de iets verschillende titels bemoeilijken de inspanningen om het te mengen.

-matching breekt dit complexe proces van het samenvoegen van databases in vier stappen: pre-integratie, vergelijking, conforming en samenvoegen.Voordat meerdere databases kunnen worden samengevoegd, moeten ze worden geanalyseerd op overeenkomsten en verschillen.In het rijk van schemale matching staat dit bekend als pre-integratie.De computer begint de meest efficiënte integratiemethode te bepalen. Vervolgens evalueert de computer de schema's door ze met elkaar op een meer gedetailleerd niveau te vergelijken.In de vergelijkingsstap kijkt de computer naar elke database -invoer en bepaalt waar er conflicten kunnen zijn.Een voorbeeld hiervan is wanneer het veld van een student de arts opsomt en een andere database vermeldt het als arts.Een persoon zou waarschijnlijk de informatie als hetzelfde herkennen, maar voor databasetools zijn het twee afzonderlijke entiteiten. Zodra de computer alle potentiële conflicten heeft bepaald, kan deze verder gaan met het proberen de problemen op te lossen.Dit kan zo eenvoudig zijn als alle instanties van artsen in de arts veranderen.In werkelijkheid is het proces aanzienlijk complexer. Zodra alle conflicten zijn opgelost, kan de computer doorgaan met het samenvoegen van de gegevens in het schema-matchingproces.In dit stadium worden twee of meer databases samengevoegd tot één grote database.Als alles goed gaat, zullen er geen conflicten of fouten optreden tijdens integratie en toekomstige toegang tot de database.