Startseite » Datenbank Lexikon » Dublettenprüfung

Dublettenprüfung

Dublettenprüfungen werden in großen Datenbanken angewendet. Existiert eine Datenbank über einen längeren Zeitraum, kann es passieren, dass Werte mit derselben Bedeutung in unterschiedlichen Formen abgelegt werden.

Wird beispielsweise die Telefonnummer eines Kunden unbeabsichtigt mit und ohne Ländervorwahl gespeichert, belegt sie den doppelten Platz in der Datenbank. Ein solcher überflüssiger Datenbankeintrag wird Dublette genannt.

Eine Dublettenprüfung wird auf eine Datenbank angewendet, um solche Dubletten zu erkennen und zu bereinigen. Dabei ist es besonders wichtig, die Daten erneut auf Richtigkeit zu prüfen und ob es sich dabei tatsächlich um dieselbe Information handelt. In diesem Fall werden die doppelt vorhandenen Daten zu einem einheitlichen Wert zusammengeführt.

Dublettenprüfung – Aufbau und Funktion

Bei einer Dublettenprüfung wird zuallererst die vorhandene Datenbank auf Dubletten überprüft. Dafür werden unterschiedliche Algorithmen verwendet, die als Ergebnis eine Liste der Dubletten enthalten.

Danach werden die Dubletten erneut geprüft, ob sich die Informationen tatsächlich nicht unterscheiden.

Anschließend werden entweder die Informationen in einem Feld der Datenbank verworfen, wenn es sich um eine doppelte Information handelt oder die Informationen werden in einem gemeinsamen Feld zusammengeführt.

Vorteile einer Dublettenprüfung

Mithilfe einer Dublettenprüfung kann die Qualität der Datenbank deutlich gesteigert werden. Es existieren keine unnötig vorkommenden Informationen. Das spart zum einen Speicherplatz und zum anderen werden Anfragen an die Datenbank schneller abgearbeitet, da weniger Einträge durchlaufen werden müssen.

Des Weiteren können Dubletten Analysen eines Unternehmens verfälschen. Als Ergebnis einer solchen Verfälschung kann ein Unternehmen strategisch schlechtere Entscheidungen treffen. Dies kann ebenfalls durch eine Dublettenprüfung verhindert werden. Doppelt angelegte Adresssätze sorgen für mehrfach verschickte Post an den Kunden. Diese mehrfache Post kostet ein Unternehmen nicht nur viel Geld, sondern sorgt auch für ein schlechtes Ansehen bei den Kunden.

Dublettenprüfung in der Praxis

Am häufigsten werden Dublettenprüfungen in Adressdatenbanken verwendet, da Adressdubletten in mehreren Bereichen negative Auswirkungen für das Unternehmen haben.

Aufgrund unterschiedlicher Schreibweisen für Adressen entstehen Adressdubletten sehr schnell. Möglich Tippfehler sorgen ebenfalls für Adressdubletten in der Datenbank. Dabei kann es sich um einen anders abgekürzten Namen handeln, einen unterschiedlich abgekürzten Straßennamen oder eine andere Abkürzung für die Anrede.

Deshalb werden Adressdatenbanken regelmäßig einer Dublettenprüfung unterzogen. Sie hilft die Dubletten in der Datenbank zu finden, gleicht diese untereinander ab und führt die Daten zu einem Datenbankeintrag zusammen.

Weiterführende Artikel

Autor: Kristina
2 Bewertungen 1 Stern2 Sterne3 Sterne4 Sterne5 Sterne
Loading...
0