Adressdatenabgleich bei der EVN

Grafische Auswertung der Redundanzprüfung bei Adresskoordinaten

Text: Ing. Otto Heilig, EVN Geoinfo

 

Jeder kennt das Problem von unterschiedlich geschriebenen und mehrfach erfassten Adressen, besonders wenn diese aus unterschiedlichen Quellen stammen. Man kommt zwar mit Texterkennungsalgorithmen weit, doch ist dabei das Potential von unerkannten Fehlern relativ groß.


Im Zuge der Leitungsdokumentation werden die Adressen der EVN-Kunden mit Koordinaten erweitert. So sind mittlerweile mehr als 530.000 Adressen georeferenziert und somit für jedes GIS ein wertvoller Datenbestand. Der Umstand, jede Adresse geografisch positioniert zu haben, erlaubt damit eine Datenprüfung auf mögliche Redundanz.

 

Probleme bei der Redundanzprüfung

Eine einfache Berechnung mit der Vorgabe eines Mindestabstands ergibt aber auch Fehler, die keine sind. So wird beispielsweise eine Reihenhaussiedlung mit schmalen Parzellen als großer Problemfall verkannt.


So funktioniert´s mit FME
Eine ideale Hilfestellung bietet nun der FME Transformer „CircularityCalculator“. Im Wesentlichen werden die Adressen unter einem Mindestabstand ermittelt und dann zu einer Fläche vereinigt. Das Verhältnis von Breiten- und Längenausdehnung ist nun das Maß für die Fehlerwahrscheinlichkeit. Längliche Flächen, wie die erwähnte Reihenhaussiedlung, werden somit als richtig bewertet und eine Wohnhausanlage, bei der jede Türnummer eine eigene Adressposition hat, als Redundanz ausgewiesen.


Die so erkannten potentiellen Fehler werden in eine Datenbank geschrieben und von Mitarbeiten im Quellsystem bearbeitet. Wird dabei ein Fall einmal als korrekt bewertet, erfolgt ein Vermerk in der Datenbank. Dadurch kann diese Datenprüfung jederzeit wiederholt werden, ohne bereits geprüfte Fälle wieder im Ergebnis zu erhalten.
Diese Prüfung dauert für den gesamten Adressdatenbestand ca. 20 Minuten.
In Zukunft werden auch die Höhenmodelle aus Laserscan-Daten einen wesentlichen Beitrag zur Qualitätssicherung leisten.


Technische Details
EVN Geoinfo betreibt FME auf 64bit Windows Server 2003 mit 8 Cores und 16 GB RAM. Im Server sind Festplatten in RAID 10 Anordnung eingebaut, was einen enormen Datendurchsatz für die Ablage von Zwischenergebnissen ermöglicht. An diesem Server ist ein Storagesystem von 4 TB angeschlossen.


FME im EVN-Konzern
FME spielt in der GIS-Datenqualitätssicherung bei EVN eine zentrale Rolle. Die hohe Flexibilität und der Einsatz auf 64bit-Systemen schafft damit ein mächtiges Werkzeug zur Bewältigung geografischer Massendaten. Jedes GIS, in dem Daten erzeugt werden, hat Stärken, aber auch Schwächen. FME bezieht dabei die Stelle des unparteiischen Dritten.

Top