Standaryzacja adresów
Usługa standaryzacji danych adresowych nazwana potocznie "czyszczeniem danych" ma na celu zapewnić wysoką jakość adresów.
Usługa ta obejmuje:
Normalizację, czyli podzielenie danych na części składowe (ang. parsing)
- oczyszczenie wpisów z niedozwolonych znaków
- oddzielenie kodu pocztowego od nazwy miasta
- oddzielenie numeru ulic od nazwy ulicy
- oddzielenie numeru mieszkania od numeru domu
- rozdzielenie ulic opisujących róg/skrzyżowanie
- oddzielenie dodatkowych informacji opisujących położenie
- oczyszczenie wpisów ze znaków niedozwolonych
Standaryzację czyli sprowadzenie różnych zapisów tej samej nazwy do jednej postaci, zgodnej ze słownikiem
- sprawdzenie poprawności kodu pocztowego
- standaryzacja nazwy miejscowości
- standaryzacja nazw(y) ulicy w oparciu o słownik dla danego miasta
- standaryzacja nazwy firmy
- standaryzacja imion osób fizycznych
- sprawdzenie wystąpienia nazwiska na liście unikalnych nazwisk występujących w bazie PESEL
- opcjonalnie: automatyczna standaryzacja nazw stanowisk
- walidacja sum kontrolnych NIP, REGON