
Normalizar direcciones de calles. Alguna idea?
Publicado por patricio (1 intervención) el 02/04/2014 22:05:45
Hola!. Estoy trabajando en un proyecto y tengo la siguiente problemática:
En mysql tengo una base de datos con cientos de miles de registros con direcciones del siguiente tipo:
1 B . OHGGINS 980 | santiago
2 BALMACEDA 877 | iquique
3 BALMACEDA 2355 L102B | iquique
4 BDO OHIGGINS 299 | santiago
5 BICENTENARIO 3963 | providencia
6 BRASIL | 13101
7 CAPITAN AVALOS | arica
8 CARLOS IBANEZ | valparaíso
9 CENTRAL 555 | concepción
10 COLLAO 777 | concepción
Por otro lado tengo todos los nombres de las vías del país escritos correctamente, asociado a todos los errores posibles (o casi) de escritura, ejemplo:
Via bien escrita | comuna
AARON_COPLAND | Lo Prado
Via mal escrita | comuna
AAARON COPLAN | Lo Prado
AAAAARON COPLAND | Lo Prado
Con lo anterior como resumen. Lo que necesito hacer con php y mysql es normalizar de forma masiva toda la base de datos con direcciones que tengo, en base a los nombres de vía bien escritos e incorrectos asociados que también tengo.
Posterior a esto, el resultado, segmentar los campos principales. Por ejemplo:
Antes
B . OHGGINS 980
Después
Libertador Bernardo Ohiggins 980
Segmentado
calle | numero
libertador bernardo ohiggins | 980
Cualquier idea para lograr hacer esta aplicación web será genial.
Muchas gracias!!
En mysql tengo una base de datos con cientos de miles de registros con direcciones del siguiente tipo:
1 B . OHGGINS 980 | santiago
2 BALMACEDA 877 | iquique
3 BALMACEDA 2355 L102B | iquique
4 BDO OHIGGINS 299 | santiago
5 BICENTENARIO 3963 | providencia
6 BRASIL | 13101
7 CAPITAN AVALOS | arica
8 CARLOS IBANEZ | valparaíso
9 CENTRAL 555 | concepción
10 COLLAO 777 | concepción
Por otro lado tengo todos los nombres de las vías del país escritos correctamente, asociado a todos los errores posibles (o casi) de escritura, ejemplo:
Via bien escrita | comuna
AARON_COPLAND | Lo Prado
Via mal escrita | comuna
AAARON COPLAN | Lo Prado
AAAAARON COPLAND | Lo Prado
Con lo anterior como resumen. Lo que necesito hacer con php y mysql es normalizar de forma masiva toda la base de datos con direcciones que tengo, en base a los nombres de vía bien escritos e incorrectos asociados que también tengo.
Posterior a esto, el resultado, segmentar los campos principales. Por ejemplo:
Antes
B . OHGGINS 980
Después
Libertador Bernardo Ohiggins 980
Segmentado
calle | numero
libertador bernardo ohiggins | 980
Cualquier idea para lograr hacer esta aplicación web será genial.
Muchas gracias!!
Valora esta pregunta


0