Publicado el 14 de Enero del 2017
1.121 visualizaciones desde el 14 de Enero del 2017
4,0 MB
161 paginas
Creado hace 12a (04/03/2013)
Universidad Nacional de Educación a Distancia
Máster en Lenguajes y Sistemas Informáticos
PROPUESTA DE BÚSQUEDA SEMÁNTICA:
APLICACIÓN AL CATÁLOGO DE MAPAS, PLANOS Y
DIBUJOS DEL ARCHIVO GENERAL DE SIMANCAS
Autor: Jose Alberto Benítez Andrades
Directora: Ana Mª García Serrano
Febrero 2013
PROPUESTA DE BÚSQUEDA SEMÁNTICA: APLICACIÓN AL CATÁLOGO DE MAPAS, PLANOS Y DIBUJOS DEL ARCHIVO GENERAL DE SIMANCAS SIMANCAS
Jose Alberto Benítez Andrades Máster en Lenguajes y Sistemas Informáticos
ÍNDICE DE CONTENIDO
ÍNDICE DE CONTENIDO ................................................................................................................. 2
ÍNDICE DE FIGURAS ....................................................................................................................... 4
ÍNDICE DE TABLAS ......................................................................................................................... 6
INTRODUCCIÓN ............................................................................................................................. 7
PARTE 1: PANORAMA TECNOLÓGICO ........................................................................................... 9
1. WEB SEMÁNTICA ..................................................................................................................... 11
1.1. HERRAMIENTAS Y ESTÁNDARES ....................................................................................... 15
1.1.1. LAS ONTOLOGÍAS Y SUS ESTÁNDARES: RDF, OWL Y SPARQL ................................... 16
1.1.2. ¿POR QUÉ DESARROLLAR UNA ONTOLOGÍA? ........................................................... 18
1.1.3. HERRAMIENTA DE DESARROLLO: PROTÉGÉ .............................................................. 19
1.2. DESCRIPCIÓN DE CONTENIDOS: RDF DUBLIN CORE ........................................................ 20
1.2.1. ELEMENTOS DUBLIN CORE ........................................................................................ 23
1.2.2. DESCRIPCIÓN DE OWL ............................................................................................... 30
1.3 TRABAJOS RELACIONADOS ................................................................................................ 32
2. RECUPERACIÓN DE INFORMACIÓN ......................................................................................... 35
2.1. HERRAMIENTAS ................................................................................................................ 38
2.1.1. LUCENE ...................................................................................................................... 38
2.1.2. APACHE SOLR ............................................................................................................ 41
2.1.3. SPARQL ...................................................................................................................... 42
2.2. TRABAJOS RELACIONADOS ............................................................................................... 45
3. ANÁLISIS DEL DOMINIO: CATÁLOGO ON-LINE ........................................................................ 61
PARTE 2: TRABAJO REALIZADO Y EXPERIMENTOS ...................................................................... 65
4. PROPUESTAS PARA ALMACENAMIENTO DEL CATÁLOGO Y GESTIÓN DE LA BÚSQUEDA ....... 67
4.1. CONVERSIÓN DE FORMATO RDF DUBLIN CORE A OWL. ................................................. 68
4.2. MODELO ONTOLÓGICO CON PROTÉGÉ. .......................................................................... 75
4.3. MODELO TEXTUAL CON SOLR .......................................................................................... 79
4.4. PROPUESTA DE BÚSQUEDA SEMÁNTICA ......................................................................... 80
5. EXPERIMENTACIÓN ................................................................................................................. 85
5.1. CLASIFICACIÓN DE CONSULTAS........................................................................................ 85
5.2. BÚSQUEDAS FACETADA Y TEXTUAL (SIN FACETAR) ......................................................... 90
2
PROPUESTA DE BÚSQUEDA SEMÁNTICA: APLICACIÓN AL CATÁLOGO DE MAPAS, PLANOS Y DIBUJOS DEL ARCHIVO GENERAL DE SIMANCAS SIMANCAS
Jose Alberto Benítez Andrades Máster en Lenguajes y Sistemas Informáticos
5.2.1. FUNCIONAMIENTO DE CONSULTAS EN SOLR ........................................................... 90
5.2.2. PARSER SEMÁNTICO QUE TRADUCE CONSULTAS A LENGUAJE SOLR ....................... 96
5.3 COMPARACIÓN DE LOS RESULTADOS OBTENIDOS EN BÚSQUEDAS TEXTUALES Y
FACETADAS .............................................................................................................................. 99
5.3.1. MEDIDAS DE EVALUACIÓN ........................................................................................ 99
5.3.2. RESULTADOS Y SU COMPARACIÓN ......................................................................... 101
5.3.3. CONSULTAS SPARQL EN PROTÈGÈ .......................................................................... 111
6. CONCLUSIONES Y FUTURAS LÍNEAS DE TRABAJO. ................................................................ 117
6.1 FUTURAS LÍNEAS DE TRABAJO ........................................................................................ 117
7. REFERENCIAS ......................................................................................................................... 123
PARTE III: ANEXOS ..................................................................................................................... 127
ANEXO 1: CONVERSOR RDF to OWL ..................................................................................... 127
1. PROYECTO ..................................................................................................................... 127
ANEXO 2: INSTALACIÓN DE LUCENE Y SOLR ......................................................................... 135
1. LUCENE .......................................................................................................................... 135
2. SOLR............................................................................................................................... 137
3. INSTALACIÓN Y PUESTA EN MARCHA DE APACHE SOLR ............................................... 140
ANEXO 3: CREACIÓN DEL ÍNDICE DEL CATÁLOGO EN APACHE SOLR .................................... 143
ANEXO 4: DESARROLLO DE UN INTERFAZ GRÁFICO PARA BÚSQUEDA ................................ 147
3
PROPUESTA DE BÚSQUEDA SEMÁNTICA: APLICACIÓN AL CATÁLOGO DE MAPAS, PLANOS Y DIBUJOS DEL ARCHIVO GENERAL DE SIMANCAS SIMANCAS
Jose Alberto Benítez Andrades Máster en Lenguajes y Sistemas Informáticos
ÍNDICE DE FIGURAS
Ilustración 1 La Web Sintáctica ................................................................................................... 11
Ilustración 2 La Web Sintáctica por Tim Berners-Lee ................................................................. 13
Ilustración 3 Web Actual vs Web Semántica ............................................................................... 14
Ilustración 4 Visión de la web semántica .................................................................................... 14
Ilustración 5 Componentes de Lucene ........................................................................................ 39
Ilustración 6 Partes en las que se divide de Solr ......................................................................... 42
Ilustración 7 Esquema de servidores maestro-esclavo en Solr ................................................... 42
Ilustración 8 Diseño de un buscador semántico ......................................................................... 46
Ilustración 9 Modelo espacio vectorial de recuperación de información .................................. 47
Ilustración 10 Anotación de conceptos semánticos .................................................................... 49
Ilustración 11 Arquitectura básica de un Sistema de Pregunta-Respuesta ................................ 52
Ilustración 12 Taxonomía de preguntas (Moldovan et al., 2000) ............................................... 55
Ilustración 13 Arquitectura general de un sistema de QA (Moya, 2004) ................................... 60
Ilustración 14 Interface inicial de la web del AGS ....................................................................... 63
Ilustración 15 Ejemplo de ficha del AGS...................................................................................... 63
Ilustración 16 Formatos de exportación de fichas del AGS......................................................... 64
Ilustración 17 Fichero ZIP resultante de la exportación de fichas del AGS ................................. 64
Ilustración 18 Listado de ficheros TXT de la exportación de fichas del AGS ............................... 64
Ilustración 19 Ficha en formato Dublin Core .............................................................................. 68
Ilustración 20 Cabecera de fichero en formato OWL .................................................................. 69
Ilustración 21 Campo Ontology en fichero OWL ......................................................................... 69
Ilustración 22 Ejemplo de propiedad en OWL ............................................................................ 70
Ilustración 23 Parser RDF to OWL: Pantalla de inicio .................................................................. 73
Ilustración 24 Parser RDF to OWL: Diálogo de conversión correcta ...........................................
+
Comentarios de: PROPUESTA DE BÚSQUEDA SEMÁNTICA: APLICACIÓN AL CATÁLOGO DE MAPAS, PLANOS Y DIBUJOS DEL ARCHIVO GENERAL DE SIMANCAS SIMANCAS (0)
No hay comentarios