MDE en la generación de aplicaciones para
Repositorios Institucionales
Jose Texier12, Marisa De Giusti3, Silvia Gordillo4
1 Universidad Nacional de Chilecito. Argentina
[email protected]
2 Universidad Nacional Experimental del Táchira. Venezuela
[email protected]
3 SEDICI, Universidad Nacional de La Plata, Argentina. Comisión de Investigaciones
Científicas de la Provincia de Buenos Aires (CIC), Argentina
[email protected]
4 Lifia. Universidad Nacional de La Plata, Argentina
[email protected]
Resumen. En el 2012 el Repositorio Institucional de la Universidad Nacional
de La Plata, SEDICI, realizó un proceso de migración de Celsius DL a
DSpace, donde se evidenció el problema de la representación de recursos,
problema recurrente estudiado por algunos autores, no obstante, los trabajos
revisados abordan el tema en forma general, no se toma en cuenta el recurso
como el eje central. El objetivo central fue dar una solución al problema de la
representación de recursos en SEDICI. La solución se planteó en desarrollar
un marco de referencia que permitió el desarrollo de aplicaciones, replicable a
otros repositorios y bajo el paradigma Model Driven Engineering (MDE) para
la implementación de la solución. El marco de referencia se estructuró en 5
módulos. Esta investigación dió respuesta al objetivo planteado y vinculó
premisas devenidas de tres disciplinas: Ciencias de la Información, Ciencias
Documentales y Ciencias de la Computación.
Palabras clave: MDE, repositorios institucionales, representación de recursos,
DSpace.
1 Introducción
En el 2003, nace el Servicio de Difusión de la Creación Intelectual (SEDICI)
como el Repositorio Institucional (RI) de la Universidad Nacional de La Plata
(UNLP), con el objetivo prioritario de socializar el conocimiento generado en las
diferentes áreas académicas de la Universidad, para devolver a la comunidad los
esfuerzos destinados a la Universidad Pública, bajo políticas explícitas de contenidos,
metadatos, datos, entre otras, que se aprecian en su portal web. SEDICI, como un
portal de acceso libre, estuvo soportado por un desarrollo de software propio en PHP,
MySQL y Java, llamado Celsius DL, que estaba adaptado a estándares
ASSE 2015, 16º Simposio Argentino de Ingeniería de Software. 44 JAIIO - ASSE 2015 - ISSN: 2451-759341internacionales como XML, OAIPMH, SOAP, y permitía el depósito y búsqueda de
recursos. Celsius DL fue creciendo en funcionalidades por lo que el diseño,
mantenimiento e implementación convirtieron a la plataforma de software de
SEDICI en una herramienta compleja principalmente por dos razones: por una parte
porque se requería de mayor tiempo y recurso humano y, por otra, porque se hacía
necesaria una actualización de tecnologías de manera que no estuvieran en desventaja
frente a nuevos desarrollos e investigaciones.
Por estos motivos para finales del 2011, se estudió la posibilidad de migrar a una
plataforma que estuviera a la par de las nuevas tecnologías aplicadas al dominio y
que fuera más amena para el usuario y para la gestión de recursos por parte del
personal de SEDICI, así como a los fines de la preservación del material. La
conclusión del estudio determinó que DSpace era la herramienta de software que
mejor se adaptaba a las necesidades de SEDICI. El proceso de migración de Celsius
DL a DSpace finalizó en el 2012 (contaba con aproximadamente 15.000 recursos).
Esto permitió contar con nuevas funcionalidades y se logró una flexibilidad en los
cambios estratégicos por parte de la gerencia del repositorio, modificaciones en la
imagen institucional sin afectar la lógica del repositorio y ampliar la gestión de las
tipologías de los recursos aceptados.
DSpace, al igual que otras plataformas, presenta limitaciones en diferentes
ámbitos tales como: procesos de depósitos, manejo de estadísticas y de las
comunidadescoleccionesitems, vocabularios controlados centrados en los autores,
representación de los recursos, etc. De estas limitaciones, la representación de los
recursos que consiste en el proceso de registrar en forma persistente un conjunto de
datos como síntesis y reemplazo del objeto "real" para poder identificarlo,
recuperarlo y distribuirlo es uno de los principales problemas presentados en la
transición de Celsius DL a DSpace, ya que se migraron muchos recursos en forma
separada e incluso se realizaron adaptaciones por incompatibilidad de ambos
sistemas porque la representación de distintos recursos era muy variada. Este proceso
es llevado a cabo de diversas maneras en plataformas para repositorios. El trabajo de
esta investigación se centró en solucionar el problema de la representación de
recursos en SEDICI bajo el enfoque Model Driven Engineering (MDE).
La tipología de recursos de SEDICI a la que se limitó el trabajo fue: artículos de
investigación, tesinas de grado y tesis de postgrado, libros, autores, instituciones,
revistas y sus números, eventos y sus instancias, con la intención de ser replicado
sobre cualquier otra tipología. Estos recursos usados cuentan con diferentes
características que representan los metadatos de cada uno de ellos y agrupados en
esquemas de metadatos. Los esquemas y los recursos se convierten en los elementos
centrales para una representación de recursos básica dentro de los RI. A continuación
se presentan algunas características a tomar en cuenta para una representación de
recursos y que sirvieron de base para la propuesta desarrollada:
Los recursos deben estar catalogados en más de un esquema de metadatos a
fin de evitar pérdida de información.
ASSE 2015, 16º Simposio Argentino de Ingeniería de Software. 44 JAIIO - ASSE 2015 - ISSN: 2451-759342
Debido a la gran diversidad en las estructuras (planas y jerárquicas) y
restricciones de cada esquema de metadatos, es necesario plantear una
solución de representación clara, flexible, factible, escalable, interoperable,
mantenible y que no represente un desafío de configuración para los
administradores, así como tampoco sea complicada su utilización por parte
de los usuarios.
Muchos campos presentes en los esquemas de metadatos necesitan ser
estandarizados para garantizar una identificación y recuperación correcta, a
fin de evitar la redundancia y garantizar la integridad de la información.
En estos sistemas, frecuentemente, se encuentran elementos que poseen
información descriptiva propia, conocidos como entidades abstractas que
son representadas de forma separada. Por ello, es necesario permitir su
reutilización en los diferentes procesos del repositorio y garantizar su
representación.
Las entidades abstractas pueden tener distintas representaciones según el
esquema de metadatos en el que se represente el recurso.
Todos los metadatos de los recursos de un repositorio institucional debe
almacenarse de forma persistente. por ello, este almacenamiento debe ser
configurable a cualquier tipo de paradigma de base de datos e independiente
del modelo de representación de los recursos.
Para una representación de los recursos básica, se deben tomar en cuenta los
siguientes módulos:
indexación,
infraestructura de la plataforma de software y preservación.
almacenamiento,
catalogación,
2. Representación de recursos
La aparición de los Repositorios Institucionales (RI) ha generado un aumento en el
uso de plataformas de software para RI y la necesidad de mantener dichas
plataformas al mismo ritmo que otras tecnologías no específicas que rodean al
repositorio. Por ello, la Representación de Recursos (RR) es unos de los principales
problemas del mundo de los RI. Varios autores [4, 12, 20, 25] confirman tal situación
y ponen en contexto del mundo científico el problema de la representación de
recursos, problema que se ha complejizado poco a poco, principalmente, por la
diversidad de plataformas de software y esquemas de metadatos existentes para
representar los recursos de diferentes tipologías en los repositorios.
Algunas de las plataformas de software más usadas son DSpace, EPrints y Digital
Commons [24, 28]. No obstante, se encuentran plataformas consolidadas de
desarrollos propios que abarcan un gran porcentaje de los recursos esparcidos en el
mundo como: arXiv, CiteSeerX, Social Science Research Network [7]. Se observa
ASSE 2015, 16º Simposio Argentino de Ingeniería de Software. 44 JAIIO - ASSE 2015 - ISSN: 2451-759343
que en estas diferentes plataformas se encuentran los recursos representados en
diversos esquemas de metadatos. De hecho, muchos esquemas de metadatos se
desarrollan de acuerdo con una variedad de usuarios y de disciplinas para facilitar la
identificación, recuperación, utilización y/o gestión de recursos en los repositorios
[6]. Por tanto, los esquemas de metadatos a través del conjunto de elementos
diseñados en una estructura formal y relacionados con la semántica, la sintaxis y la
obligatoriedad en sus valores, pasan a ser un elemento importante en la
representación de recursos dentro de un RI.
Los esquemas de metadatos definidos como un conjunto de propiedades que
contienen valores de acuerdo con un conjunto de reglas, han sido diseñados e
implementados para permitir reusos de los registros e integración de los mismos.
Estos me
Comentarios de: MDE en la generación de aplicaciones para Repositorios Institucionales (0)
No hay comentarios