UNA PROPUESTA PARA LA BÚSQUEDA SEMÁNTICA DE RECURSOS WEB DE NUEVAS TECNOLOGÍAS APLICADAS A LA EDUCACIÓN.

Elena García Barriocanal Universidad de Alcalá de Henares

Miguel Ángel Sicilia Urbán Universidad de Carlos III


 

 


1. INTRODUCCIÓN Y MOTIVACIÓN.

1.1.HERRAMIENTAS PARA LA BÚSQUEDA DE RECURSOS DE NN.TT. Y EDUCACIÓN EN LA WEB.

1.2. ONTOLOGÍAS Y WEB SEMÁNTICA.

2. PROPUESTA PARA UNA ONTOLOGÍA DE NUEVAS TECNOLOGÍAS APLICADAS A LA EDUCACIÓN.

3. UN PROTOTIPO DE BUSCADOR DE RECURSOS DE NUEVAS TECNOLOGÍAS ANOTADOS.

4. CONCLUSIONES Y FUTURAS LÍNEAS DE TRABAJO.

BIBLIOGRAFÍA.


 

 

1.      INTRODUCCIÓN Y MOTIVACIÓN.

 

1.1.HERRAMIENTAS PARA LA BÚSQUEDA DE RECURSOS DE NN.TT. Y EDUCACIÓN EN LA WEB.

 

Las nuevas tecnologías (NN.TT.) informáticas y audiovisuales han dado lugar a un amplio abanico de recursos cuya utilidad en los procesos de enseñanza-aprendizaje ha sido sobradamente probado – véase por ejemplo (Barron 1997). La sociedad en la que vivimos se ve inmersa en estas tecnologías, lo que hace necesario que no solamente se eduque utilizándolas sino también se eduque en ellas, consiguiendo que los alumnos aprendan a ser críticos con el uso que de ellas se pueda realizar y los contenidos que en ellas se pueda mostrar. Pero para poder integrar las NN.TT. en el aula hace falta conocerlas y saber utilizarlas como recurso didáctico. Surge la necesidad, por lo tanto, de facilitar esta labor a los profesores y alumnos de titulaciones relacionadas con la docencia y pedagogía.              

 

En la propia Web se pueden encontrar herramientas que permiten la búsqueda de bibliografía y recursos apropiados para la formación del profesorado en estos temas. La mayoría de las herramientas actuales pueden clasificarse en tres categorías: (1) buscadores de Internet de propósito general, como Google[1] (y muchos otros); (2) catálogos de enlaces, como el mantenido por Espiral[2] o (3) sistemas de recuperación de información almacenada en base de datos mediante códigos o campos, como Bite[3].

 

No obstante, todas estas herramientas de acceso a la información tienen inconvenientes, de entre los que destacamos los siguientes:

·      Los motores de recuperación de información en última instancia realizan (sofisticadas) correspondencias de términos, lo que provoca ruido en los resultados de las búsquedas. Por ejemplo, si introducimos en un buscador como Google la cadena de búsqueda lenguajes programación educativos obtendremos, entre otros, enlaces a programas curriculares para la enseñanza de lengua en los estudios de Logopedia, los cuales posiblemente no están entre los resultados esperados de la búsqueda. No obstante, hay que indicar que con la experiencia, el usuario adquiere la capacidad de diseñar mejor los criterios de búsqueda, y por lo tanto los resultados obtenidos pueden mejorarse.

·      Los catálogos de enlaces responden a un criterio clasificador navegacional estático, es decir, para recuperar los recursos hay que realizar siempre navegación por los niveles establecidos, definiéndose un único recorrido para encontrar un determinado recurso (en el caso de que no estén repetidos).

·      El principal inconveniente de los sistemas de recuperación mediante códigos predefinidos es su poca flexibilidad, ya que existe una lista lineal de códigos que hay que explorar para realizar las búsquedas, sin que exista la posibilidad de definir relaciones semánticas entre estos códigos. La búsqueda en campos predefinidos de bases de datos presenta problemas similares.

 

Nuestro trabajo propone la utilización de ontologías para anotar recursos relacionados con NN.TT. aplicadas a la educación. Las búsquedas de recursos anotados con los términos de la ontología, como veremos, se llevan a cabo mediante interfaces de acceso a la información que permiten seleccionar diferentes criterios para afinar la búsqueda de manera multidimensional, teniendo en cuenta relaciones semánticas definidas en la ontología con la que se anota.

 

Para comprobar la utilidad de nuestro enfoque hemos realizado una primera versión parcial de una ontología que nos permita anotar diferentes recursos de nuevas tecnologías que se encuentran en la red, tal y como se expone en el 2º apartado. En el 3er apartado se muestra la interfaz y utilización del primer prototipo para la recuperación de recursos de nuevas tecnologías anotados con la ontología del apartado 2.   

 

1.2.ONTOLOGÍAS Y WEB SEMÁNTICA.

 

Según definición de Tim Berners-Lee: “La Web Semántica es una extensión de la Web actual en la cual se dota a la información de significado bien definido para que tanto personas como ordenadores puedan trabajar cooperativamente”. Es decir, utilizando la propia estructura tecnológica de la Web se pretende dotar a los recursos que en ella residen de algún elemento que añada información sobre la propia información, de manera que esta primera facilite la comunicación “con sentido semántico” entre las máquinas que forman la red y, por lo tanto, redunde en que las personas que la utilizan puedan obtener lo que desean con mayor rapidez y fiabilidad. Así pues, el objetivo último de esta nueva Web es que se produzca un intercambio de información efectivo y eficiente [Miller, 2001].

 

Para que las máquinas puedan llevar a cabo esta función necesitan acceder a colecciones estructuradas de información y a formalismos actualmente basados en lógica matemática que les permitan tener un cierto grado de razonamiento automático. Estas necesidades pueden cubrirse utilizando ontologías para anotar los recursos Web.

 

El término ‘ontología’ (utilizado en filosofía para hablar acerca de una ‘teoría sobre la existencia’) ha sido adoptado por la comunidad de investigadores de inteligencia artificial para definir una categorización y las relaciones entre sus términos [Berners-Lee, 2001b]:

·        La categorización define clases y las relaciones entre ellas. Los elementos concretos son ‘instancias’ de esas clases, también conocidas como términos de la ontología. Como en cualquier clasificación, la relación básica entre términos es la de herencia, donde una clase A (subclase) es un tipo de la clase B (superclase), por lo que posee todas sus características.

·        Las relaciones semánticas que se definen entre las clases de una ontología pueden considerarse predicados que, junto a un conjunto de reglas de inferencia, permiten construir software (agentes) que realicen razonamiento automático. Cuando se define una relación  de este tipo se puede especificar, entre otras muchas propiedades, el conjunto dominio de la relación y el conjunto imagen, es decir, las clases de las que parte la relación y las clases con las que se asocia según el significado de la misma.. Por ejemplo, si se define una relación está_compuesto entre la clase ordenador y la clase dispositivos_de_entrada, y además existe una relación de herencia entre la clase dispositivo_de_entrada y la clase teclado, se podrá deducir que un teclado es una parte del ordenador; de forma que se sabrá que la instancia “teclado de conceptos” de la clase teclado es, además un dispositivo de entrada, una parte del ordenador. 

 

Para construir una ontología hace falta un lenguaje de definición. Entre los lenguajes mas utilizados se encuentran OIL [Fensel, 2000] [Fensel, 2001] y DAML [Hendler, 2000]. Estos lenguajes tienen una semántica bien definida y permiten la manipulación de taxonomías complejas y de relaciones lógicas entre entidades en la Web. Todos ellos pueden “traducirse” al lenguaje RDF [Lassila, 1999] (Resource Description Framework) mantenido por el consorcio W3C y a su complemento RDFS (Brickley, 2000). Actualmente existen editores que permiten generar el código de una ontología en diferentes formatos, como OILed[4] o Protegè[5].

 

La Web Semántica se compone, entre otros elementos, de recursos anotados. Cuando un autor crea una nueva página para la Web Semántica, tendrá que anotar las partes de la misma que estime convenientes utilizando los términos de una ontología que describa los elementos o la temática de la página. Hoy en día hay enfoques que utilizan nuevos elementos y atributos del lenguaje de marcado para relacionar las secciones con los términos de la ontología, que también se tiene que especificar en el código de la página. Un buen ejemplo de una de las posibles formas de anotar páginas lo proporcionar el Prof. Hendler, que dispone de su página anotada y relata los pasos necesarios para hacerlo

(http://www.cs.umd.edu/users/hendler/sciam/walkthru.html).    

 

Aunque la Web semántica no es todavía una realidad, sí se prevén muchas ventajas de sus ventajas, entre las que destaca la posibilidad que tendrán los investigadores de cualquier disciplina de compartir sus conocimientos [Berners-Lee, 2001a], de ahí que en este trabajo se intente dar los primeros pasos para generar una herramienta que permita buscar en la Web recursos de NN.TT. anotados con la ontología correspondiente, ya que esto sería de extrema utilidad para que los educadores tuvieran mayor facilidad para acceder a los recursos que les ayuden en su formación. 

 

2.      PROPUESTA PARA UNA ONTOLOGÍA DE NUEVAS TECNOLOGÍAS APLICADAS A LA EDUCACIÓN.

 

Para que una ontología resulte de utilidad en la Web Semántica tiene que ser aceptada universalmente, y para que esto se cumpla se debe definir colaborativamente por la comunidad a la que se destina. Actualmente no existe una ontología para las NN.TT. aplicadas a la educación, por lo que para comprobar las ventajas de nuestro enfoque ha sido necesario construir una pequeña ontología parcial cuya única pretensión es la de permitirnos anotar algunos recursos de nuevas tecnologías y probar nuestros prototipo de recuperación de información.

 

En la ontología –generada con el editor OILed– se clasifican los tipos y niveles educativos, los tipos de enseñanza asistida por ordenador, los tipos de recursos on-line (programas descargables o paginas web) y otros recursos de carácter científico, tales como eventos o publicaciones de cualquier tipo (ver Figura 1).

 

Figura 1: Ejemplo de una ontología parcial de NN.TT. aplicadas a la educación

 

Como ya se ha visto, parte de la potencia de las ontologías radica en la posibilidad de establecer relaciones semánticas entre los términos que la forman. Además de las relaciones que indican herencia (relación  es_un) en nuestra ontología hemos definido, entre otros, las relaciones (slots[6]) que se muestran a continuación (hay que tener en cuenta que cuando se define una relación para una clase también se define para las subclases que deriven de ella):

·        Recomendado_para. Este slot indica el nivel educativo para el cual está recomendado un determinado producto de enseñanza asistida por ordenador.

·        Presentado_en es un slot definido entre las clases comunicación en conferencia y conferencia indica en qué conferencia se presentó una determinada comunicación.

·        Publicado_en se define para representar en qué revista se publica un artículo o en qué libro se publica un capítulo.

·        Temas, que indica la temática de un recurso Web, un evento o una publicación, por lo que el conjunto imagen del slot está formado por las clases Enseñanza asistida por ordenador, nivel educativo o tipo de educación (presencial o a distancia).

·        URI indica la dirección de Internet en la que puede encontrarse un recurso, luego el conjunto imagen de la relación es una cadena de caracteres. Esta relación es de tipo value-type, es decir, expresa el cuantificador universal <<para-todo>>, ya que siempre que se especifique una URI, ésta es una cadena de caracteres.

 

Como se explicó en el punto 1.2, la forma habitual de anotar recursos es embebiendo la anotación en el propio código HTML de la pagina. Nosotros hemos utilizado recursos que ya existen en la Web, por lo que la posibilidad de modificar su código HTML es inviable, así que hemos utilizado un método diferente. Los recursos anotados pasan a ser instancias de nuestra ontología, de manera que también hay que especificar las relaciones entre las instancias guiándose por los slots definidos para la clase a la que pertenece la instancia. Veamos algún ejemplo de recurso anotado en nuestra ontología: EuroLOGO es una instancia de la clase Conferencia que tiene una relación semántica Tema con LOGO, que a su vez es una instancia de la clase Lenguaje de Programación Educativo. La especificación de página web de EuroLOGO se realiza a través de la relación URI con http://www.eurologo.org/eurologo2001/, que es una cadena de caracteres.  

 

3.      UN PROTOTIPO DE BUSCADOR DE RECURSOS DE NUEVAS TECNOLOGÍAS ANOTADOS.

 

La búsqueda de recursos anotados necesita nuevas técnicas de acceso a la información, y para explorarlas hemos construido un software en Java denominado metadataKB que puede utilizarse sobre cualquier servidor Web que soporte la especificación Java Servlet 2.2. Este software trabaja sobre el RDF(S) generado por OILed, utilizando las bibliotecas Jena 1.1 de procesamiento de RDF. La principal característica de nuestro buscador basado en ontologías reside en que los usuarios no necesitan introducir cadenas de caracteres que sirvan de patrón. Los criterios de búsqueda están previamente definidos en las ontologías, ya que se corresponden con las clases y subclases que contienen.

 

El proceso de recuperación de recursos se lleva a cabo por dos caminos:

1.      Seleccionando directamente aquellos recursos anotados con los términos especificados en la interfaz, lo cual se traduce en recuperar las instancias de las clases seleccionadas. Nótese que si se especifica más de una clase, sólo se recuperarán las instancias que pertenezcan a todas ellas (búsqueda multicriterio conjuntiva), no la unión de las instancias de cada clase.

2.      Recorriendo las relaciones semánticas establecidas entre instancias pertenecientes a alguna de las clases especificadas como criterio en la interfaz.

 

Lo primero que tiene que hacer el usuario en nuestra herramienta de recuperación de recursos anotados es seleccionar los criterios de alto nivel que nosotros denominamos “puntos de entrada”. Consideramos puntos de entrada a los términos más generales y significativos de la ontología que deben mostrarse en el buscador con el fin de hacer una primera acotación de la búsqueda. Obviamente debe existir la posibilidad de combinar más de un criterio para realizar la exploración. Dado que la ontología definida para nuevas tecnologías aplicadas a la educación es muy pequeña, los puntos de entrada definidos en ella son casi todas las clases base, incluyendo: niveles educativos, recursos on-line publicaciones y enseñanza basada en ordenador (ver Figura 2).

 

Figura 2: Interfaz principal con los puntos de entrada a la búsqueda

 

Una vez seleccionados los temas, se pueden buscar recursos o refinar la búsqueda (véanse los botones en la parte inferior de la interfaz). Los posibles caminos de navegación se muestran en el esquema de la  Figura 3.

 

Figura 3: Esquema navegacional del buscador de recursos anotados.

 

Para refinar los criterios de búsqueda, se muestran las subclases de las clases representadas por los términos seleccionados en la interfaz anterior (ver Figura 4). La posibilidad de refinamiento se sucede hasta que no existen más combinaciones de profundización en la jerarquía de los elementos que se van seleccionando. Llegado este punto, la única opción disponible es buscar los recursos que respondan a los criterios especificados.

 

Figura 4: Refinamiento de criterios de búsqueda

 

La opción Buscar da como resultado: (1) los recursos anotados como individuos de todos los términos seleccionados previamente (semántica de conjunción) o de los términos correspondientes a subclases de los términos seleccionados y (2)  las instancias relacionadas. Como ya se ha dicho, parte de la potencia de la búsqueda de recursos anotados con términos de una ontología reside en poder explorar relaciones semánticas entre las clases que la componen. De esta forma se pueden realizar búsquedas multicriterio recorriendo las relaciones definidas entre los términos de la ontología y seleccionando las instancias de las relaciones que impliquen a los términos seleccionados en el buscador. Este tipo de recorridos semánticos permite también extraer temas relacionados con los recursos encontrados, habilitando la posibilidad de explorar nuevas vías que no son las especificadas inicialmente (un ejemplo de los resultados de búsquedas con temas relacionados se puede ver en la Figura 5, nótese que las instancias son hiperenlaces que llevan a información ampliada sobre las instancias o a nuevas búsquedas).

 

Figura 5: Resultado de una búsqueda

 

Para ilustrar un ejemplo de búsqueda veamos los pasos que se tendrían que realizar para encontrar artículos de revistas que versen sobre enseñanza basada en ordenador. En primer lugar hay que indicar los temas sobre los que se quiere buscar en la interfaz principal de la aplicación. Estos temas son Enseñanza basada en ordenador y Publicaciones (ver figura 2). Puesto que interesan únicamente las publicaciones en revistas hay que continuar refinando la búsqueda, por lo que se debe pulsar el botón “Refinar”. Esta acción visualiza las subclases de las clases especificadas dentro de nuestra ontología. De los nuevos términos que aparecen tendremos que marcar Articulo y de nuevo la clase Enseñanza basada en ordenador, ya que buscamos artículos “en general” de dicho tema (ver figura 4). Dentro de los artículos sólo queremos obtener los publicados en revistas, por lo que se hace necesario otro refinamiento. En la nueva interfaz se volverían a visualizar las subclases de Enseñanza basada en ordenador y se volvería a marcar la superclase. Dentro de los artículos hay que seleccionar los publicados en revistas. Si se pulsa a continuación el botón “Buscar” se mostrarían los resultados de la Figura 5. Éste es el resultado de la búsqueda ya que los recursos que se muestran, anotados como instancias de la clase artículo en revista,  mantienen una relación del slot Tema con una instancia de la clase Enseñanza basada en ordenador. Obsérvese cómo no aparecen resultados en la zona destinada a las “Instancias”, ya que no existen recursos anotados en nuestra ontología que sean individuos de Articulo en revista y  Enseñanza basada en ordenador (o alguna de sus subclases) al mismo tiempo. Si, por ejemplo, la búsqueda se realizara exclusivamente por el término Publicación, sí se visualizarían instancias (y sus relaciones, incluyendo su URI, como información adicional), ya que existen individuos de la clase (o de sus subclases), como se muestra en la Figura 6 (una vez más, las instancias llevan a nuevas búsquedas o información ampliada). 

 

Figura 6. Instancias de la búsqueda de publicaciones

 

4.      CONCLUSIONES Y FUTURAS LÍNEAS DE TRABAJO.

 

El trabajo aquí expuesto nos ha servido como prueba de concepto sobre la utilidad del uso de ontologías para la anotación y acceso a recursos de NN.TT. aplicadas a la educación.

 

Desde el punto de vista de los posibles usuario de la herramienta, la especificación de criterios de búsqueda puede incluir un número de dimensiones clasificatorias tan rico como permita la ontología, lo cual permite mejorar la precisión de la búsqueda respecto a los buscadores convencionales, y por lo tanto los resultados obtenidos son más significativos y no requieren un trabajoso filtrado manual posterior.

 

Desde el punto de vista técnico, es importante resaltar que el enfoque adoptado para la implementación de la herramienta de acceso a los recursos es independiente de los términos y relaciones incluidos en la ontología, lo cual permite actualizar la ontología sin que sea necesario modificar la aplicación.

 

Nuestra intención con este trabajo ha sido la de estimular la creación de iniciativas dirigidas a la construcción colaborativa de una ontología de nuevas tecnologías aplicadas a la educación que sea comúnmente aceptada por la comunidad de investigadores y educadores interesados en el área. Actualmente trabajamos en ampliar la base de recursos, transformarla al lenguaje Daml+Oil y hacer más amplia la ontología. Por otro lado, estamos realizando estudios de usabilidad sobre los prototipos de la interfaz y sobre mecanismos similares de acceso a recursos anotados.

 

BIBLIOGRAFÍA.

 

(Barron 1997)

Barron, A. E., & Orwig, G. W. (1997). New Technologies for Educators: A Beginner's Guide. (Third Edition), Englewood, CO: Libraries Unlimited. Cap. 3-6.

 

 (Berners-Lee, 2001a)

Berners-Lee, T., Hendler, J. “Scientific publishing on the ‘semantic web’”. Nature, Abril, 2001.

 

(Berners-Lee 2001b)

Berners-Lee, T., Hendler, J., Lassila, O. “The semantic web: a new form of web content that is meaningful to computers will unleash a revolution of new possibilities”. Scientific American, Mayo, 2001.

 

(Brickley, 2000)

Brickley, D., Guha, R.V. Resource Description Framework (RDF) Schema Specification 1.0, W3C Candidate Recommendation, 27 March 2000.

 

(Fensel, 2000)

Fensel, D. et al. “OIL in a nutshell”. Proc. 12th European workshop knowledge acquisition, modelling and management, New York: Springer-Verlang, 2000.

 

(Fensel, 2001)

Fensel, d. et al. “OIL: An ontology infrastructure for the semantic web”. IEEE Intelligent System, vol 16, nº 2. 2001.

 

(Hendlre, 2000)

Hendler, J.,, McGuinness, D. “The DARPA Agent Markup Language”. IEEE Intelligent System vol 15 nº6, 2000

 

(Lassila, 1999)

Lassila, O., Swick. R. “Resource Description Framework (RDF) Model and Syntax Specification”. W3C Recommendation 22 February 1999.

 

(Miller, 2001)

Miller, E. “The W3C semantic web activity”.  Proc. International Semantic Web Workshop. Julio, 2001



[1] http://www.google.com

[2] http://espiral.pangea.org/higlosa.htm

[3] http://tecnologiaedu.us.es/bite_.htm

[4] http://img.cs.man.ac.uk/oil/request.asp

[5] http://smi-web.stanford.edu/projects/protege/download.html

[6] En el lenguaje OIL las relaciones se denominan slots,  ya que el término relación hace referencia a un slot entre instancias (individuos en OIL) de clases.