Investigación y publicaciones del profesor Tomás Saorín

ORCID: 0000-0001-9448-0866 | Google Schoar Profile

Mis investigaciones se han publicado en congresos, revistas y editoriales como:

  • El profesional de la información.
  • Information Research.
  • Revista Española de Documentación Científica.
  • Anuario ThinkEpi.
  • Ibersid.
  • Scire.
  • ISKO Conferences
  • Editorial EPI-UOC, Arco Libros, Editum UMU, Ministerio de Cultura.
  • The Conversation, Infonomy.

Últimas publicaciones.

Líneas de investigación en metadatos y descripción de cursos, organización del conocimiento, diseño y arquitectura de sitios web, sistemas de gestión de contenidos, SEO, wed semántica, grafos de conocimiento, publicación digital, entornos colaborativos, Wikipedia y Wikidata.

Wiki3DRank: un modelo para medir la relevancia de objetos de conocimiento mediante datos cuantitativos de Wikidata y Wikipedia

Se presenta el modelo Wiki3DRank, que combina datos cuantitativos extraídos en tiempo real de Wikidata y Wikipedia para obtener un ranking de objetos de conocimiento a través de un valor cuantitativo que mida la relevancia de un objeto frente a otros en un determinado dominio. El modelo se basa en la distribución de los objetos de conocimiento en un espacio vectorial cuyas componentes se basan en tres variables principales: número de declaraciones en Wikidata sobre un ítem, número de artículos en las diferentes ediciones de Wikipedia y extensión en número de palabras de dichos artículos. Estas variables se asocian al nivel de descripción de los ítems de Wikidata, la difusión de los objetos de conocimiento asociados a los mismos en las ediciones de Wikipedia de diferentes idiomas y el grado de elaboración editorial de los correspondientes artículos de Wikipedia. Para demostrar la viabilidad del modelo se analizan una serie de casos de uso sobre diversos dominios: libros, películas, catedrales, terremotos, ríos y elementos químicos.

Ibersid: Revista De Sistemas De información Y documentación, 18(1), 55–70, 2024
Texto completo en PDFEnglish translation / Traducción al Inglés (Wiki3DRank: a model for measuring the relevance of knowledge objects using quantitative data from Wikidata and Wikipedia)

Un canon literario universal basado en datos enciclopédicos multilingües: propuesta de un método de medición de obras literarias usando datos cuantitativos obtenidos de Wikidata y Wikipedia

La investigación descrita en este artículo tiene como objetivo verificar la viabilidad de usar Wikidata y Wikipedia como fuente para identificar un canon literario universal. La metodología utilizada se basa en la construcción de un conjunto de datos de obras literarias recuperados de Wikidata y de las ediciones de Wikipedia en todos los idiomas. Se propone una métrica denominada Wiki3DRank que permite seleccionar y ordenar las obras literarias analizadas.

Revista Española de Documentación Científica, vol. 43, n. 3, julio-septiembre 2023
Texto completo en formato PDFEnglish translation / Traducción al Inglés (A universal literary canon based on multilingual encyclopedic data: Proposal of a method for the ranking of literary works using quantitative data obtained from Wikidata and Wikipedia)

Un mapa propio de lecturas para adentrarse en la gestión de información y contenidos digitales: el español como segunda lengua

El trabajo apuesta por la importancia de las lecturas de largo recorrido, para construir un campo, como complemento necesario a los artí­culos cientí­ficos e informes técnicos. Se realiza una revisión de libros de fundamentos, introducción o divulgación vinculados al área de conocimiento de la Information Science. Plantea sobre todo una selección de obras, traducidas al español o no, que puedan funcionar como despertadoras de vocaciones o permitir una amplia visibilidad de las disciplinas relacionadas con la información desde un punto de vista propio, con el foco puesto en la organización del conocimiento.

Anuario ThinkEpi, vol. 17, 2023
Texto completo en formato PDF

Big data literario de raíz bibliotecaria: reflexiones sobre infraestructuras de anotación, catalogación, descubrimiento y recomendación de ficción narrativa

Se describe la relación entre el campo de los estudios literarios basados en datos de la corriente distant reading y las humanidades digitales, y la actividad de las bibliotecas y otras entidades del sector del libro en el ecosistema de la recomendación y el descubrimiento de lecturas. Se presentan proyectos de catalogación y descripción enriquecida de la ficción literaria, como OCLC FictionFinder y Kirjasampo, en el marco de los metadatos transmedia y abiertos, entendidos en relación con las prácticas de plataformas de consumo de contenidos digitales como Netflix o Amazon Prime Video, junto a otras prácticas de anotación y edición de textos literarios. Finalmente se plantea la oportunidad de desarrollo de laboratorios bibliotecarios digitales apoyados en infraestructuras de datos abiertas como Wikidata para la descripción enriquecida de ficciones narrativas de todas las épocas de forma colaborativa, para posibilitar proyectos y servicios de descubrimiento de lecturas relacionadas.

Anuario ThinkEpi, vol. 15, 2021
Texto completo en formato PDF

Uso de Wikidata y Wikipedia para la generación asistida de un vocabulario estructurado multilingüe sobre la pandemia de Covid-19

Se propone un método para la construcción ágil y dinámica de vocabularios controlados, especialmente para los medios de comunicación, utilizando Wikidata y Wikipedia como fuentes de información terminológica. El método se aplica a la construcción de un vocabulario sobre la pandemia de Covid-19. Mediante un proceso de definición de reglas de expansión de relaciones de Wikidata se ha diseñado un algoritmo en el que se parte de un conjunto de items iniciales y en sucesivas iteraciones y revisión de resultados se recopilan las declaraciones relevantes a la temática del vocabulario.

Profesional de la Información, v. 29, n. 5, 2020
Texto completo en formato PDF

Grafos de conocimiento y bases de datos en grafo: conceptos fundamentales a partir de una “obra maestra” del Museo del Prado

Se presentan los conceptos básicos sobre bases de datos en grafo y grafos de conocimiento, a partir del estudio de caso del modelo semántico digital del Museo del Prado, y el impacto en el rediseño de su sitio web, centrado en el acceso enriquecido a su colección y recursos vinculados, y metadatos para el descubrimiento de contenidos.

Anuario ThinkEpi, vol. 13, 2019
Texto completo en formato PDF

Participación en encuentros y congresos

Aprender en la biblioteca leyendo (2023)

Intervención preliminar para el grupo de trabajo durante los Laboratorios Bibliotecarios en el CitiLab de Cornellà, 2022. Disponible en video (10 minutos).

Saorín, Tomás (2023). Aprender en la biblioteca leyendo. En: Guía Aprender en la biblioteca. Ministerio de Cultura y Deporte. Subdirección de Coordinación Bibliotecaria, pp. 70-71 (Serie LABBS) Descargar capítulo: http://hdl.handle.net/10421/9239