LOTERRE - Linked Open TERminology REsources

¿Qué permite el servicio «Transformar»?

El servicio «Transformar» le permite generar terminología en formato SKOS-XML o convertir la terminología inicialmente en formato SKOS-XML a otro formato.
Las operaciones que ofrece este servicio se pueden agrupar en tres tipos: corrección, enriquecimiento y conversión.

Corrección

Estos módulos tienen por objeto, en particular, corregir las anomalías detectadas previamente por el servicio « Controlar »

Eliminar duplicados en los términos

El servicio » Eliminar duplicados en los términos de un archivo SKOS/RDF-XML» procesa los archivos que contienen «skos:Concept» o «rdf:Description[rdf:type[@rdf:resource=’http://www.w3.org/2004/02/skos/core#Concept’]]»

A nivel de cada concepto, este servicio funciona de la siguiente manera:

  • Se mantienen todas las etiquetas léxicas preferentes;
  • Las etiquetas léxicas alternativas se comparan entre sí y con la etiqueta léxica preferente de la misma lengua:
    • si el mismo término aparece varias veces como una etiqueta léxica alternativa de la misma lingua, solo se mantiene una aparición;
    • si el mismo término aparece como una etiqueta léxica alternativa y la etiqueta léxica preferente de la misma lengua, solo se conserva la etiqueta léxica preferente.
  • Las etiquetas léxicas ocultas se comparan entre sí, con la etiqueta léxica preferente y con las etiquetas léxicas alternativas de la misma lengua:
    • si el mismo término aparece varias veces como una etiqueta léxica oculta de la misma lengua, solo se mantiene una aparición;
    • si el mismo término aparece como una etiqueta léxica oculta y la etiqueta léxica preferente de la misma lengua, solo se conserva la etiqueta léxica preferente;
    • si el mismo término aparece como una etiqueta léxica oculta y la etiqueta léxica alternativa de la misma lengua, solo se conserva la etiqueta léxica alternativa.

Al final de este proceso, verifique el archivo nuevamente utilizando el servicio Controlando un archivo SKOS/RDF-XML a nivel de concepto para asegurarse de que no haya más duplicados.

Corregir anomalías de simetría de conceptos relacionados

Si un concepto A está asociado a un concepto B a través de la propiedad skos:related, el concepto B debe estar asociado con el concepto A porque la relación es simétrica. Si no se marca esta condición, este servicio permite insertar la propiedad skos:related que falta.

El servicio «Corregir anomalías de simetría de conceptos relacionados en un archivo SKOS/RDF-XML» procesa los archivos que contienen «skos:Concept» o «rdf:Description[rdf:type[@rdf:resource=’http://www.w3.org/2004/02/skos/core#Concept’]]».
Si no se marca la condición de simetría definida anteriormente, este servicio permite insertar la propiedad ‘skos:related’ que falta.

Nota que este tratamiento no se aplica a ninguna de las subpropiedades de la propiedad ‘skos:related’.

Insertar conceptos específicos

La relación jerárquica entre un concepto A y un concepto B se expresa utilizando la propiedad «skos:broader» y la presencia a nivel de concepto de una relación «skos:narrower» (que es la relación inversa) no es obligatorio porque se infiere de la relación «skos:broader».
Sin embargo, el buen funcionamiento de algunas aplicaciones (como SKOSMOS) requiere la presencia de ambas relaciones.

El servicio «Insertar conceptos específicos en un archivo SKOS/RDF-XML válido» procesa los archivos que contienen «skos:Concept» o «rdf:Description[rdf:type[@rdf:resource=’http://www.w3.org/2004/02/skos/core#Concept’]]».
Este servicio hace posible insertar en el concepto genérico tantas propiedades «skos:narrower» como conceptos específicos de este concepto.

Insertar colecciones más estrechas

La relación jerárquica entre una colección A y una colección B se expresa utilizando la propiedad «isothes:superGroup». La presencia de una propiedad «isothes:subGroup» (que es la relación inversa) en el nivel de la colección B no es obligatoria porque se infiere de «isothes:superGroup» propiedad.
Sin embargo, el buen funcionamiento de algunas aplicaciones (como SKOSMOS) requiere la presencia de ambas relaciones.

El servicio «Insertar colecciones más estrechas en un archivo SKOS/RDF-XML válido» procesa los archivos que contienen «skos:Collection» o «rdf:Description[rdf:type[@rdf:resource=’http://www.w3.org/2004/02/skos/core#Collection’]]» o «rdf:Description[rdf:type[@rdf:resource=’http://purl.org/iso25964/skos-thes#ConceptGroup’]]».
Este servicio hace posible insertar en el nivel de la colección más amplia tantas propiedades «isothes:subGroup» como colecciones más estrechas de esta colección.

Enriquecimiento

Insertar un bloque ‘ConceptScheme’ y una licencia

El servicio «Insertar un bloque ‘ConceptScheme’ en un archivo SKOS/RDF-XML» procesa los archivos que contienen «skos:Concept» o «rdf:Description[rdf:type[@rdf:resource=’http://www.w3.org/2004/02/skos/core#Concept’]]».

Este servicio inserta dos bloques al comienzo de un archivo SKOS/RDF-XML:

– Un bloque «cc: License» con la licencia predeterminada Creative Commons CC-BY 4.0 que debería cambiarse si el recurso se libera bajo una licencia diferente.

– Un bloque «skos:ConceptScheme» o «rdf:Description[rdf:type[@rdf:resource=’http://www.w3.org/2004/02/skos/core#ConceptScheme’]]» con:

  • un URI derivado de los identificadores de los conceptos ;
  • propiedades para metadatos ; para ser completado / modificado por el usuario en el nivel del archivo de salida:
    • títulos del recurso en español, inglés y francés (dc:title),
    • descripciones del recurso en español, inglés y francés (dc:description),
    • sujetos del recurso en español, inglés y francés (dc:subject),
    • nombre del creador (dc:creator),
    • nombre de la licencia (cc:license),
    • nombres del recurso en español, inglés y francés de la organización a la que se asignará el recurso (cc:attributionName),
    • sitio web de la organización / institución (cc:attributionURL),
    • conceptos cabecera (skos:hasTopConept) si el recurso está altamente estructurado,
    • lenguas del recurso calculados a partir de los códigos de lengua utilizados para las etiquetas preferente de los conceptos (dcterms:language con lexvo / códigos ISO 639-3),
    • fecha de creación (dcterms:created),
    • fecha de modificación (dcterms:modified),
    • versión del recurso (owl:versionInfo).

Después de generar los campos, su contenido textual debe ser completado y validado por el usuario.

Insertar las propiedades «hasTopConcept»

El servicio «Inserte las propiedades «hasTopConcept» en un archivo SKOS/RDF-XML válido» procesa los archivos que contienen «skos:Concept» o «rdf:Description[rdf:type[@rdf:resource=’http://www.w3.org/2004/02/skos/core#Concept’]]».
Este servicio inserta una propiedad «skos:hasTopConcept» en el bloque «ConceptScheme» para cada concepto que no tiene una propiedad «skos:broader».

No utilice este servicio para recursos no estructurados o poco estructurados.

Insertar las propiedades «topConceptOf»

El servicio «Inserte las propiedades «topConceptOf» en un archivo SKOS/RDF-XML válido» procesa los archivos que contienen «skos:Concept» o «rdf:Description[rdf:type[@rdf:resource=’http://www.w3.org/2004/02/skos/core#Concept’]]».
Este servicio inserta una propiedad «skos:topConceptOf» en cada concepto que no tiene una propiedad «skos:broader».

No utilice este servicio para recursos no estructurados o poco estructurados.

Asignar identificadores ARK

El servicio «Asignar identificadores ARK a un archivo SKOS/RDF-XML válido» procesa los archivos que contienen «skos:Concept» o «rdf:Description[rdf:type[@rdf:resource=’http://www.w3.org/2004/02/skos/core#Concept’]]».
Este servicio permite la sustitución de los identificadores (URI) de un archivo SKOS/RDF-XML por identificadores ARK creados de acuerdo con las recomendaciones de California Digital Library (CDL).

Un identificador ARK tiene la siguiente sintaxis:

  • La NMA (Name Adressing Authority ; Anfitrión de Autoridad de Mapeo de nombres), su función es hacer que se pueda hacer clic en el URL en un navegador web.
  • El identificador ARK real que consiste en:
    • la etiqueta «ark:/»,
    • el identificador NAAN (Name Assigning Authority Number; número de autoridad asignante del nombre) que se atribuye bajo demanda por la CDL.

La transformación se realiza en dos etapas:

1- Reemplazar el URI del recurso (a nivel del esquema de conceptos) por el siguiente URI genérico: http://mi_sitio.com/ark:/NAAN/ABC. El viejo URI se pone en una etiqueta «dc:identifier».

A nivel de concepto, una secuencia alfanumérica de 8 caracteres seguida de un guión y luego una suma de verificación (check sum) completa este prefijo y constituye un identificador ARK único para cada concepto del recurso.

Prefiji Identificador ARK único
http://mi_sitio.com/ark:/NAAN/ABC -CGT6ZZBQ-F

2- Los URI se recalculan para:

  • cada una de las relaciones «skos:broader», «skos:narrower», «skos:related»,
  • las posibles propiedades «skosxl:prefLabel», «skosxl:altLabel», «skosxl:hiddenLabel»,
  • los miembros de las posibles colecciones,
  • los posibles elementos «skosxl:Label».

Para tener identificadores ARK que cumplan con las recomendaciones de CDL (ver detalles aquí), el URI genérico debe reemplazarse de la siguiente manera:

  • Reemplace la parte «http://mon_site.fr» (autoridad de mapeo) por el bueno URL.
  • Mantener la etiqueta «/ark:/»
  • Reemplace «NAAN» (número de autoridad asignante del nombre) con el NAAN de la organización.
  • Reemplace «ABC» con un código alfanumérico corto correspondiente al recurso en sí.

Aquí hay un ejemplo real: http://data.loterre.fr/ark:/67375/1WB

Tenga en cuenta que, en ausencia de NAAN, el URI no puede considerarse como un ARK URI, pero puede usarse sin la parte «ark:/ NAAN/»; la última parte es un identificador único.

Conversión

Loterre ofrece diferentes módulos de conversión.

Transformar un archivo CSV en un archivo SKOS-XML

Este servicio hace posible generar un archivo SKOS-XML a partir de una hoja de cálculo (Excel, OpenOffice, etc.) guardada en CSV.

Loterre ofrece dos variantes de este servicio, dependiendo de si el separador de campos en el archivo CSV es un punto y coma o una coma :

  • Transforme un archivo CSV separado por punto y coma en un archivo SKOS-XML
  • Transforme un archivo CSV separado por comas en un archivo SKOS-XML

n.b.: en el caso de un archivo CSV cuyo separador es un punto y coma, usar los comillas dobles (» / quote) como delimitador de texto para los campos que pueden contener el punto y coma para la puntuación, y ponga las comillas al principio y al final del texto para que el punto y coma no se considera como un separador de campo, y si el texto en sí contiene comillas, debe duplicarse.

El archivo debe :

  • usar este separador «§§» para campos de múltiples valores (ejemplo: hormona§§medicamento),
  • usar los nombres de las etiquetas de la siguiente tabla:
Datos terminológicos Etiqueta a utilizar
xx = código ISO de lengua (*)
Comentario
Etiquetas léxicas preferentes prefLabel_xx Se espera una etiqueta «prefLabel_es»
Etiquetas léxicas alternativas altLabel_xx
Etiquetas léxicas ocultas hiddenLabel_xx
Definición definition_xx
Nota note_xx
Nota de alcance scopeNote_xx
Nota editorial editorialNote_xx
Nota histórica historyNote_xx
Nota de cambio changeNote_xx
Ejemplo example_xx
Concepto más amplio broader_xx Se espera una etiqueta «broader_es»
Concepto relacionado related_xx Se espera una etiqueta «related_es»
Colección group_xx Se espera una etiqueta «group_es»
Mapeo exacto exactMatch
Mapeo cercano closeMatch
Mapeo amplio broadMatch
Mapeo estrecho narrowMatch
Mapeo relacionado relatedMatch

(*) Reemplace «xx» con el código ISO de 2 caracteres del idioma; ejemplo «prefLabel_es» para la etiqueta léxica preferente española. Ver la lista de códigos ISO 639-1.

Los datos se transforman de la siguiente manera:

  • Se crea un archivo RDF-XML para contener todo el recurso terminologíco.
  • Cada línea, excepto la primera, se convierte en «skos:Concept», si hay un identificador presente, se le atribuye al concepto; de lo contrario, se le asigna un URI temporal en el atributo «rdf:about»
  • Las etiquetas en la primera línea se convierten a su contraparte de SKOS, por ejemplo, prefLabel_es se convierte en «skos:prefLabel» con un atributo «xml:lang = ‘es'».
  • El contenido de cada celda se coloca en la propiedad SKOS apropiada. Si el contenido tiene varios valores, se divide en tantas propiedades como valores separados por el separador «§§».
  • Las relaciones relacionadas y más amplias se procesan en dos etapas: en primer lugar, se genera una propiedad «skos:related» o «skos:broader» para cada término relacionado o más amplio luego, en un segundo paso, es el URI del concepto correspondiente a los términos en cuestión que se pone en el atributo «rdf:resource».
  • Si el archivo tiene grupos, se creará «skos:Collection» para cada grupo. Asegúrate de traducir los grupos al menos al inglés.

Además, la transformación también inserta dos bloques al principio del archivo RDF-XML:

– Un bloque «cc:License» con la licencia Creative Commons CC-BY 4.0 predeterminada que se debe cambiar si el recurso se libera bajo una licencia diferente.

– Un bloque «skos:ConceptScheme» con:

  • un URI derivado de los identificadores de los conceptos ;
  • propiedades para metadatos ; para ser completado / modificado por el usuario en el nivel del archivo de salida:
    • títulos del recurso en español, inglés y francés (dc:title),
    • descripciones del recurso en español, inglés y francés (dc:description),
    • sujetos del recurso en español, inglés y francés (dc:subject),
    • nombre del creador (dc:creator),
    • nombre de la licencia (cc:license),
    • nombres del recurso en español, inglés y francés de la organización a la que se asignará el recurso (cc:attributionName),
    • sitio web de la organización / institución (cc:attributionURL),
    • conceptos cabecera (skos:hasTopConcept) si el recurso está altamente estructurado,
    • lenguas del recurso calculados a partir de los códigos de lengua utilizados para las etiquetas preferente de los conceptos (dcterms:language con lexvo / códigos ISO 639-3),
    • fecha de creación (dcterms:created),
    • fecha de modificación (dcterms:modified),
    • versión del recurso (owl:versionInfo).

El contenido textual de estos campos debe ser completado y validado por el usuario.

Si los conceptos no tienen identificadores, el URI predeterminado del recurso es «http://www.misitio/vocabs/ABC». También es la raíz del URI de conceptos, relaciones y posibles colecciones. Debe ser reemplazado de la siguiente manera:

  • Sustituir «http://www.misitio/» par el URL correcto
  • Mantener «/vocabs/»
  • Sustituir «ABC» par un código alfanumérico corto correspondiente al recurso

En el nivel de concepto, el URI es una concatenación del URI del recurso con un identificador único; en el nivel de colección, el URI es una concatenación del URI del recurso con el nombre del grupo reemplazando los espacios con «_».

Para cambiar a los identificadores ARK, use la transformación «Asignar identificadores ARK a un archivo SKOS/RDF-XML válido».

Transformar un archivo SKOS/RDF-XML válido a un archivo CSV

Este servicio genera un archivo CSV a partir de un archivo SKOS/RDF-XML válido que contiene «skos:Concept» o «rdf:Description[rdf:type[@rdf:resource=’http://www.w3.org/2004/02/skos/core#Concept’]]»

Loterre propone dos variantes, según la naturaleza del separador de campos deseado en el fichero CSV resultante:

  • Transformar un archivo SKOS/RDF-XML válido a un archivo CSV cuyo separador sea el punto y coma
  • Transformar un archivo SKOS/RDF-XML válido a un archivo CSV cuyo separador sea la coma

El archivo del producto se puede importar a un programa de hoja de cálculo (Excel, LibreOffice, etc.) para editarlo (consulte el procedimiento de importación en Excel más adelante).

Los datos se transforman de la siguiente manera:

Se crea un «encabezado de columna» de la primera fila a partir de los elementos (skos u otras propiedades) utilizados para describir los diferentes conceptos del archivo RDF-XML:

  • Se crea una etiqueta «ID» para los identificadores de los conceptos.
  • Las propiedades con un atributo «xml:lang» se enumeran tocando el nombre del elemento (sin espacio de nombres) con el código de lengua (por ejemplo, «skos:prefLabel/@ xml:lang=’es'»da la etiqueta «prefLabel_es»).
  • Para propiedades que tienen un atributo diferente a «xml:lang»:
    • los correspondientes a las relaciones semánticas («skos:broader», «skos:narrower» y «skos:related») se traducen en «broader_es», «narrower_es» y «related_es»,
    • los otros (propiedades de mapeo, etc.) se generan solo con el nombre del elemento (sin espacio de nombres, por ejemplo, «exactMatch» para «skos:exactMatch»).
  • Las propiedades que no tienen atributos se generan solo con el nombre del elemento (sin espacio de nombres).
  • Si el archivo contiene colecciones, se crea una etiqueta «group_es». Esta etiqueta puede ser redundante si los conceptos contienen propiedades que reflejan su pertenencia a grupos (dominio, microtesauro, etc.).

Luego, se genera una línea para cada concepto del archivo:

  • el contenido del atributo «rdf:about» se coloca en la columna «ID»,
  • el contenido de los elementos textuales (términos, definiciones, notas, etc.) se paga en la columna correspondiente al elemento y el código de lengua de este elemento.
  • las relaciones jerárquicas y asociativas (enlaces) se traducen reemplazándolas por los términos preferenciales españoles correspondientes,
  • el contenido de los otros elementos está fuera como está,
  • si el concepto pertenece a una colección, el nombre español de la colección se coloca en la columna «group_es».

Notar que:

  • los contenidos de los diferentes campos se colocan entre comillas para evitar los problemas de separación cuando estos contenidos contienen el punto y coma como elemento de puntuación,
  • si el contenido de un campo contiene comillas, las comillas se duplican para protegerlas,
  • los contenidos de los campos de ocurrencia múltiple (por ejemplo, «skos:altLabel») se colocan en la misma «celda» pero separados por este separador «§§».

Para importar el archivo a Excel:

  • Crear un nuevo archivo en Excel («Archivo» / «Nuevo»).
  • Haga clic en el menú «Datos», elija «[Obtener datos externos]/»Desde un archivo de texto» y luego elija el archivo para importar con el explorador de archivos.
  • Importar el archivo (botón «Importar»).
  • En el «Asistente para importar texto
    • marque la casilla «Delimitados»,
    • en el menú desplegable «Origen del archivo», elija «65001: Unicode (UTF-8)»,
    • marque la casilla «Mis datos tienen encabezados».
  • Haga clic en «Siguiente»:
    • En la columna «Separadores», marque la casilla «Punto y coma»,
    • Mantenga las comillas («) en el nivel del menú «Calificador de texto «,
    • Verifique el renderizado en la «Vista previa de los datos»,
  • Haga clic en «Finalizar».

El archivo modificado en Excel y guardado en CSV se puede transformar en SKOS utilizando el servicio «Transforme un archivo CSV separado por punto y coma en un archivo SKOS-XML» o «Transforme un archivo CSV separado por comas en un archivo SKOS-XML» de acuerdo con el separador de campo aplicado en el momento del registro.

Transformar un archivo SKOS/RDF-XML a HTML

Este servicio permite generar un archivo HTML a partir de un archivo SKOS válido. Procesa los archivos que contienen «skos:Concepto» o «rdf:Descripción» de tipo «Concepto».
Loterre propone dos variantes, según la versión lingüística elegida:

  • Convertir un archivo SKOS/RDF-XML válido en un archivo html – Versión francesa
  • Convertir un archivo SKOS/RDF-XML válido en un archivo html – versión en inglés

Las entradas de terminología se presentan en el orden alfabético de preferencia (francés o inglés):

  • términos (preferidos y sinónimos) en el idioma elegido
  • definiciones y notas en el idioma elegido
  • relaciones (términos genéricos, asociados y específicos)
  • términos preferidos en otros idiomas
  • posibles grupos de afiliación
  • alineaciones
  • cualquier referencia bibliográfica
  • la(s) fuente(s) del concepto

La riqueza de la información mostrada dependerá del contenido y la estructuración del archivo SKOS original.

Transformar un archivo SKOS/RDF-XML a PDF

Esta transformación genera un archivo PDF a partir de un archivo SKOS válido.

Loterre propone dos variantes, según la versión lingüística elegida para el recurso:

  • Transformar un archivo SKOS/RDF-XML en un archivo PDF correspondiente a la versión francesa del recurso.
  • Transformar un archivo SKOS/RDF-XML en un archivo PDF correspondiente a la versión en inglés del recurso.

Se generan varias secciones basadas en el contenido y la estructura del :

  • Índice alfabético.
  • Entradas de terminología detallada (en inglés o francés) con :
    • o términos, definiciones, notas
    • o Relaciones (términos genéricos, asociados y específicos)
    • o condiciones preferentes en otros idiomas
    • o posibles grupos de miembros
    • o alineaciones
    • o cualquier referencia bibliográfica
    • o la(s) fuente(s) del concepto
  • La lista de entradas con :
    • o la preferencia francesa
    • o la preferencia inglesa
    • o la página
  • La estructura de árbol si el recurso está estructurado.
  • Colecciones si el recurso contiene grupos.

Se insertan páginas adicionales:

  • una simple portada con el título del recurso (francés o inglés)
  • portada con :
    • o título (francés o inglés) del recurso
    • o versión
    • o fecha de la última actualización
    • o descripción (francés o inglés)
    • o leyenda para entradas detalladas
    • o Licencia CC-BY 4.0 más logo
  • 4ª tapa con :
    • o título (francés o inglés) del recurso
    • o descripción (francés o inglés)
    • o Licencia CC-BY 4.0 más logo

Tenga en cuenta que las portadas se pueden sustituir editando el archivo final con un editor de PDF como PDF Sam Basic.