Cómo funciona el nuevo PubMed: ¿Por qué da resultados diferentes el Legacy vs. nuevo PubMed?

En las entradas anteriores Cómo funciona el nuevo PubMed: Search Details y Cómo funciona el nuevo PubMed: Mapeo automático de términos (Automatic Term Mapping – ATM) ya analizamos la forma de trabajar del nuevo PubMed.

Pero dicho lo anterior, todavía hay un tema que hay que conocer y que explica el motivo de por qué los resultados del PubMed legacy son distintos a los del nuevo PubMed.

Podemos aclarar que no es un solo motivo, son los tres siguientes de la figura 1:

Figura 1. Motivos del resultado diferente en el nuevo vs. antiguo PubMed

El primero de los motivos es que son dos sistemas independientes en los que la indexación se realiza en diferentes momentos, por lo que las adiciones, eliminaciones (por ejemplo, eliminar duplicados) o actualizaciones de registros no surten efecto al mismo tiempo en ambos lugares.

Otra modificación es el funcionamiento del algoritmo de búsqueda. Como vemos, el mapeo automático del término o asignación automática de términos (ATM) se ha aumentado para incluir la ortografías británica y americana, las formas de palabras en singular y plural y otros sinónimos para proporcionar una recuperación de búsqueda más coherente y completa (Figura 2). 

Figura 2. Mejora del algoritmo de búsqueda del nuevo PubMed

Y, por último, el truncamiento ha cambiado incluyendo todas las variaciones del término truncado frente a las primeras 600 variaciones del legacy PubMed. Además, si truncamos una frase debemos conocer que ya no hace la búsqueda por frase por defecto si no que separa los términos y los busca por separado (Figura 3).

Figura 3. Diferencias del truncamiento del legacy vs. nuevo PubMed

Para buscar una frase en el nuevo PubMed que incluya el último término truncado tenemos tres posibilidades:

  • Escribir la frase entre comillas dobles: “breast feed*” 
  • Usar una etiqueta de búsqueda: breast feed*[tiab] 
  • Use un guión: breast-feed*

En la figura 4 podemos ver y analizar los detalles de la búsqueda si escribimos en la venta de búsqueda otitis media treatment y vemos en Details la diferente traducción en el legacy vs. nuevo PubMed.

Figura 4. Ejemplo de detalle de búsqueda de otitis media treatment en legacy vs.nuevo PubMed

En resumen, las mejoras del motor de búsqueda del nuevo PubMed las podemos ver en las figura 5:

Figura 5. Mejoras en la recuperación del nuevo PubMed

Cómo funciona el nuevo PubMed: Mapeo automático de términos (Automatic Term Mapping – ATM)

En la entrada Cómo funciona el nuevo PubMed: Search Details mostraba como podemos ver los detalles de nuestra búsqueda y cómo se había modificado esta visualización frente al Legacy PubMed.

En esta nueva entrada vamos a explicar con detalle qué hace PubMed con los términos que nosotros escribimos en su ventana de búsqueda.

Nuevo superalgoritmo de PubMed

La NLM recomiendan a los usuarios de PubMed realizar una búsqueda básica con las siguientes características:

Búsqueda básica recomendada por PubMed

Cuando escribimos nuestra estrategia en la ventana inicial de PubMed siguiendo estas recomendaciones el sistema recuperará los registros en los que encuentre correspondencia con los términos buscados en un proceso denominado mapeo automático de términos (“Automatic Term Mapping” o ATM).

Mediante este proceso los términos ingresados en el cuadro de búsqueda se comparan (en este orden) con una tabla de traducción de Temas (incluyendo MeSH o Encabezamientos de temas médicos), una tabla de traducción de Revistas, el índice de Autor y un índice de Investigador (Colaborador).
Cuando se encuentra una coincidencia para un término o frase en una tabla de traducción, el proceso de mapeo se completa y no continúa a la siguiente tabla de traducción.

Mapeo automático de términos o Automatic Term Mapping (ATM)

El primer índice se denomina “Subject Translation Table“ que incluye:

  • Los encabezamientos MeSH
  • MeSH Subheadings
  • Términos MeSH Entry Terms (See-Reference mappings) para los términos MeSH
  • Tipos de publicación 
  • Pharmacological Actions
  • Términos derivados del Unified Medical Language System (UMLS) que tienen sinónimos equivalentes o variantes léxicas en inglés
  • Supplementary Concepts (sustancias) y sus sinónimos
Subject Translation Table de PubMed

Si encuentra una correspondencia en este índice “MeSH Translation table” el proceso se detiene y el término es mapeado al término MeSH correspondiente. La busqueda incluirá el MeSH, a lo que se añade la búsqueda de la frase cortada en palabras individuales que es buscada en todos los campos (All Fields). La búsqueda del MeSH incluye los términos jerárquicamente por debajo de él, es decir, hace la denominada búsqueda ampliada o “automatic explosion”.

Si, por ejemplo, escribiéramos en la ventana de búsqueda otitis media treatment la estrategia resultante es la que veríamos en Datails tal como en la entrada comenté en la anterior entrada Cómo funciona PubMed: Search Details.

Detalles de búsqueda por otitis media treatment

Si los términos son mapeados en la tabla MeSH, el proceso se detiene. Si algún término no es localizado en esta tabla, PubMed pasa a mapear por revistas buscando en la “Journals Translation Table” que incluye el nombre completo de la revista, abreviatura y número ISSN.

Si es encontrada una revista, esta es añadida a la búsqueda. El término también es buscado en todos los campos (All Fields) y el proceso se detiene aquí.

Si no encuentra correspondencia en “MeSH Translation table” ni en “Journals Translation Table” PubMed comprueba los nombres de autor. Si lo encuentra el proceso se detiene aquí.

Si no encuentra correspondencia, PubMed divide la frase en partes y repite el proceso de mapeo automático del término hasta que encuentra una correspondencia. Los términos que no encuentra correspondencia se buscarán en todos los campos (“All Fields”).

Aquí os dejo un enlace a un pequeño cuestionario para que podáis evaluar vuestros conocimientos del mapeo automático de términos de PubMed