Cerrar

Cómo funciona el nuevo PubMed: ¿Por qué da resultados diferentes el Legacy vs. nuevo PubMed?

En las entradas anteriores Cómo funciona el nuevo PubMed: Search Details y Cómo funciona el nuevo PubMed: Mapeo automático de términos (Automatic Term Mapping – ATM) ya analizamos la forma de trabajar del nuevo PubMed.

Pero dicho lo anterior, todavía hay un tema que hay que conocer y que explica el motivo de por qué los resultados del PubMed legacy son distintos a los del nuevo PubMed.

Podemos aclarar que no es un solo motivo, son los tres siguientes de la figura 1:

Figura 1. Motivos del resultado diferente en el nuevo vs. antiguo PubMed

El primero de los motivos es que son dos sistemas independientes en los que la indexación se realiza en diferentes momentos, por lo que las adiciones, eliminaciones (por ejemplo, eliminar duplicados) o actualizaciones de registros no surten efecto al mismo tiempo en ambos lugares.

Otra modificación es el funcionamiento del algoritmo de búsqueda. Como vemos, el mapeo automático del término o asignación automática de términos (ATM) se ha aumentado para incluir la ortografías británica y americana, las formas de palabras en singular y plural y otros sinónimos para proporcionar una recuperación de búsqueda más coherente y completa (Figura 2). 

Figura 2. Mejora del algoritmo de búsqueda del nuevo PubMed

Y, por último, el truncamiento ha cambiado incluyendo todas las variaciones del término truncado frente a las primeras 600 variaciones del legacy PubMed. Además, si truncamos una frase debemos conocer que ya no hace la búsqueda por frase por defecto si no que separa los términos y los busca por separado (Figura 3).

Figura 3. Diferencias del truncamiento del legacy vs. nuevo PubMed

Para buscar una frase en el nuevo PubMed que incluya el último término truncado tenemos tres posibilidades:

  • Escribir la frase entre comillas dobles: «breast feed*» 
  • Usar una etiqueta de búsqueda: breast feed*[tiab] 
  • Use un guión: breast-feed*

En la figura 4 podemos ver y analizar los detalles de la búsqueda si escribimos en la venta de búsqueda otitis media treatment y vemos en Details la diferente traducción en el legacy vs. nuevo PubMed.

Figura 4. Ejemplo de detalle de búsqueda de otitis media treatment en legacy vs.nuevo PubMed

En resumen, las mejoras del motor de búsqueda del nuevo PubMed las podemos ver en las figura 5:

Figura 5. Mejoras en la recuperación del nuevo PubMed

Cómo funciona el nuevo PubMed: Mapeo automático de términos (Automatic Term Mapping – ATM)

En la entrada Cómo funciona el nuevo PubMed: Search Details mostraba como podemos ver los detalles de nuestra búsqueda y cómo se había modificado esta visualización frente al Legacy PubMed.

En esta nueva entrada vamos a explicar con detalle qué hace PubMed con los términos que nosotros escribimos en su ventana de búsqueda.

Nuevo superalgoritmo de PubMed

La NLM recomiendan a los usuarios de PubMed realizar una búsqueda básica con las siguientes características:

Búsqueda básica recomendada por PubMed

Cuando escribimos nuestra estrategia en la ventana inicial de PubMed siguiendo estas recomendaciones el sistema recuperará los registros en los que encuentre correspondencia con los términos buscados en un proceso denominado mapeo automático de términos (“Automatic Term Mapping” o ATM).

Mediante este proceso los términos ingresados en el cuadro de búsqueda se comparan (en este orden) con una tabla de traducción de Temas (incluyendo MeSH o Encabezamientos de temas médicos), una tabla de traducción de Revistas, el índice de Autor y un índice de Investigador (Colaborador).
Cuando se encuentra una coincidencia para un término o frase en una tabla de traducción, el proceso de mapeo se completa y no continúa a la siguiente tabla de traducción.

Mapeo automático de términos o Automatic Term Mapping (ATM)

El primer índice se denomina “Subject Translation Table“ que incluye:

  • Los encabezamientos MeSH
  • MeSH Subheadings
  • Términos MeSH Entry Terms (See-Reference mappings) para los términos MeSH
  • Tipos de publicación 
  • Pharmacological Actions
  • Términos derivados del Unified Medical Language System (UMLS) que tienen sinónimos equivalentes o variantes léxicas en inglés
  • Supplementary Concepts (sustancias) y sus sinónimos
Subject Translation Table de PubMed

Si encuentra una correspondencia en este índice “MeSH Translation table” el proceso se detiene y el término es mapeado al término MeSH correspondiente. La busqueda incluirá el MeSH, a lo que se añade la búsqueda de la frase cortada en palabras individuales que es buscada en todos los campos (All Fields). La búsqueda del MeSH incluye los términos jerárquicamente por debajo de él, es decir, hace la denominada búsqueda ampliada o “automatic explosion”.

Si, por ejemplo, escribiéramos en la ventana de búsqueda otitis media treatment la estrategia resultante es la que veríamos en Datails tal como en la entrada comenté en la anterior entrada Cómo funciona PubMed: Search Details.

Detalles de búsqueda por otitis media treatment

Si los términos son mapeados en la tabla MeSH, el proceso se detiene. Si algún término no es localizado en esta tabla, PubMed pasa a mapear por revistas buscando en la “Journals Translation Table” que incluye el nombre completo de la revista, abreviatura y número ISSN.

Si es encontrada una revista, esta es añadida a la búsqueda. El término también es buscado en todos los campos (All Fields) y el proceso se detiene aquí.

Si no encuentra correspondencia en “MeSH Translation table” ni en “Journals Translation Table” PubMed comprueba los nombres de autor. Si lo encuentra el proceso se detiene aquí.

Si no encuentra correspondencia, PubMed divide la frase en partes y repite el proceso de mapeo automático del término hasta que encuentra una correspondencia. Los términos que no encuentra correspondencia se buscarán en todos los campos (“All Fields”).

Aquí os dejo un enlace a un pequeño cuestionario para que podáis evaluar vuestros conocimientos del mapeo automático de términos de PubMed

Cómo funciona el nuevo PubMed: Search Details

El próximo 18 de mayo se hace efectiva la transición del legacy (antiguo) al nuevo PubMed. Por lo tanto, hay que poner a punto nuestros conocimientos en la nueva versión y familiarizarnos con las novedades. Y para ello lo primero que tenemos que tener claro es cómo funciona el nuevo PubMed.

¿Cómo funciona el nuevo PubMed?

Pero antes de adentrarnos en cómo funciona es importante conocer dónde ir a ver los detalles de lo que el motor de PubMed hace con los términos que hemos introducido en la ventana de búsqueda.

En el legacy PubMed nos aparecía una ventana de Search Details en la página de resultados de nuestra búsqueda. Esta ventana podíamos verla con más detalles si entrábamos en See more…. Gracias a la nueva pantalla que aparecía éramos capaces de analizar con detalle la «verdadera» estrategia y cómo PubMed había traducido e interpretado nuestros términos de búsqueda. En esta ventana podíamos, además, editar y modificar la estrategia.

En el nuevo PubMed esta ventana ha desaparecido de la página de resultados. Para ver cómo se tradujeron nuestros términos introducidos en la ventana de búsqueda debemos ir a la página de búsquedas avanzadas (Advanced) desde el enlace que aparece debajo de la ventana de búsqueda.

Acceso a página Advanced del nuevo PubMed

Entrando en la página de búsquedas avanzadas veremos el historial de búsqueda. Desde aquí podemos ver, combinar, comparar y descargar nuestras búsquedas previas. Si queremos ver en detalle nuestra estrategia de búsqueda tenemos que acceder a Details.

¿Cómo podemos ver los detalles de nuestra estrategia de búsqueda?

¿Y si queremos editar y modificar nuestra estrategia? Ya no podemos hacerlo directamente como en el Legacy PubMed. En el nuevo PubMed tenemos que escoger en Action la opción de Add to Box y modificarla en esa ventana de búsqueda.

La importancia de la revisión por pares de la estrategia de búsqueda en una revisión sistemática

Siempre que sea posible realice una revisión por pares de la estrategia para identificar los errores más habituales, mejorar la calidad y reducir no solo el riesgo de perder estudios relevantes, sino también el riesgo de identificar un número innecesariamente elevado de registros irrelevantes. Para ello podemos usar PRESS (Peer Review of Electronic Search Strategies) y Checklist (McGowan J, Sampson M, Salzwedel DM, Cogo E, Foerster V, Lefebvre C. PRESS Peer Review of Electronic Search Strategies: 2015 Guideline Statement. J Clin Epidemiol [Internet]. 2016 Jul [cited 2016 Mar 22];75:40–6. Available from: http://www.sciencedirect.com/science/article/pii/S0895435616000585).

Son frecuentes los errores en las estrategias de búsqueda que impiden que se ejecuten en su forma publicada. En un estudio de 63 estrategias de MEDLINE, se detectó al menos un error en más del 90%, incluidos errores de ortografía, errores de truncamiento, error de operador lógico, referencias de líneas de consulta incorrectas, redundancia sin justificación, etc. (Elliott JH, Turner T, Clavisi O, Thomas J, Higgins JP, Mavergames C, Gruen RL. Living systematic reviews: an emerging opportunity to narrow the evidence-practice gap. PLoS Med. 2014 Feb 18;11(2):e1001603. doi: 10.1371/journal.pmed.1001603. eCollection 2014 Feb. PubMed PMID: 24558353; PubMed Central PMCID: PMC3928029. Disponible en: http://dx.plos.org/10.1371/journal.pmed.1001603).

Los seis dominios principales de la lista de verificación actualizada basada en evidencia de PRESS 2015 son:

  • traducción de la pregunta de investigación.
  • operadores booleanos y de proximidad.
  • encabezados de materia.
  • búsqueda de palabras de texto (texto libre).
  • ortografía, sintaxis y números de línea.
  • límites y filtros.

Se recomienda que la revisión por pares de las estrategias de búsqueda se realice en la fase de protocolo de investigación (pre-peer review). Si se realiza una revisión por pares de la estrategia de búsqueda antes de que se realicen las búsquedas definitivas, se descarguen los resultados y los investigadores comiencen a seleccionar los estudios, no habrá necesidad de revisar las estrategias y volver a ejecutar las búsquedas en una fecha posterior. Se ha estimado que la carga de tiempo del proceso de revisión con la lista de verificación PRESS fue menos de dos horas. 

Novedad PubMed: Dos formas de buscar revisiones sistemáticas

Como todos los años hace, la NLM ha actualizado su listado de encabezamientos MeSH. Entre las novedades destaca el nuevo tipo de publicación «Systematic Review» que, además, ha aplicado de manera retrospectiva a las referencias de artículos que son revisiones sistemáticas (ver más en MEDLINE Data Changes—2019.

Por otro lado, la estrategia de búsqueda para el filtro de revisión sistemática también se ha actualizado de tal forma que solo recupera revisiones sistemáticas. Hasta ahora, este filtro recuperaba otros tipos de artículos, incluidos meta-análisis, revisiones de ensayos clínicos, medicina basada en la evidencia, guías, etc. En detalle este filtro es el siguiente:

(((systematic review[ti] OR systematic literature review[ti] OR systematic scoping review[ti] OR systematic narrative review[ti] OR systematic qualitative review[ti] OR systematic evidence review[ti] OR systematic quantitative review[ti] OR systematic meta-review[ti] OR systematic critical review[ti] OR systematic mixed studies review[ti] OR systematic mapping review[ti] OR systematic cochrane review[ti] OR systematic search and review[ti] OR systematic integrative review[ti]) NOT comment[pt] NOT (protocol[ti] OR protocols[ti])) NOT MEDLINE [subset]) OR (Cochrane Database Syst Rev[ta] AND review[pt]) OR systematic review[pt]

Por lo tanto, ahora podemos:

  1. Aplicar en nuestra búsqueda el filtro de revisión sistemática, disponible de tres maneras diferentes: en la opción que se encuentra en la barra lateral izquierda; incluyendo a nuestra estrategia de búsqueda «AND systematic[filter]»; o desde la pantalla de PubMed Clinical Queries.
  2. Utilizar «Systematic review[pt]«. Con esta última estrategia recuperaríamos menos referencias, al ser más restrictiva y, además, perder las referencias más recientes que todavía no han pasado por el proceso de indización de MEDLINE así como artículos de revistas que no forman parte de la base de datos MEDLINE pero si están incluidos en PubMed.

Más información aquí.

¿Debo incluir los Resultados (Outcomes) en la estrategia de búsqueda de una revisión sistemática?

Una revisión sistemática debe comenzar con una pregunta claramente definida y delimitada. La pregunta ha de especificar los tipos de población (los participantes), los tipos de intervenciones (y comparaciones) y los tipos de desenlaces que son de interés. Esta pregunta estructurada es lo que conocemos como PICO (iniciales en inglés). A estos componentes de la pregunta se puede añadir el tipo de diseño del estudio que será incluido (PICOS, donde la S significa diseño del estudio -Study-) y puede ser, por ejemplo, un ‘filtro’ para ensayos clínicos aleatorios.

Pero al trasladarlo a la estrategia de búsqueda es innecesario e incluso indeseable incluir todos los aspectos de la pregunta clínica. Este es el caso de los componentes relativos a las comparaciones y a los resultados. La evidencia nos dice que estos conceptos pueden no estar adecuadamente descritos en las partes «buscables» (como título o resumen) de los artículos y, a menudo, no están bien indexados con términos de vocabulario controlado (Chan 2004, Chalmers I, Glasziou P, Mantziari S).

Existe el sesgo de efecto adverso en las revisiones sistemáticas. El 62% de los autores de revisiones sistemáticas no mencionaron los resultados de efectos adversos en el protocolo. Además, el 35% de las revisiones sistemáticas modificaron, informaron parcialmente o excluyeron el resultado de los eventos adversos según se especificaba en sus respectivos protocolos registrados en PROSPERO (Parson R).

bias.jpg

Por otro lado, en muchos casos la búsqueda nos devuelve una gran cantidad de resultados y con baja precisión por lo que requerirá muchos recursos y esto podría convertirse en un problema. En tales circunstancias, los revisores pueden buscar medios alternativos para aumentar la precisión. La inclusión de términos de búsqueda que se relacionan con los resultados es una técnica comúnmente utilizada para aumentar la precisión en revisiones muy amplias. Sin embargo, dado que la notificación de los resultados ha demostrado ser pobre o sesgada agregar estos a la búsqueda puede aumentar el número de pérdida de estudios relevantes. Por lo tanto, los resultados se omiten intencionalmente de las estrategias de búsqueda y la estrategia para las revisiones de intervención a menudo se estructuran para encontrar los participantes, las intervenciones y el diseño del estudio.

Referencias:

Chan AW, Hróbjartsson A, Haahr MT, Gøtzsche PC, Altman DG. Empirical evidence for selective reporting of outcomes in randomized trials: comparison of protocols to published articles. JAMA. 2004 May 26;291(20):2457-65. PubMed PMID: 15161896.

Chalmers I, Glasziou P. Avoidable waste in the production and reporting of research evidence. Lancet. 2009 Jul 4;374(9683):86-9. doi: 10.1016/S0140-6736(09)60329-9. Epub 2009 Jun 12. Review. PubMed PMID: 19525005.

Faber Frandsen T, Friberg Bruun Nielsen M, Lindhardt CL, Brandt Eriksen M. Using the full PICO model as a search tool for systematic reviews resulted in lower recall for some PICO elements. J Clin Epidemiol. 2020 https://doi.org/10.1016/j.jclinepi.2020.07.005

Glasziou P, Altman DG, Bossuyt P, Boutron I, Clarke M, Julious S, Michie S, Moher D, Wager E. Reducing waste from incomplete or unusable reports of biomedical research. Lancet. 2014 Jan 18;383(9913):267-76. doi: 10.1016/S0140-6736(13)62228-X. Epub 2014 Jan 8. PubMed PMID: 24411647.

Mantziari S, Demartines N. Poor outcome reporting in medical research; building practice on spoilt grounds. Ann Transl Med. 2017 May;5(Suppl 1):S15. doi: 10.21037/atm.2017.03.75. PubMed PMID: 28567397; PubMed Central PMCID: PMC5440299

Parsons R, Golder S, Watt I. More than one-third of systematic reviews did not fully report the adverse events outcome. J Clin Epidemiol. 2019;108:95-101. doi: 10.1016/j.jclinepi.2018.12.007. Epub 2018 Dec 13. PubMed PMID: 30553831.

Revisiones sistemáticas: Cómo documentar las estrategias de búsqueda en bases de datos automatizadas

Los bibliotecarios que participan en un proyecto de revisión sistemática deben redactar la parte del manuscrito que se refiere a los resultados de búsqueda. En una anterior entrada hablaba de «Cómo documentar los artículos obtenidos en búsquedas no automatizadas en la metodología de búsqueda bibliográfica» en una revisión sistemática. Hoy voy a tratar cuestiones de estilo cuando documentamos la estrategia de búsqueda en bases de datos automatizadas siguiendo el modelo propuesto por el Manual de estilo Cochrane.

Lo primero es relativo al formato de elección para las bases de datos más frecuentemente utilizadas. La Cochrane nos indica que deben escribirse con letras mayúsculas: MEDLINE, CENTRAL, OLDMEDLINE y CINAHL (no CINHAL). Otras bases de datos usan una combinación de letras minúsculas y mayúsculas, por ejemplo, Embase (no EMBASE ), PsycLIT (no PsychLIT) y PsycINFO (no PsychINFO).

Las fuentes de búsqueda se han de mencionar en el apartado de «Métodos» como «Métodos de búsqueda para la identificación de estudios» siguiendo el siguiente orden: [Cochrane Group name] Specialised Register (o Specialized Register o Trials Register), CENTRAL, MEDLINE, Embase y cualquier otra base de datos.

También se han de describir brevemente en el resumen de la revisión sistemática, por ejemplo, «Se realizaron búsquedas en CENTRAL, MEDLINE, Embase, otras cinco bases de datos y tres registros de ensayos (mes y año)».

En la sección Métodos de búsqueda, se debe proporcionar la fecha de la búsqueda más reciente (día/mes/año) junto con el número de versión o versión (según corresponda) de cada base de datos. La fecha de inicio de la base de datos debe darse cuando se conozca. Los nombres de las bases de datos deben incluir la plataforma o el nombre del proveedor y los sitios web deben incluir el nombre completo y la URL.

Algunos ejemplos:

  • MEDLINE Ovid (1946 al 10 de febrero de 2015);
  • Embase Ovid (desde 1974 hasta el 9 de febrero de 2015);
  • CINAHL EBSCO (1982 a 9 de febrero de 2015);
  • PsycINFO Ovid (de 1806 a 10 de febrero de 2015);
  • LILACS (1982 a 10 de febrero de 2015);
  • Registro ISRCTN (www.isrctn.com; busqueda realizada el 10 de febrero de 2015);
  • ClinicalTrials.gov (www.clinicaltrials.gov; búsquedas realizadas el 10 de febrero de 2015).

Los términos de búsqueda serán «palabras de texto» («text words» en inglés) y términos del vocabulario indexado o controlado. El formato preferido para referirse al vocabulario controlado de la NLM utilizado para indexar artículos para MEDLINE (y PubMed ) es MeSH (no MESH).

Si mostramos los enlaces a sitios web dentro del texto copiaremos y pegaremos la URL del sitio web, pero eliminando los caracteres innecesarios del final de la URL. Por ejemplo:

https://www.researchinformation.info/news/digital-science-opens-russia-subsidiary?utm_source=adestra&utm_medium=RINewsline&utm_campaign=RI%20NL%20MAY17

Debe acortarse a:

https://www.researchinformation.info/news/digital-science-opens-russia-subsidiary

Hay que omitir el prefijo ‘http: //’ o ‘https: //’ de este campo, no omitir el ‘www.’ si está presente (aunque la dirección probablemente funcionará sin ella) y no agregar ‘www.’ si no está incluido.

Además, cuando enviemos nuestro manuscrito a publicar hay que tener en cuenta que la mayoría de las revistas siguen las guías PRISMA (Preferred Reporting Items for  Systematic Reviews and Meta-Analyses Checklist item 8) que indican que hay que publicar como apéndice del artículo la estrategia de búsqueda de, al menos, una base de datos principal de tal forma que pueda ser reproducible.

El formato puede ser similar al de este ejemplo adaptado del artículo Alejandria MM, Lansang MA, Dans LF, Mantaring JB. Intravenous immunoglobulin for treating sepsis and septic shock. Cochrane Database Syst Rev2002;(1):CD001090, doi:10.1002/14651858.CD001090:

Apéndice: “Estrategia de búsqueda: MEDLINE (OVID)

#1         immunoglobulins/

#2         immunoglobulin$.tw.

#3         ivig.tw.

#4         1 or 2 or 3

#5         sepsis/

#6         sepsis.tw.

#7         septic shock/

#8         septic shock.tw.

#9         septicemia/

#10        septicaemia.tw.

#11        septicemia.tw.

#12        5 or 6 or 7 or 8 or 9 or 10 or 11

#13        4 and 12

#14        randomised controlled trials/

#15        randomised-controlled-trial.pt.

#16        controlled-clinical-trial.pt.

#17        random allocation/

#18        double-blind method/

#19        single-blind method/

#20        14 or 15 or 16 or 17 or 18 or 19

#21        exp clinical trials/

#22        clinical-trial.pt.

#23        (clin$ adj trial$).ti,ab.

#24        ((singl$ or doubl$ or trebl$ or tripl$) adj (blind$)).ti,ab.

#25        placebos/

#26        placebo$.ti,ab.

#27        random$.ti,ab.

#28        21 or 22 or 23 or 24 or 25 or 26 or 27

#29        research design/

#30        comparative study/

#31        exp evaluation studies/

#32        follow-up studies/

#33        prospective studies/

#34        (control$ or prospective$ or volunteer$).ti,ab.

#35        30 or 31 or 32 or 33 or 34

#36        20 or 28 or 29 or 35

#37        13 and 36”

Herramientas para las búsquedas en revisiones sistemáticas: Conversores de estrategias de búsqueda

Cuando hacemos una búsqueda exhaustiva y sistemática de bibliográfica para un documento de síntesis de evidencia como una revisión sistemática, necesitamos buscar en más de una base de datos. En estos casos las estrategias de búsqueda son complejas e implican texto libre, términos de vocabulario controlado, comodines o sintaxis de adyacencia, por lo que la conversión no es un proceso sencillo. Además, las diferentes interfaces y motores de búsqueda tienen diferentes funciones disponibles e interpretan la lógica del usuario de formas distintas. Por ejemplo, la interfaz de PubMed hace la búsqueda ampliada o «explode» de los encabezados de materias MeSH de manera automática mientras que la interfaz de Ovid no lo hace. También los tesauros de encabezamientos de materias son distintos o incluso inexistentes como en la WOS (Más información aquí).

Por ello son útiles las herramientas que nos ayuda a «traducir» nuestra estrategia a diferentes bases de datos. Si bien no son perfectas, nos ayudan en un primer paso con la sintaxis de búsqueda. Entre los que utilizo destaco los dos siguientes:

MEDLINE Transpose
Este proyecto es una colaboración entre el College of Physicians and Surgeons of British Columbia (CPSBC)y la Collaboration for Leadership in Applied Health Research and Care South West Peninsula (PenCLAHRC).

Ha sido desarrollado para mitigar un problema de convertir la sintaxis de búsqueda entre las interfaces de PubMed y Ovid/MEDLINE.  Más información aquí.

Polyglot Search

En esta escribimos nuestra estrategia de búsqueda compleja en formato PubMed u Ovid MEDLINE y Polyglot Search intenta traducirla a cualquiera de los formatos admitidos del motor de búsqueda: EMBASE, WOS, CINAHL, SCOPUS, Cochrane,…
Systematic Review Accelerator.jpgEste módulo es parte del paquete de herramientas del Asistente de Revisión Sistemática gratuito del Bond University Centre for Research in Evidence-Based Practice. Polyglot Search Syntax Translator forma parte del Systematic Review Accelerator. Más información aquí.

¿Y tú, conoces algún conversor más?

Volver al principio