Imagina esto: después de meses de analizar y organizar datos, ya tienes lista tu revisión sistemática para enviarla. Pero, justo días antes de enviarla, te topas por casualidad con tres artículos clave que tu estrategia de búsqueda ni siquiera consideró y que cambian todo lo que pensabas. Es el miedo más grande de cualquier bibliotecario: no saber si realmente has encontrado todo lo que hay.
Y es que cuando trabajamos en síntesis de evidencia, la «intuición» del experto o la simple acumulación de años de experiencia no son salvaguardas suficientes. Y por eso es tan necesario la validación de la sensibilidad de la búsqueda de evidencia que transforma una recopilación bibliográfica convencional en un proceso científico reproducible y defendible ante cualquier auditoría metodológica.
Este interesante artículo de Lagisz et al, recientemente publicado, nos da unas pautas de actuación para evaluar la sensibilidad de las estrategias de búsqueda. Analicemos este artículo y su propuesta.
«Recall absoluto» y «recall relativo»
En revisiones sistemáticas se prioriza típicamente «alto «recall» (minimizar pérdida de estudios relevantes), aceptando un descenso de precisión que luego se gestiona con cribado. En el ámbito de la recuperación de información, es teóricamente imposible garantizar un «recall absoluto». Esto se debe a que el universo total de la literatura existente es, por definición, desconocido; no podemos medir lo que no sabemos que existe. Para resolver esta incertidumbre, debemos adoptar el concepto pragmático de «recall relativo« (o sensibilidad).
Cálculo del recall absoluto. Recall (en español, exhaustividad o sensibilidad) es la proporción de documentos relevantes que un sistema consigue recuperar del total de documentos relevantes que existen en la colección para una necesidad de información dada.
Bajo este enfoque, evaluamos nuestra estrategia frente a una muestra representativa y conocida de estudios. Esto nos permite sustituir la subjetividad por una métrica objetiva de rendimiento, optimizando el balance entre la exhaustividad y la manejabilidad de los resultados.
El corazón del proceso es el set de referencia o artículos «semilla«. Un error metodológico crítico es el sesgo circular: diseñar la estrategia de búsqueda y luego seleccionar para el set de validación artículos que esa misma cadena ya encontró. Esto no es más que un sesgo de Confirmación que «engaña» al cálculo con artículos homogéneos, invalidando la prueba de estrés de la estrategia.
Para que este set actúe como un verdadero «estándar de oro», debe ser externo y recolectado mediante mejores prácticas:
• Recolección Temprana: El set debe reunirse estrictamente antes de diseñar la estrategia de búsqueda definitiva.
• Fuentes Diversas: Debe incluir revisiones sistemáticas previas, rastreo de citas (backward/forward tracking), etc.
• Revisión por Expertos: Consulta con especialistas en el área temática para garantizar la representatividad de autores y años.
• Heterogeneidad: Debe reflejar la variedad de terminología y términos controlados del tema para evitar la homogeneidad simplista.
6 Etapas del flujo de trabajo del bibliotecario
Para validar nuestra búsqueda, Lagisz et al., nos sugieren seguir este flujo de trabajo secuencial:
Recolección del set de evaluación comparativa («benchmarking»): Define el alcance y reúne los estudios que sean útiles que encuentres, ya sea hablando con expertos o buscando en otras fuentes.
Búsqueda de identificadores: Localiza los DOI de cada estudio y combínalos con el operador OR para crear una «cadena de benchmarking» compacta. Si un estudio no aparece por DOI, debe buscarse por título o autor para verificar si la ausencia es real.
Personalización del set: Verifica cuáles estudios están indexados en la base de datos actual. Debemos eliminar los estudios no indexados del cálculo para no penalizar injustamente el puntaje de sensibilidad (unfairly lowering the sensitivity score).
Ejecución de la búsqueda objetivo: Aplica tú estrategia de búsqueda completa (MeSH, Emtree, palabras clave y lógica booleana) y registra el número total de resultados (hits).
Prueba de solapamiento: Cruza ambas cadenas mediante el operador AND en un bloque lógico simple: [Cadena de Búsqueda Objetivo] AND [Cadena del set de evaluación comparativa].
Cálculo de sensibilidad: Aplica la fórmula para obtener el «recall relativo» y determina si el resultado inicia un ciclo de mejora.
Cálculo e Interpretación
En una revisión sistemática, buscamos una sensibilidad alta, pero esto suele aumentar el «ruido» (resultados irrelevantes). No existe un umbral universal del 100% por lo que el equipo de revisión debe decidir cuándo la búsqueda es «suficientemente buena».
Fórmula de sensibilidad (recall):
Sensibilidad = (Estudios del set encontrados) / (Total de estudios del set indexados en la base de datos)
Ejemplo práctico: Si su set de referencia consta de 5 artículos indexados en Scopus y su cadena objetivo captura 4 de ellos:
Cálculo: 4 / 5 = 0.8
Resultado: 80% de sensibilidad.
Interpretación: El 20% de la literatura clave es «invisible« para su búsqueda actual, lo que exige una justificación técnica de si ese nivel de riesgo es aceptable o requiere refinamiento.
¿Qué pasa si la sensibilidad es baja?
Si este es nuestro caso, debemos realizar un análisis diagnóstico de los estudios «no capturados» siguiendo esta lista de tareaspara el Refinamiento:
Aislar omisiones: Ejecutar Cadena de Benchmarking NOT Cadena de Búsqueda Objetivo para visualizar exclusivamente los artículos que su estrategia ignoró.
Análisis de registros: Examinar los campos de título, resumen y términos controlados (encabezamientos de materia) de los estudios perdidos.
Ajuste de lógica: Incorporar sinónimos detectados o flexibilice los operadores de proximidad y truncamiento.
Justificación Técnica: Documentar la justificación razonada detrás de cada término añadido para mantener la trazabilidad.
Revalidación: Repetir el cálculo de sensibilidad hasta alcanzar el equilibrio deseado por el equipo de revisión. Este refinamiento garantiza que la búsqueda final sea un reflejo fiel del estado del arte, cumpliendo con los estándares de transparencia internacional.
Bibliografía
Lagisz M, Yang Y, Young S, Nakagawa S. A practical guide to evaluating sensitivity of literature search strings for systematic reviews using relative recall. Res Synth Methods. 2025 Jan;16(1):1-14. doi: 10.1017/rsm.2024.6.
Hasta ahora, diseñar una estrategia de búsqueda sólida, localizar estudios relevantes y manejar cientos de referencias era un trabajo artesanal, intensivo en tiempo y dependiente por completo de la experiencia humana. Sin embargo, la integración de modelos de lenguaje generativo en los procesos de revisión sistemática está modificando de manera sustancial la fase de búsqueda y recuperación de información.
La clave está en entender qué puede hacer cada uno y cómo combinar sus fortalezas para obtener búsquedas más robustas, eficientes y reproducibles en un contexto donde la calidad de la evidencia importa más que nunca.
Tareas en las que puede intervenir la IA
La aportación de la IA no reside únicamente en la aceleración de tareas, sino en la capacidad de ampliar, diversificar y estructurar el acceso a la literatura científica, amplificando los procedimientos manuales.
Generación rápida y exhaustiva de términos de búsqueda. Los modelos de IA generativa son capaces de recopilar términos de miles de textos y, a partir de ahí, sugieren sinónimos, acrónimos y variantes de un mismo concepto. En otras palabras, ayudan a descubrir términos relevantes que, de otro modo, podrían pasarse por alto. Esta capacidad resulta especialmente útil en áreas emergentes o interdisciplinarias, donde la terminología aún no está normalizada y la literatura se dispersa en múltiples dominios temáticos.
Aumento de la sensibilidad/exhaustividad (recall) de la búsqueda. Estas herramientas son capaces de producir una primera estrategia de búsqueda con elevada sensibilidad, es decir, muy amplia, recuperando muchísimos resultados. Es verdad que luego hay que limpiarlos y depurarlos, pero esa “primera cosecha” sirve como una base sólida sobre la que seguir afinando la estrategia, añadir filtros y ajustar los términos. En este sentido, la IA funciona como un acelerador: te ayuda a arrancar rápido con un punto de partida fuerte, aunque siempre hace falta la mirada experta del bibliotecario para asegurar que todo tenga sentido y calidad.
Generación de búsquedas booleanas para distintas bases de datos/plataformas. Uno de los avances más visibles es la capacidad de la IA para traducir una estrategia conceptual en consultas operativas adaptadas a la sintaxis de cada proveedor: Ovid MEDLINE, Embase.com, Scopus, Web of Science, CINAHL (EBSCO, Ovid, …), PsycINFO (Proquest, EBSCO, …), entre otros. Esto incluye la aplicación correcta de campos de búsqueda, operadores de proximidad, truncamientos, tesauros controlados y peculiaridades funcionales de cada motor. Esta precisión reduce errores, evita pérdidas de sensibilidad y mejora la reproducibilidad del proceso.
Ventajas/Oportunidades del uso de la IA
Fase de búsqueda inicial más exhaustiva: La IA puede generar en pocos segundos un abanico enorme de términos, sinónimos y palabras clave relacionadas con un tema. Esto resulta especialmente útil cuando nos enfrentamos a un campo nuevo o del que sabemos poco: la herramienta propone conceptos que quizá no habríamos considerado y evita que la estrategia de búsqueda se quede corta.
Más referencias desde el principio: Las herramientas de IA suelen recuperar mucho más. Su forma de interpretar las palabras clave es más amplia que la nuestra, lo que se traduce en un volumen mayor de resultados. Luego tocará depurarlos, sí, pero arrancar con una red más grande ayuda a no dejar estudios relevantes fuera.
Menos tiempo perdido al adaptar estrategias entre bases de datos: Pasar una estrategia de búsqueda de MEDLINE (PubMed u OVID) a Embase.com, Scopus o WoS es un trabajo pesado, repetitivo y lleno de pequeños detalles que es fácil olvidar. La IA puede hacerlo automáticamente, respetando sintaxis, operadores booleanos y campos correctos en cada plataforma. En la práctica, esto supone menos errores y muchas horas ahorradas.
Orden y lógica en los términos: Además de reunir términos útiles, la IA es capaz de agruparlos por categorías o temas. No solo te dice qué palabras usar, sino que te ayuda a entender cómo se relacionan entre sí, lo que facilita estructurar la búsqueda con sentido.
Inconvenientes y retos del uso de IA en las revisiones sistemáticas
Mucho volumen, poca precisión: Que la IA recupere cientos o miles de referencias puede parecer una ventaja, pero tiene trampa: no distingue bien lo relevante de lo accesorio. Esto obliga a dedicar tiempo extra a revisar y descartar estudios que no encajan con la pregunta de investigación. En cambio, una estrategia elaborada por un bibliotecario suele ser más ajustada desde el principio, porque está pensada para responder a criterios concretos y no para abarcar “todo lo que pueda sonar parecido”.
La experiencia humana sigue siendo irremplazable: La IA propone muchos términos, sí, pero no sabe cuándo un matiz importa. Afinar la estrategia de búsqueda, elegir el descriptor correcto o decidir si un término aporta ruido o información útil sigue siendo territorio humano. Las listas generadas por la IA necesitan ser revisadas, depuradas y enriquecidas por alguien que entienda el contexto, las particularidades del tema y las implicaciones metodológicas.
Limitaciones de acceso a bases de datos suscritas: Hoy por hoy, la mayoría de modelos de IA no pueden entrar en bases de datos científicas de pago. Esto significa que no pueden comprobar en tiempo real qué términos están indexados, qué descriptores existen o cómo se estructura un determinado tesauro especializado.
No puede moverse por tesauros especializados: Al no tener acceso a bases como EMBASE, CINAHL o PsycINFO, la IA no es capaz de navegar por sus tesauros y proponer descriptores correctos. Este es un punto crítico porque las estrategias de búsqueda más sólidas combinan términos libres con términos controlados, y esa fineza todavía no está al alcance de las herramientas generativas.
No descarga ni extrae referencias: Otra limitación importante es que la IA no puede descargar los resultados de la búsqueda ni gestionarlos en un gestor bibliográfico. Sigue siendo necesario pasar por las plataformas originales para obtener los registros y preparar la deduplicación o el cribado.
Siempre necesita supervisión: El uso de IA no elimina la figura del bibliotecario experto ni del equipo de revisión. Más bien cambia su papel: deja de ser quien hace cada paso manualmente para convertirse en quien valida, corrige y toma decisiones informadas. Sin esa supervisión, la IA puede generar estrategias amplias, pero no necesariamente adecuadas.
Un modelo sinérgico: IA + bibliotecario
El futuro inmediato no pasa por elegir entre inteligencia artificial o bibliotecario especializado, sino por combinarlos teniendo en cuenta las fortalezas y limitaciones de cada uno de ellos. Cada uno aporta algo diferente y, cuando trabajan juntos, el proceso de búsqueda y revisión gana en velocidad, alcance y rigor.
¿Cuál sería el rol de la IA? La IA es especialmente útil en las primeras fases del trabajo. Su fortaleza está en generar cantidad: propone términos, sugiere combinaciones, construye borradores de estrategias de búsqueda y automatiza tareas tediosas como adaptar consultas entre plataformas o expandir sinónimos. Es rápida y eficiente para mover grandes volúmenes de información.
¿Qué aporta el bibliotecario? El bibliotecario, por su parte, aporta calidad. No solo afina la terminología y valida los conceptos relevantes, sino que es quien domina el uso de tesauros, entiende la lógica de indexación de cada base de datos y detecta inconsistencias que la IA no ve. Además, garantiza el rigor metodológico: sabe cuándo un término es demasiado amplio, cuándo un operador puede distorsionar la pregunta de investigación y cómo documentar correctamente una estrategia reproducible.
La IA debe usarse como compañera de los humanos, no como sustituta.
Tú eres, en última instancia, responsable de su síntesis de la evidencia, incluida la decisión de usar IA y de garantizar la adhesión a las normas legales y éticas.
Usa la IA siempre que no comprometas el rigor metodológico ni la integridad de la síntesis.
Debes de informar de forma completa y trasparente del uso de cualquier IA que emita o sugiera juicios.
La inteligencia artificial está irrumpiendo con fuerza en la síntesis de evidencia. Un estudio reciente de la Agencia Canadiense de Medicamentos (CDA-AMC) ofrece datos interesantes que conviene conocer (Featherstone R, Walter M, MacDougall D, Morenz E, Bailey S, Butcher R, et al. Artificial Intelligence Search Tools for Evidence Synthesis: Comparative Analysis and Implementation Recommendations. Cochrane Evidence Synthesis and Methods. 2025;3(5):e70045, doi: 10.1002/cesm.70045.).
Este artículo tuvo como objetivo evaluar el potencial de herramientas de búsqueda basadas en inteligencia artificial (Lens.org, SpiderCite y Microsoft Copilot) para apoyar la síntesis de evidencia vs. métodos de búsqueda tradicionales y establecer recomendaciones de implementación bajo un enfoque “fit for purpose”, es decir, utilizar cada herramienta solo para tareas específicas donde aporten valor. Se evaluaron siete proyectos completados en la agencia, aplicando búsquedas de referencia (método tradicional) frente a búsquedas con cada herramienta de IA. Se midieron sensibilidad/recall, número necesario a leer (NNR), tiempo de búsqueda y cribado, y contribuciones únicas de cada herramienta. Además, se recogió experiencias de los especialistas en información sobre usabilidad, limitaciones y sorpresas en el uso de los tres sistemas.
Resultados
Método / Herramienta
Sensibilidad promedio
Diferencias entre proyectos simples y complejos
NNR (número necesario a leer)
Tiempo de búsqueda
Observaciones principales
Métodos tradicionales
0.98 – 1 (casi perfecta)
Consistentemente alta en todos los proyectos
Más bajo que IA
2.88 h en promedio
Estándar de referencia, máxima fiabilidad
Lens.org
0.676
Simples: 0.816 Complejos: 0.6
Más alto que el estándar (98 vs 83)
Mayor tiempo (2.25 h, más que Copilot o SpiderCite)
Mejor de las IA, pero menos eficiente; útil en búsquedas simples y de autores
SpiderCite
0.23 – 0.26
Similar en simples y complejos
Variable (Cited by mejor que Citing)
~1.25 h
Muy baja sensibilidad, pero puede aportar referencias únicas en temas complejos; solo útil como complemento
Copilot
0.24 (muy variable: 0–0.91 según proyecto)
Simples: 0.41 Complejos: 0.15
Muy variable (mejor en simples, muy alto en complejos)
Más rápido (0.96 h promedio)
Dependiente de la calidad de los prompts; no sustituye estrategias, útil para sugerir palabras clave
Sensibilidad = proporción de estudios relevantes efectivamente recuperados. NNR = número necesario a leer; cuanto menor, mejor eficiencia de cribado.
Verde = mejor desempeño relativo. Amarillo = intermedio / aceptable. Rojo = débil. Naranja = muy variable según proyecto.
Discusión
Las herramientas de IA mostraron rendimiento variable e inconsistente, lo que implica que no pueden reemplazar las búsquedas profesionales estándar en revisiones sistemáticas.
Pueden generar falsa confianza en usuarios sin experiencia. Se requiere conocimiento experto en construcción de estrategias y en validación de resultados para corregir limitaciones.
Limitaciones del estudio: solo se evaluaron 7 proyectos y 3 herramientas, sin analizar combinaciones entre ellas
Recomendaciones de implementación
La CDA-AMC propuso un uso limitado y estratégico:
Lens.org: útil para revisiones con preguntas acotadas y técnicas (como dispositivos con una función o población bien definida) o para identificar rápidamente autores vinculados a un tema o indicación clínica cuando los métodos estándar no alcanzan.
SpiderCite: complemento para búsquedas de citas en proyectos complejos, siempre que se disponga de artículos semilla.
Copilot (u otros LLMs): apoyo en la generación de palabras clave y términos de búsqueda, pero no para estrategias completas
Conclusión
Las tres herramientas evaluadas (Lens.org, SpiderCite, Copilot) no son adecuadas para reemplazar estrategias de búsqueda complejas en revisiones sistemáticas, debido a variabilidad en sensibilidad y precisión. Sin embargo, tienen potencial como apoyos puntuales en tareas específicas: generación de términos, búsquedas simples o de citas, y exploración preliminar. El estudio subraya la necesidad de mantener el papel central del bibliotecario/experto en información en la validación de cualquier resultado generado con IA, y de continuar monitorizando nuevas herramientas dada la rápida evolución tecnológica.
Reflexiones para quienes trabajamos en bibliotecas médicas
Las herramientas de IA pueden ahorrar tiempo en fases preliminares, generar ideas de términos de búsqueda, identificar autores, pero no deben utilizarse como única estrategia para revisiones sistemáticas si se espera exhaustividad.
Es clave entender los límites: sensibilidad menor, posible sesgo en lo que captura IA, variabilidad según prompt o según lo cerrado o amplio que sea el tema.
Siempre debe haber validación humana experta, verificación de resultados únicos que aparezcan en IA, comparación con lo recuperado por métodos tradicionales.
La base de toda revisión sistemática y otros estudios de síntesis sólidos es una búsqueda de evidencia cuidadosamente diseñada y rigurosamente ejecutada (1). En la búsqueda bibliográfica cómo se busca, dónde se busca y quién diseña la estrategia son factores que pueden marcar una diferencia crítica en la calidad de la evidencia recopilada.
En el proceso de búsqueda pueden surgir dos tipos principales de sesgos:
Sesgo de identificación: aparece cuando no se localizan estudios relevantes, a menudo porque la estrategia de búsqueda no es suficientemente sensible o porque no se han explorado todas las fuentes pertinentes. Este tipo de sesgo es especialmente problemático en revisiones sistemáticas que sirven de base para tomar decisiones clínicas, ya que puede comprometer la validez de los resultados.
Sesgo de diseminación (o de publicación): se produce cuando los resultados de un estudio influyen en su probabilidad de ser publicados. Por ejemplo, los estudios con resultados positivos tienen más probabilidades de publicarse, de hacerlo en inglés, con mayor rapidez o de recibir más citas. Este fenómeno puede distorsionar la percepción de la eficacia de una intervención.
¿Cómo reducir estos sesgos?
Diseñar una estrategia de búsqueda rigurosa, con la colaboración de un especialista en información. Idealmente, esta estrategia debe ser revisada por pares antes de ser ejecutada (1,4-6). La participación de bibliotecarios especializados en ciencias de la salud en revisiones sistemáticas no es un añadido opcional, sino una práctica recomendada por las principales guías metodológicas (7-9) y respaldada por la evidencia científica (10-11).
Utilizar múltiples bases de datos bibliográficas. Se recomienda un mínimo de dos para revisiones sistemáticas, pero también se debe justificar su elección. Según el Cochrane Handbook, el objetivo de las búsquedas es identificar todos los estudios relevantes disponibles, lo que requiere desarrollar estrategias lo más sensibles posibles, sin perder de vista la pertinencia de los resultados (7). Debemos hacer balance entre la precisión y exhaustividad pero teniendo en cuenta que el objetivo de una búsqueda para una RS es identificar todos los estudios pertinentes (maximizar la sensibilidad pero con una precisión razonable). Una de las cuestiones más complicadas es cuando dar por finalizada la búsqueda. En este equilibrio entre amplitud y relevancia, la experiencia del bibliotecario resulta fundamental.
Ampliar la búsqueda más allá de las bases de datos. La inclusión de fuentes como motores de búsqueda, registros de ensayos clínicos, literatura gris, búsqueda complementaria de citas (forward y backward) y el contacto con expertos puede ser clave para identificar estudios que de otro modo pasarían desapercibidos.
Incluir estudios no publicados. Dado que una parte significativa de los estudios completados no se publican (12), buscarlos activamente en registros, literatura gris o sitios web especializados contribuye a mitigar el sesgo de publicación (13).
Tipo de sesgo
Descripción
Estrategias para minimizarlo
Sesgo de identificación
No se recuperan todos los estudios relevantes.
Diseñar una estrategia exhaustiva con ayuda de un bibliotecario experto Usar ≥2 bases de datos Evitar el uso uso de filtros/límites Ampliar con búsquedas complementarias
Sesgo de publicación o diseminación
Solo se publican ciertos tipos de resultados, como los positivos.
Buscar literatura gris Consultar registros de ensayos clínicos Contactar expertos Incluir estudios no publicados
Un dato revelador
Greenhalgh y Peacock (14) encontraron que solo el 25% de los artículos incluidos en su revisión fueron recuperados a través de bases de datos electrónicas. El resto provino de rastrear citas, conocimiento personal, contactos o búsqueda manual.
BIBLIOGRAFÍA
Metzendorf MI, Featherstone RM. Ensuring quality as the basis of evidence synthesis: leveraging information specialists’ knowledge, skills, and expertise. Cochrane Database of Systematic Reviews 2018, Issue 9. Art. No.: ED000125. doi: 10.1002/14651858.ED000125.
McGowan J, Sampson M. Systematic reviews need systematic searchers. JMLA 2005;93(1):74–80.
Rethlefsen ML, Farrell AM, Osterhaus Trzasko LC, Brigham TJ. Librarian co‐authors correlated with higher quality reported search strategies in general internal medicine systematic reviews. Journal of Clinical Epidemiology2015;68(6):617–26. doi: 10.1016/j.jclinepi.2014.11.025
McGowan J. Sampson M, Salzwedel DM, Cogo E, Foerster V, Lefebvre C. PRESS peer review of electronic search strategies: 2015 guideline statement. J Clin Epidemiol. 2016.75:40–46. doi: 10.1016/j.jclinepi.2016.01.021
Lefebvre C, Manheimer E, Glanville J. Chapter 6: Searching for studies. In: Higgins JPT, Green S. (Editors). Cochrane handbook for systematic reviews of interventions version 5.1.0. Updated March 2011. Accessed July 27, 2022. https://handbook-5-1.cochrane.org/chapter_6/6_searching_for_studies.htm
Aromataris E, Munn Z. Chapter 1: JBI systematic reviews. In: Aromataris E, Munn Z (Editors).In: JBI Manual for Evidence Synthesis. JBI; 2020. Accessed July 27, 2022. https://jbi-global-wiki.refined.site/space/MANUAL
Kugley S, Wade A, Thomas J, et al. Searching for studies: a guide to information retrieval for Campbell Systematic Reviews. Oslo: The Campbell Collaboration; 2017. Accessed July 27, 2022. doi: 10.4073/cmg.2016.1
Rethlefsen ML, Murad MH, Livingston EH. Engaging medical librarians to improve the quality of review articles. JAMA. 2014;312(10):999-1000. doi:10.1001/jama.2014.9263
Kirtley S. Increasing value and reducing waste in biomedical research: librarians are listening and are part of the answer. Lancet. 2016;387(10028):1601. doi:10.1016/S0140-6736(16)30241-0
Hong QN, Brunton G. Helping Trainees Understand the Strategies to Minimize Errors and Biases in Systematic Review Approaches. Educ Information. 2025;41(3):161–175; doi: 10.1177/01678329251323445.
Greenhalgh, T., & Peacock, R. (2005). Effectiveness and efficiency of search methods in systematic reviews of complex evidence: Audit of primary sources. BMJ. 2005:331(7524), 1064–1065. doi: 10.1136/bmj.38636.593461.68
El pasado 10 de junio participé, como cada año, en el curso de acogida y bienvenida a los nuevos residentes del Hospital Universitario de Getafe. Esta intervención, centrada tradicionalmente en los fundamentos de la búsqueda bibliográfica y los recursos de la biblioteca, ha ido evolucionando en los últimos años para dar cabida a los profundos cambios que la inteligencia artificial (IA) está generando en los procesos de búsqueda de información científica.
Les presenté el funcionamiento de la Biblioteca Virtual, un recurso esencial para el acceso a la información científica de calidad. Les mostré cómo registrarse correctamente en el portal para poder acceder, desde cualquier dispositivo y ubicación, a una amplia colección de bases de datos especializadas, revistas científicas, libros electrónicos y otros recursos suscritos por la red sanitaria pública. Hicimos especial hincapié en la importancia de utilizar estas fuentes institucionales frente a buscadores generalistas, y en cómo aprovechar al máximo los servicios disponibles para apoyar tanto la práctica clínica como sus actividades formativas e investigadoras.
En la edición de 2024, la IA ocupó aproximadamente un tercio del contenido. Este año, sin embargo, ha constituido ya la mitad de mi presentación, reflejo de su creciente relevancia tanto en la práctica clínica como en el proceso de aprendizaje e investigación de nuestros profesionales en formación.
Los propios residentes reconocieron utilizar con frecuencia herramientas de IA generativa —principalmente modelos como ChatGPT— para resolver dudas clínicas, localizar información rápida o redactar textos. Esta admisión evidencia una realidad incuestionable: la IA ya forma parte del entorno de trabajo cotidiano del personal sanitario. Sin embargo, también pone de manifiesto una necesidad urgente: formar a los nuevos profesionales en el uso crítico, seguro y eficaz de estas herramientas.
Durante la sesión, abordamos conceptos esenciales para entender la búsqueda de información basada en evidencia, desde el triángulo de la búsqueda eficiente hasta la jerarquía de las fuentes. En este contexto, presenté el papel complementario —que no sustitutivo— de la inteligencia artificial en la búsqueda bibliográfica. Se mostraron ejemplos concretos de herramientas de IA aplicadas a distintas fases del proceso: desde asistentes conversacionales como ChatGPT o Claude, hasta motores de síntesis como Elicit, y plataformas de análisis de citaciones como Scite.
Subrayé especialmente los riesgos de desinformación y sesgos si se emplean estas herramientas sin una evaluación humana crítica, y proporcioné orientaciones prácticas sobre cómo formular prompts efectivos.
Nuestro compromiso desde la biblioteca es acompañar esta transición, ofreciendo recursos de calidad, formación continua y apoyo experto. Porque saber buscar sigue siendo —más que nunca— una competencia esencial para el ejercicio profesional informado, riguroso y basado en la mejor evidencia disponible.
En otras entradas de este blog hemos hablado de la importancia de planificar correctamente una revisión sistemática, como en los 13 pasos para la planificación de una revisión o en la explicación de la metodología de búsqueda según JBI. Hoy ponemos el foco en un momento clave del proceso: el primer paso que da el bibliotecario cuando comienza a colaborar en una revisión sistemática.
Antes de diseñar la estrategia de búsqueda definitiva, es imprescindible realizar una búsqueda preliminar exploratoria, identificar revisiones en curso en registros como PROSPERO y, a partir de todo ello, refinar y delimitar adecuadamente la pregunta de investigación. Esta fase inicial es fundamental para asegurar la pertinencia del trabajo, evitar duplicaciones y aportar valor a la evidencia existente.
Estos primeros pasos no siempre son visibles, pero son esenciales para que la revisión tenga solidez metodológica desde el inicio. El papel del bibliotecario en esta fase no solo es técnico, sino estratégico: contribuye activamente a que el equipo investigador formule una pregunta clara, contextualizada y alineada con la literatura disponible. Como se muestra en la imagen, incluso las herramientas de IA generativa pueden ser un apoyo en esta etapa exploratoria, aunque siempre deben usarse de forma crítica y complementaria, nunca como sustituto de las fuentes especializadas.
En los últimos tiempos estamos asistiendo a un cambio importante en la forma de buscar información. Hasta ahora, estábamos acostumbrados a usar motores de búsqueda como Google para localizar contenidos en la web: introducíamos palabras clave y recibíamos una lista de enlaces como respuesta. Sin embargo, con la llegada de herramientas basadas en inteligencia artificial generativa —como ChatGPT—, la experiencia cambia por completo: ya no se trata de encontrar, sino de generar contenido nuevo a partir de lo que preguntamos.
Pero, ¿Qué diferencias hay entre una búsqueda tradicional y una consulta a un modelo de IA? ¿Qué limitaciones y oportunidades presenta cada una?
En esta entrada, encontrarás una comparativa que puede ayudarte a entender cómo se complementan ambas herramientas y cómo podemos aprovecharlas en nuestro día a día profesional.
Comparativa Google vs. ChatGPT
Categoría
Google (Motor de Búsqueda)
ChatGPT (IA Generativa)
Propósito
Encontrar y organizar información disponible en la web, proporcionando listas de fuentes y enlaces relevantes.
Generar contenido nuevo (texto, resúmenes, explicaciones) a partir de patrones aprendidos, adaptándose al contexto aportado.
Funcionamiento
Indexa y recupera información basándose en palabras clave, algoritmos de relevancia y señales SEO/semánticas.
Utiliza modelos de lenguaje entrenados con enormes volúmenes de texto para predecir continuaciones y generar respuestas coherentes.
Interacción
El usuario introduce una consulta (keywords) y obtiene una lista de enlaces a páginas web o fragmentos destacados («snippets»).
El usuario aporta un prompt o contexto detallado y el modelo proporciona una respuesta directa en forma de texto narrativo o estructurado.
Actualización de Información
Depende de la frecuencia de rastreo e indexación de sus robots (web crawlers). Suele reflejar cambios en la web en cuestión de horas o días.
El conocimiento está congelado al momento del último entrenamiento. No accede en tiempo real a novedades, a menos que esté integrado con plug-ins o fuentes actualizadas.
Personalización
Ofrece resultados personalizados basados en historial de búsquedas, ubicación geográfica y preferencias previas.
Adapta la respuesta al prompt específico y puede mantener un contexto conversacional, pero no rastrea el historial de búsqueda web del usuario.
Creatividad
Limitada a mostrar información existente en la web; no genera contenido original.
Alta capacidad creativa para generar texto narrativo, ejemplos, analogías o reformulaciones no existentes anteriormente.
Ejemplos
Google Search, Bing, Yahoo (sitios web de motores de búsqueda).
ChatGPT (OpenAI), Bard (Google), Bing Chat con IA, Copilot.
Pero una cosa debemos tener clara: Aunque las herramientas de inteligencia artificial generativa como ChatGPT pueden ser útiles para explicar conceptos, resumir textos o explorar ideas, no deben utilizarse para buscar literatura científica. Estos modelos no acceden directamente a bases de datos bibliográficas ni garantizan la veracidad, actualidad o trazabilidad de las referencias que generan. Para búsquedas rigurosas en ciencias de la salud, es imprescindible utilizar fuentes especializadas como PubMed, Embase, CINAHL o Scopus.
El pasado martes tuve el placer de impartir el curso “Fundamentos metodológicos de revisiones sistemáticas”, organizado por BiblioSalud, la red de bibliotecarios y profesionales de la información en ciencias de la salud de España. Esta sesión formativa, dirigida especialmente a bibliotecarios médicos, se centró en los aspectos clave que debemos conocer para comprender y acompañar con rigor el desarrollo de una revisión sistemática.
En esta entrada del blog quiero comenzar a compartir una selección de las herramientas y recomendaciones prácticas que utilizo habitualmente en mi trabajo diario con documentos de síntesis de evidencia.
El objetivo es ofrecer una guía no exhaustiva, hay muchas y variadas (ver figura) pero con recomendaciones y herramientas útiles y basada en mi experiencia, que sirva tanto a quienes empiezan como a quienes ya participan en revisiones sistemáticas desde las bibliotecas.
Voy a dividir las herramientas en varios apartados según su uso:
Recolección de términos controlados y libres.
Proceso de búsqueda y cribado.
Chatbots e inteligencia artificial para apoyar la confección de estrategias booleanas.
Herramientas para la búsqueda complementaria.
Otras herramientas recomendadas para las revisiones sistemáticas.
En esta entrada veremos las primeras de estas herramientas y recomendaciones para la recolección de términos.
Recolección de términos
Uno de los pasos más críticos en cualquier revisión sistemática es la correcta identificación de términos controlados y palabras clave. Una estrategia de búsqueda bien construida comienza con una recolección exhaustiva de términos y para ello contamos con una serie de recursos imprescindibles:
1.1. Entry Terms de MeSH Database.
La herramienta clásica para explorar la jerarquía de los Medical Subject Headings (MeSH). Nos permite ver la definición de cada término, sus sinónimos, su posición dentro del árbol jerárquico, subencabezamientos permitidos y términos relacionados o «Entry Terms». Fundamental para identificar los términos controlados exactos que se deben utilizar en PubMed y para entender el enfoque conceptual con el que el sistema indexa los documentos.
1.2. Sinónimos de Emtree de EMBASE
El Emtree es el tesauro específico de la base de datos Embase. Su lógica es similar al MeSH pero tiene su propia estructura y contiene más términos, especialmente útiles para temas en farmacología o dispositivos médicos. Conviene hacer búsquedas paralelas en MeSH y Emtree para comparar coberturas y encontrar sinónimos o variantes terminológicas que pueden enriquecer la estrategia.
Esta herramienta permite comparar los términos MeSH asignados, los términos empleados en el título y resumen así como las palabras clave de los autores a un conjunto de artículos. Es especialmente útil para detectar patrones o términos recurrentes en la literatura más relevante sobre tu tema. Solo necesitas extraer los PMIDs de los artículos clave y el analizador los agrupa mostrando visualmente los MeSH comunes. Ideal para verificar si estás pasando por alto términos relevantes o para ajustar tu estrategia inicial.
Esta herramienta permite analizar la frecuencia de palabras en títulos y resúmenes de los resultados de una búsqueda bibliográfica. Solo necesitas copiar y pegar el listado de referencias (por ejemplo, desde PubMed) y Word Freq generará un listado de términos ordenados por frecuencia. Es especialmente útil para:
Identificar términos clave y sinónimos que puedes haber pasado por alto.
Detectar conceptos emergentes o patrones de lenguaje en la literatura.
Afinar tu estrategia de búsqueda ajustando los términos libres.
Una herramienta sencilla pero muy eficaz para enriquecer la fase exploratoria de cualquier revisión sistemática.
Es una potente herramienta para realizar minería de datos sobre resultados de PubMed. Introduciendo una lista de PMIDs o haciendo una búsqueda directa, puedes ver las frecuencias de palabras en títulos, resúmenes y términos MeSH. También puedes analizar la aparición de autores, revistas, años de publicación… Es perfecta para afinar términos libres y obtener una imagen más clara del contexto bibliográfico.
Desarrollado por la National Library of Medicine, este recurso es especialmente útil cuando partimos de un texto breve (como el resumen de un protocolo o el título de un artículo). Solo tienes que copiar el contenido y MeSH on Demand te devuelve sugerencias de términos MeSH relevantes. Es una excelente forma de inspirarte cuando aún estás perfilando la estrategia inicial.
1.7. Asistente de inteligencia artificial MeshMaster
MeSHMaster es un chatbot especializado que utiliza inteligencia artificial para ayudarte a construir estrategias de búsqueda booleanas, combinando términos MeSH y palabras clave libres. A partir de una descripción breve del tema o una pregunta clínica, el asistente sugiere:
Términos MeSH relevantes y sinónimos.
Combinaciones booleanas iniciales (AND, OR, NOT).
Variantes terminológicas en inglés que pueden enriquecer la sensibilidad de la búsqueda.
Es una herramienta especialmente útil en las primeras fases de diseño de la estrategia, cuando se busca inspiración o una validación rápida de conceptos clave. Aporta rapidez sin perder la lógica estructural que requiere una buena estrategia de búsqueda.
Te invito a seguir mis próximas entradas para descubrir cómo integrar estas herramientas en tu revisión sistemática.
La inteligencia artificial (IA) está transformando profundamente todos los sectores, y el ámbito bibliotecario no es la excepción. Lejos de suponer una amenaza, la IA representa una oportunidad histórica para que los profesionales de la información reforcemos nuestro papel como guías y mediadores en un entorno informativo cada vez más complejo.
Tras más de 35 años buscando información científica, nunca hemos experimentado una transformación como la que nos ofrece la inteligencia artificial. Es el momento de aprovechar esta oportunidad y ser parte del cambio
Los robots no vienen a sustituirnos. Al contrario: los bibliotecarios somos hoy más relevantes que nunca, especialmente si sabemos evolucionar junto a estas herramientas. Gracias al apoyo de esta tecnología, los bibliotecarios podemos liberar tiempo para centrarnos en tareas más creativas y estratégicas, diseñando nuevas formas de compartir conocimiento y facilitando el acceso a la información. La IA proporciona a bibliotecarios y otros profesionales de la información nuevas oportunidades para mostrar nuestras habilidades y proporcionar aún más valor a los usuarios. Para ello debemos mantenernos informados sobre las últimas herramientas de IA y dominar el arte de la ingeniería de prompts. Solo así conseguiremos posicionarnos en vanguardia de la revolución de la IA.
La IA no nos reemplaza (los bibliotecarios), nos libera para pensar.
Los bibliotecarios estamos estratégicamente posicionados para destacar en esta nueva era. Dominamos el arte del algoritmo de búsqueda, que va mucho más allá de encontrar información: implica comprender las necesidades del usuario, anticipar preguntas y guiarlo a través de un océano de datos hacia fuentes fiables, pertinentes y de calidad. Esta habilidad nos permite no solo acceder a información de manera eficiente, sino también evaluar su relevancia y credibilidad, asegurando así que los usuarios reciban respuestas de alta calidad a sus consultas. Nuestra formación nos capacita para utilizar tecnologías avanzadas y estrategias de investigación que enriquecen la experiencia de aprendizaje de nuestros usuarios. También tenemos la responsabilidad de educar al público sobre cómo interactuar de forma crítica y segura con estas herramientas emergentes.
La IA puede generar una estrategia de búsqueda, sí. Pero solo nosotros sabemos si esa estrategia tiene sentido.
Los desafíos: veracidad, alfabetización, transparencia y privacidad
Uno de los principales riesgos de los grandes modelos de lenguaje es la ilusión de veracidad. Estos sistemas pueden generar textos que suenan correctos, pero que no necesariamente lo son. La IA no entiende el significado de lo que produce: simplemente predice cuál es la palabra más probable que debe aparecer a continuación.
El uso sin crítica puede llevar a la propagación de información falsa en la investigación. Por ello, es fundamental desarrollar una alfabetización en IA que permita evaluar críticamente tanto la información que proporcionan estas herramientas.
«La inteligencia artificial no reemplaza el juicio experto; sin embargo, tiene la capacidad de potenciarlo de maneras significativas y, en algunos casos, puede distorsionarlo de formas inesperadas.»
Es imprescindible mantener principios de transparencia sobre el uso de herramientas de IA y responsabilidad en la verificación de la información generada. Debemos establecer prácticas claras para citar apropiadamente el trabajo asistido por IA y garantizar que las contribuciones humanas y artificiales sean debidamente reconocidas.
La privacidad es otra preocupación importante cuando se trata del uso de IA. Los sistemas de IA dependen de grandes cantidades de datos, datos que pueden incluir información confidencial sobre los usuarios. El uso de herramientas de IA puede exponer una biblioteca a los riesgos de ciberseguridad.
Conclusión
Los bibliotecarios no seremos sustituidos por la inteligencia artificial. Seremos reemplazados, eso sí, solo si decidimos no adaptarnos. Pero si abrazamos el cambio, nos formamos y lideramos la adopción crítica de estas herramientas, podremos consolidar nuestro papel como actores clave en la revolución del conocimiento.
Si no estamos en la conversación sobre IA, otros decidirán por nosotros. La revolución ya ha comenzado. Es momento de estar al frente.
Características de las búsquedas para revisiones sistemáticas
Las revisiones sistemáticas requieren estrategias de búsqueda rigurosas (que identifiquen todos los registros relevantes, pero no tan amplia como para que haya demasiados artículos irrelevantes), transparentes y reproducibles (documentando los pasos que se dieron durante la búsqueda) de tal forma que permita que los futuros equipos de investigación se basen en el trabajo de la revisión sistemática (RS), así como también lo evalúen, valoren y critiquen.
Las revisiones sistemáticas requieren una búsqueda sistemática. Dada la complejidad de los lenguajes y reglas de indexación de las diversas bases de datos, la mejor manera para que el equipo de investigación asegure el rigor de la búsqueda es incluir un bibliotecario en el equipo de revisión.
Retos en la búsqueda de evidencia
El primer elemento de una revisión sistemática es la propia pregunta. La pregunta determinará el desarrollo de la estrategia de búsqueda y qué tipo de estudios se encontrarán. Si la pregunta no es lo suficientemente clara en este punto, es posible que no se detecten artículos que puedan ser de interés o que se encuentren muchos artículos que no son lo que se quiere.
Traslado de la pregunta de investigación a la estrategia de búsqueda. La pregunta es el punto de partida para estructurar una estrategia de búsqueda, es la de identificar los principales conceptos de la pregunta clínica (generalmente en un formato PICO para revisiones de intervención y PEO para revisiones de factores de riesgo). Los errores más comunes para traducir una pregunta de investigación en un plan de búsqueda incluyen perder un concepto importante y agregar demasiados conceptos. (ver entrada «¿Debo incluir los Resultados (Outcomes) en la estrategia de búsqueda de una revisión sistemática?«).
Aplicar límites. de forma segura para evitar sesgos y disminución de la sensibilidad. Los límites más empleados son los límites temporal, de idiomas o de acceso al texto completo gratuito pero estos solo se deben incluir en la estrategia si está justificado metodológicamente. La mejor manera de aplicar límites es hacerlo de tal manera que la búsqueda incluya registros indexados por un límite deseado sin faltar registros que cumplan con esa misma descripción pero que no se indexan de esa manera. Esto se puede lograr mediante el uso cuidadoso del operador booleano NOT (por ejemplo, para eliminar estudios animales y quedarnos solo con estudios en humanos). Ver entrada «¿Cómo limitamos el resultado de una búsqueda bibliográfica a solo humanos?: Recomendación para búsqueda en revisiones sistemáticas«. También debemos tener presente la utilización de los llamados filtros de búsqueda (ver entrada: «Qué son los filtros de búsqueda y principales herramientas para su localización«).
Errores comunes en las estrategias de búsqueda en revisiones sistemáticas
Errores en la selección de las fuentes de búsqueda
La producción de una revisión sistemática requiere la búsqueda sistemática en varias bases de datos bibliográficas. Se desconoce el número óptimo de bases de datos que hay que consultar, sin embargo, buscar en una sola base de datos no es suficiente, aunque no existe evidencia de la cantidad de bases de datos en las que se debe buscar. Una sola base de datos no representa todas las investigaciones potencialmente relevantes que existen. Al elegir incluir solamente una base de datos, el revisor está introduciendo un sesgo de selección en esta etapa temprana del proceso de revisión. La búsqueda solo de PubMed y Embase recupera el 71.5% de las publicaciones incluidas, mientras que agregar bases de datos adicionales a las estrategias de búsqueda aumenta la recuperación al 94.2% (el 5.8% de las referencias no se recuperan en ninguna base de datos) (Frandsen TF, Moos C, Linnemann Herrera Marino CI, Brandt Eriksen M, Supplementary databases increased literature search coverage beyond PubMed and Embase, Journal of Clinical Epidemiology (2025), doi: https://doi.org/10.1016/j.jclinepi.2025.111704.). Ver entrada «En qué bases de datos debemos buscar para una revisión sistemática: La producción de una revisión sistemática requiere la búsqueda sistemática en varias bases de datos bibliográficas.»En qué bases de datos debemos buscar para una revisión sistemática: La producción de una revisión sistemática requiere la búsqueda sistemática en varias bases de datos bibliográficas» y «Cobertura y solapamiento de las bases de datos utilizadas en las revisiones sistemáticas de ciencias de la salud«).
La búsqueda ha de realizarse en bases de datos automatizadas, pero también ha de incluirse búsquedas que complementen esta, como es la búsqueda de literatura gris. Si uno realmente quiere localizar toda la evidencia que hay no puede detenerse en la búsqueda de las principales bases de datos.
Insuficiente amplitud o sensibilidad de la búsqueda
La estrategia de búsqueda ha de ser una combinación de términos del lenguaje natural (campo de título y abstract) y el vocabulario controlado de las bases de datos consultadas (Leblanc V, Hamroun A, Bentegeac R, Le Guellec B, Lenain R, Chazard E. Added Value of Medical Subject Headings Terms in Search Strategies of Systematic Reviews: Comparative Study. J Med Internet Res. 2024 Nov 19;26:e53781. doi: 10.2196/53781.).
Debemos hacer balance entre la precisión y exhaustividad pero teniendo en cuenta que el objetivo de una búsqueda para una RS es identificar todos los estudios pertinentes (maximizar la sensibilidad pero con una precisión razonable). Una de las cuestiones más complicadas es cuando dar por finalizada la búsqueda. Una de las cuestiones más complicadas es cuando dar por finalizada la búsqueda.
Representación visual de precisión y sensibilidad al realizar una búsqueda de literatura de una revisión sistemática. Modificada y traducida de: Kumar V, Barik S, Raj V, Varikasuvu SR. Precision and Sensitivity: A Surrogate for Quality of Literature Search in Systematic Reviews. Clin Spine Surg. 2025;38(1):34-6.
Salvador-Oliván y cols., encontraron que, de las estrategias de búsqueda, el 92,7% contenían algún tipo de error. Para facilitar su presentación, los errores se agruparon en 2 categorías: los que afectan al recuerdo y los que no, siendo más frecuentes los primeros (78,1%) que los segundos (59,9%). La tabla siguiente presenta la frecuencia de los distintos tipos de errores.
Errores más comunes en las búsquedas en revisiones sistemáticas. Fuente: Salvador-Oliván JA, Marco-Cuenca G, Arquero-Avilés R. Errors in search strategies used in systematic reviews and their effects on information retrieval. J Med Libr Assoc. 2019 Apr;107(2):210-221. doi: 10.5195/jmla.2019.567.
Más recientemente, Rethlefsen y cols. encontraron que el 56.0% (163/291) de todas las búsquedas de bases de datos contenía al menos un error (Rethlefsen ML, Brigham TJ, Price C, Moher D, Bouter LM, Kirkham JJ, Schroter S, Zeegers MP. Systematic review search strategies are poorly reported and not reproducible: a cross-sectional metaresearch study. J Clin Epidemiol. 2024 Feb;166:111229. doi: 10.1016/j.jclinepi.2023.111229.).
Son relativamente fácil de tener errores con palabras mal escritas (3,8%) y errores en la sintaxis del sistema que no se encuentran fácilmente mediante la revisión ortográfica.
Es frecuente cometer errores en la aplicación de operadores booleanos (por ejemplo, OR puede haber sido sustituido involuntariamente por AND (o viceversa), o AND puede haberse utilizado para vincular frases o palabras (por ejemplo, como una conjunción) en lugar de como un operador booleano) y, más a menudo, olvidar usarlos son comunes. La mayoría de las bases de datos asumirán un AND cuando falte un operador, lo que reducirá en gran medida la sensibilidad y la precisión de su búsqueda. Por otro lado, algunas plataformas de búsqueda ignora los operadores booleanos cuando se escriben en minúscula aplicando el operador AND automáticamente al ser el operador por defecto. Esto ocurre en PubMed por lo que es recomendable escribir los operadores booleanos siempre en mayúscula.
Otro error común es la falta de precisión en la combinación con los operadores booleanos de los números de línea correcta. Por eso es muy recomendable verificar cada número de línea y combinaciones de números de línea para asegurarse de que la lógica de búsqueda se implementó correctamente.
Para intentar paliar estos errores de ejecución, es recomendable revisar la búsqueda y asegurarse de que el uso del anidamiento entre paréntesis sea lógico y se haya aplicado correctamente. También hay que tener en cuenta si el uso de un operador de proximidad o adyacencia en lugar de AND podría aumentar la precisión. Si se utilizan operadores de proximidad, considere si la amplitud elegida es demasiado reducida para capturar todos los casos esperados de los términos de búsqueda, que pueden variar dependiendo de si la base de datos en la que se busca reconoce o no palabras vacías. Considere si la amplitud es demasiado extensa. Y si se incluyen límites (por ejemplo, humanos o población de ancianos), debemos asegurarnos de que se haya utilizado la construcción adecuada.
De las diferentes formas de construcción de la estrategia de búsqueda, recomiendo la búsqueda por bloques, es decir, una línea por cada concepto de búsqueda partiendo de nuestra pregunta estructurada (PICOs) para intentar minimizar los errores antes descritos. De esta forma, la búsqueda se corresponderá con el marco de nuestra pregunta del que partimos en nuestra revisión. (ver entrada «Cómo estructurar la estrategia de búsqueda para revisiones sistemáticas: tres enfoques diferentes pero complementarios»).
Los términos de texto libre se utilizan normalmente para cubrir los encabezamientos de materia que faltan en la base de datos, recuperar registros no indizados o mal indizados. Debemos considerar los elementos del uso del texto libre, como demasiado restringido o demasiado amplio, la relevancia de los términos y si se han incluido sinónimos o antónimos.
Con respecto al uso de descriptores o encabezamientos de materia, hemos de comprobar si faltan encabezamientos o si son incorrectos los que utilizamos en nuestra estrategia, analizar la relevancia/irrelevancia de los términos y el uso correcto de la búsqueda ampliada para incluir términos relevantes más específicos.
Debemos considerar que el uso de subencabezamientos flotantes que en la mayoría de los casos son preferibles al uso de subencabezamientos ligados a encabezados de materias específicas.
Adaptación entre bases de datos y plataformas
Una vez hemos realizado la búsqueda en una base de datos debemos trasladar la estrategia a la siguiente base de datos. Esto significa que el vocabulario controlado, los términos del lenguaje natural y todas las demás etiquetas y operadores de campo utilizados deben ser lo más similar posible.
Deficiencias en la documentación de las estrategias de búsqueda de evidencia
Las búsquedas de revisión sistemática deben ser reproducibles, pero la mayoría no lo son. Rethlefsen y cols. encontraron que solo el 1% de las revisiones sistemáticas eran completamente reproducibles para todas las búsquedas de bases de datos. Además, las búsquedas de revisión sistemática siguen informándose mal. La gran mayoría de las revisiones sistemáticas (91%) ni siquiera proporciona suficientes detalles para identificar las bases de datos/plataformas utilizadas para todas las búsquedas de bases de datos (Rethlefsen ML, Brigham TJ, Price C, Moher D, Bouter LM, Kirkham JJ, Schroter S, Zeegers MP. Systematic review search strategies are poorly reported and not reproducible: a cross-sectional metaresearch study. J Clin Epidemiol. 2024 Feb;166:111229. doi: 10.1016/j.jclinepi.2023.111229.).
Recomendaciones para mejorar las estrategias de búsqueda en revisiones sistemáticas
Para intentar minimizar los errores en la búsqueda en revisiones sistemáticas, es recomendable que un segundo bibliotecario haga la revisión por pares de la búsqueda utilizando la herramienta PRESS (Peer Review of Electronic Search Strategies (McGowan J, Sampson M, Salzwedel DM, Cogo E, Foerster V, Lefebvre C. PRESS Peer Review of Electronic Search Strategies: 2015 Guideline Statement. J Clin Epidemiol. 2016 Jul;75:40-6. doi: 10.1016/j.jclinepi.2016.01.021. PMID: 27005575.) justo antes de finalizar el protocolo y antes de hacer las búsquedas definitivas de la revisión.
Y por último, para la mejora de las estrategias de búsqueda y su informe transparente es necesario implicar a los bibliotecarios, los equipos de revisión sistemática, los revisores por pares y los editores de revistas.
Los bibliotecarios tenemos poco control sobre la terminación de los proyectos de revisiones sistemáticas. Sin embargo, dado que la mayor parte del trabajo del bibliotecario se realiza al comienzo del proyecto, el tiempo y esfuerzo invertido es con frecuencia el mismo, independientemente de que el proyecto de revisión consiga publicarse o sea abandonado. Esta situación plantea importantes reflexiones sobre la naturaleza de nuestro trabajo, ya que, a pesar de la falta de control en los resultados finales, nuestro papel es fundamental para la calidad de la revisión. Además, nuestra capacidad para colaborar con investigadores y académicos desde el inicio del proceso no solo mejora la metodología, sino que también contribuye a establecer estándares que pueden influir en el éxito del proyecto. Por lo tanto, aunque los resultados puedan variar, la dedicación y el esfuerzo que aportamos son de enorme valor y forman parte integral del proceso de investigación.
Por eso, es importante tener presente la siguiente lista de comprobación o checklist antes de comprometer nuestra participación del bibliotecario en una revisión sistemática:
¿Pueden los investigadores describir claramente la pregunta de investigación?
¿Han establecido los investigadores criterios de inclusión y exclusión?
¿Parece que el alcance de la pregunta de investigación es manejable (no es probable que se obtengan demasiados estudios elegibles)?
¿Parece que la pregunta de investigación merece la pena (no es probable que no haya o que haya muy pocos estudios elegibles)?
¿Se ha preparado un protocolo?
¿Conocen y planea el equipo de revisión seguir las normas de buenas prácticas?
¿Está de acuerdo el equipo revisor con un enfoque de búsqueda exhaustivo (por ejemplo, búsqueda en todas las bases de datos clave, empleo de estrategias de búsqueda relativamente amplias)?
¿El proceso de selección, extracción de datos y evaluación del riesgo de sesgo-calidad implicará la decisión de dos revisores de manera independiente?
¿Parece el proyecto de investigación manejable para el número de miembros del equipo de revisión?
¿Son realistas y viables los plazos de revisión?
Bibliografía
Campos Asensio, C. (2024). Papel estratégico del bibliotecario en las revisiones sistemáticas. CLIP De SEDIC: Revista De La Sociedad Española De Documentación E Información Científica, (90), 19–32. https://doi.org/10.47251/clip.n90.150
McKeown S, Ross-White A. Building capacity for librarian support and addressing collaboration challenges by formalizing library systematic review services. J Med Libr Assoc. 2019 Jul;107(3):411-419. doi: 10.5195/jmla.2019.443.
Las revisiones del JBI se distinguen en el componente de búsqueda por su proceso de búsqueda explícito en 3 pasos. Este enfoque metodológico asegura una revisión exhaustiva y sistemática de la evidencia relevante, mejorando la calidad y la fiabilidad de los resultados de la revisión.
Paso 1: Búsqueda exploratoria inicial
El primer paso es una búsqueda exploratoria inicial para encontrar «referencias semilla», es decir, registros de estudios que cumplan los criterios de inclusión para la pregunta de la revisión. Tras estas búsquedas exploratorias iniciales, se recogen las palabras clave del título y el resumen, junto con los términos de indización (también denominados términos MeSH en MEDLINE, Tesauro, Vocabulario controlado, descriptores o encabezamientos de materia) de las referencias semilla. Se debe consultar con el equipo de revisión para recopilar otras palabras clave y términos indexados.
En esta fase utilizaremos las siguientes herramientas:
Bases de datos, generalmente MEDLINE y CINAHL.
Herramientas adicionales como Google, Google Académico y herramientas de descubrimiento de bibliotecas (PRIMO, OneSearch, SumSearch, etc.).
Herramientas de IA generativa(p. ej.: ChatGPT). Pueden ser útiles para encontrar estas referencias iniciales. Sin embargo, en el caso de las fuentes encontradas a través de ChatGPT, es importante verificar que no sean alucinaciones.
Paso 2: Desarrollo de la estrategia de búsqueda exhaustiva
El segundo paso consiste en desarrollar una estrategia de búsqueda exhaustiva utilizando estas palabras clave recolectadas y los términos de indización en la base de datos primaria/clave definida en nuestro Protocolo de revisión.
El desarrollo de una búsqueda exhaustiva es un proceso iterativo que implica probar combinaciones de palabras clave y términos indizados y comprobar que la estrategia de búsqueda recupera las referencias iniciales.
Una vez desarrollada la estrategia de búsqueda en la base de datos primaria, se traslada a otras bases de datos.
Paso 3: Búsqueda complementaria
El tercer paso es la búsqueda complementaria en la literatura gris, la búsqueda de citas y la búsqueda manual. La Declaración TARCiS (Terminology, Application and Reporting of Citation Searching) proporciona orientación sobre cuándo y cómo realizar búsquedas de citas como técnica de búsqueda complementaria en la síntesis de la evidencia y, lo que es más importante, cómo informar de ello (Hirt et al. 2024).
Para las preguntas de revisión que son complejas, la búsqueda de citas hacia delante y hacia atrás (forward and backward citation searching) se considera obligatoria.
PubMed utiliza el Automatic Term Mapping (ATM) cuando introducimos términos en el cuadro de búsqueda. Es uno de los algoritmos aplicados a las búsquedas que compara los términos por nosotros escritos con una serie de tablas para encontrar términos relacionados y ampliar la búsqueda. Los términos no etiquetados que se introducen en el cuadro de búsqueda se cotejan (en este orden) con una tabla de traducción de Materias (incluido el MeSH o Medical Subject Headings), una tabla de traducción de Revistas, el índice de Autores y un índice de Investigadores (Colaboradores):
Si analizamos detenidamente la tabla de materias, veríamos que está formada por:
Términos MeSH
Entry Terms (See-Reference mappings) para los términos MeSH
MeSH Subheadings
Tipos de publicación
Pharmacological Actions
Supplementary Concepts (sustancias) y sus sinónimos
Tipo de publicación
Formas de palabras singulares y plurales
Ortografía británica y estadounidense
Marca comercial del medicamento la traduce al nombre genérico
Términos derivados del Unified Medical Language System (UMLS) que tienen sinónimos equivalentes o variantes léxicas en inglés
La asignación automática de términos significa que los términos de búsqueda que se introducen en la ventana de búsqueda se asignan automáticamente a términos MeSH. Sin embargo, cuando no se encuentra coincidencia dentro de la tabla de materias, el algoritmo continúa con la siguiente tabla de traducción y así sucesivamente. Si no se encuentra ninguna coincidencia, PubMed descompone la frase y repite el proceso de asignación automática de términos anterior hasta encontrar una coincidencia. Si no hay coincidencia, los términos individuales se combinarán con el operador «AND» y se buscarán así en todos los campos.
Cuando una búsqueda incluye términos que fueron etiquetados con un campo de búsqueda durante el proceso de asignación automática de términos y recupera cero resultados, el sistema activa una búsqueda posterior utilizando «Schema: all .» que modifica la búsqueda eliminando las etiquetas de campo de búsqueda añadidas automáticamente y, a continuación, busca cada término en todos los campos.
Podemos saber como ha aplicado el ATM a nuestra búsqueda entrando en el enlace «Advanced» situado debajo de la ventana de búsqueda. En la nueva página bajamos hasta ver «History and Search Details».
Veamos en el siguiente vídeo dos ejemplos:
Sin embargo, existen cuatro formas en los que se desactiva el algoritmo de búsqueda ATM. Son los siguientes:
Esta semana se está celebrando en el Hospital de Getafe la tercera edición del curso para residentes «Principios básicos en investigación clínica«. Dentro de este, el pasado martes he impartido una clase de búsqueda de información en medicina.
He comenzado con la representación del triángulo de búsqueda eficiente y efectiva cuyos vértices están formados por los objetivos («Why am I searching?»), la heurística («How am I searching?») y los sistemas («What am I searching with?»).
Triángulo de búsqueda eficiente y efectiva de la información
Objetivos («Why am I searching?»)
Cuáles son nuestros objetivos de la búsqueda, es decir, qué quiero saber o encontrar, determina cómo he de buscar. Podemos encontrarnos dentro de tres escenarios posibles:
Búsqueda clínica: identificación rápida y eficiente para una toma de decisiones.
Búsqueda exploratoria o búsqueda general de descubrimiento, aprendizaje, mantenerse actualizado, … aprender/aclarar uno o varios conceptos o conjuntos de investigaciones, incluidas sus características.
Búsqueda sistemática: identificar todos los estudios disponibles sobre un tema.
Tipos de búsqueda de información en medicina según la necesidad.
Heurística («How am I searching?»)
¿Qué heurísticas (forma de hacer la búsqueda) funcionan mejor para el tipo de búsqueda en cuestión y están disponibles en los sistemas elegidos?:
Búsqueda simple mediante el algoritmo de la fuente (PubMed, UpToDate, Google Académico, …): en búsquedas para toma de decisiones clínicas.
Snowballing (citation chasing): en búsquedas exploratorias y tb en sistemáticas.
Búsqueda booleana en bloques: en búsquedas sistemáticas.
Tipología de búsquedas.
Sistemas («What am I searching with?»)
¿Qué sistema/s de búsqueda funcionan mejor para un tipo de búsqueda determinado y son compatibles con la heurística elegida?. Tenemos que entender que no hay 2 sistemas de búsquedas iguales y cada sistema es más o menos adecuado para un tipo de búsqueda (clínica/exploratoria/sistemática) en términos de cobertura y heurística que permite/soporta.
Dependiendo de nuestros objetivos y heurística, debemos elegir el sistema que nos va a proporcionar la información de manera eficiente y efectiva. Eso implica que no siempre el sistema más sencillo es el más apropiado para nuestro tipo de búsqueda.
Búsqueda con herramientas sencillas no es la panacea.
Una vez aclarados los conceptos anteriores, debemos tener en cuenta y seguir una serie de pasos de la búsqueda:
Pasos que debemos tener en cuenta a la hora de buscar información en bases de datos.
Por último, repasamos algunas herramientas de IA interesantes para los residentes. Vimos vídeos con ejemplos de las siguientes 7 herramientas, pero podrían haber sido muchas más:
Herramientas de inteligencia artificial útiles.
Y terminé dando un último consejo: «practicar con las herramientas de búsqueda en su día a día es la mejor garantía de mejorar sus búsquedas de información«.
Releía ayer el artículo Easy ≠ Right (1) con estupendas reflexiones de la bibliotecaria Melissa L. Rethlefsen, autora principal de las directrices PRISMA-S, que en 2008 nos advertía que «no hay soluciones únicas para una investigación de calidad» y que a «la hora de buscar información, ¿Qué es lo correcto y qué lo fácil?
El desarrollo de estrategias de búsqueda sólidas para buscar en la literatura e identificar estudios es un paso crucial en la metodología de síntesis de la evidencia. Sin embargo, su complejidad hizo aparecer herramientas que facilitaban la localización de evidencia de alta calidad (2). En la década de los 90, la búsqueda federada, también conocida como metabúsqueda o búsqueda cruzada en bases de datos, permitía la práctica de utilizar una interfaz para buscar en múltiples fuentes de una sola vez. Fue anunciada como la próxima novedad en búsquedas.
Rethlefsen afirmaba que encontrar la mejor información o la más completa sobre un tema requiere más esfuerzo que buscar introduciendo una o dos palabras clave en una caja de búsqueda. Y he reflexionado sobre la búsqueda con inteligencia artificial de la que hoy en día tanto interés nos despierta. Por el momento podemos seguir afirmando lo mismo que la autora nos decía hablando de Google, pero el futuro nos dirá la última palabra.
Por último, estos avances en los «sistemas de búsqueda» no permiten la transparencia o la reproducibilidad de la metodología de búsqueda (3). Esto ha sido, hasta la fecha, una de las claves para las revisiones sistemáticas de calidad y libre de sesgos (4).
Solomons T, Hinton E. Federated searches: why a one-stop shop approach to literature searching falls short for evidence synthesis. JBI Evidence Synthesis 19(6):p 1259-1262, June 2021. | DOI: 10.11124/JBIES-21-00177
Rethlefsen ML, Kirtley S, Waffenschmidt S, Ayala AP, Moher D, Page MJ, et al. PRISMA-S: an extension to the PRISMA Statement for Reporting Literature Searches in Systematic Reviews. Syst Rev 2021;10 (1):39.
Why Does the Reproducibility of Search Strategies and Search Results in Systematic Reviews Reduce Over Time? What We Can Do About It? by @FarhadShokrane Disponible en: https://link.medium.com/jezQLPFeyFb