Literatura gris en revisiones sistemáticas: por qué no deberíamos pasarla por alto

Cuando hablamos de revisiones sistemáticas, solemos pensar en búsquedas en múltiples bases de datos bibliográficas con estrategias booleanas extensas y complejas. Pero tenemos que recordar que una parte de la evidencia relevante no siempre llega a las revistas científicas o no lo hace con la misma rapidez ni visibilidad. Ahí es donde entra la literatura gris. Tesis, informes técnicos, registros de ensayos, resúmenes de congresos o documentos regulatorios pueden aportar información valiosa para reducir sesgos, completar el mapa de la evidencia y mejorar la transparencia del proceso de revisión. Buscarla no siempre es sencillo, pero ignorarla sin justificación puede debilitar una síntesis.

Empecemos por lo básico: qué entendemos por literatura gris

La literatura gris suele definirse como aquella producción científica o técnica generada por instituciones académicas, administraciones, organismos, empresas o industrias que no está controlada por los circuitos editoriales comerciales habituales (1). Una de las características que mejor define a la literatura gris es, precisamente, su dificultad de localización. En primer lugar porque queda fuera de los circuitos convencionales de indexación, búsqueda y difusión científica. Además, a menudo está dispersa, mal descrita, alojada en plataformas heterogéneas o en sitios web poco estables, lo que obliga a diseñar estrategias de búsqueda más abiertas, más manuales y mejor documentadas.

¿Y qué entra dentro de este grupo? Tenemos, entre otros, las tesis doctorales, los informes técnicos, la documentación de agencias reguladoras, las actas o resúmenes de congresos, los registros de ensayos clínicos y los preprints.

Resulta llamativo que, pese a la importancia metodológica de rastrear literatura gris, algunos manuscritos de revisiones sistemáticas sigan indicando como motivo de exclusión que un estudio no haya sido publicado en una revista con revisión por pares, como si el canal de publicación pudiera sustituir por sí mismo la valoración crítica de su relevancia y su calidad metodológica.

Por qué importa en una revisión sistemática

La principal razón para buscar literatura gris es metodológica. Su inclusión puede ayudar a reducir el sesgo de publicación, es decir, la tendencia a que los estudios con resultados positivos o estadísticamente significativos tengan más probabilidades de publicarse en revistas que aquellos con resultados nulos o negativos (1).

Esto tiene consecuencias directas en la síntesis de la evidencia. Si una revisión incorpora solo estudios publicados en revistas, puede ofrecer una imagen incompleta o sesgada del efecto real de una intervención; dejar fuera determinadas fuentes puede afectar a la estimación final (2). Un ejemplo es el que Man-Son-Hing y cols. encontraron del uso de la quinina para calambres nocturnos: los ensayos publicados reportaron estimaciones de eficacia aproximadamente un 50% mayores que los documentos de la FDA (3). En otro caso, varias revisiones sistemáticas de estudios publicados informaron que la agomelatina era un tratamiento eficaz para la depresión, pero no se demostró ningún efecto del tratamiento cuando se incluyeron siete estudios no publicados. Otros ejemplos de sesgo de publicación incluyen oseltamivir para la influenza en adultos, estatinas para la prevención de eventos tromboembólicos venosos y reboxetina para la depresión (4).

Además, también es especialmente útil para identificar datos de seguridad y eventos adversos que en ocasiones quedan menos desarrollados en los artículos de revista y solo se encuentra en documentos no publicados o regulatorios (5).

Y por último, otra razón importante es que permite detectar estudios en curso o nunca publicados.

Motivo	Explicación
Reducir el sesgo de publicación	– Evitar o minimizar el sesgo de publicación; – Contrarrestar visiones incompletas de la evidencia (p. ej., salud cerebral, deterioro de la función renal); – Abordar el efecto cajón (file drawer effect), en el que los resultados negativos permanecen sin publicar.
Mejorar la exhaustividad	– Garantizar la recuperación de todos los estudios elegibles, incluidos los no publicados y no indexados; – Incrementar la generalizabilidad, la exhaustividad y el tamaño muestral; – Integrar fuentes publicadas y no publicadas para construir una base de evidencia más completa.
Acceso a estudios no publicados o en curso	– Identificar tesis doctorales, disertaciones, informes técnicos, informes gubernamentales y actas de congresos; – Localizar ensayos no publicados o en curso mediante registros; – Localizar investigación temprana o en desarrollo aún no publicada en revistas revisadas por pares.
Evidencia del mundo real y específica del contexto	– Incluir evidencia procedente de la práctica clínica habitual (p. ej., efectividad vacunal postcomercialización, experiencias en fisioterapia, teletrabajo durante la COVID-19); – Incorporar perspectivas diversas más allá de los ensayos clínicos, incluyendo enfoques organizativos y gubernamentales; – Identificar marcos, modelos y lagunas en políticas nacionales (p. ej., entorno escolar canadiense, teoría del confort de Kolcaba).
Ampliación del alcance y mapeo conceptual	– Mapear de forma completa modelos conceptuales, marcos y estrategias; – Aportar complejidad situacional y diversidad de perspectivas (p. ej., revisiones de alcance con enfoque iterativo); – Captar definiciones y estrategias que no siempre son visibles en la literatura revisada por pares.

Modificada y traducida de: Khalil H., Johns-Hayden A., Kynoch K. Guidance to including grey literature in systematic reviews-recommendations from an epidemiological study. Journal of Clinical Epidemiology. 2026:112222, doi: 10.1016/j.jclinepi.2026.112222.

Cuándo puede ser especialmente relevante

En áreas con fuerte presencia de la industria, como ensayos con fármacos o dispositivos, porque los intereses comerciales pueden influir en qué resultados llegan a publicarse y cuáles no. También en tecnologías sanitarias emergentes, donde la evidencia puede aparecer antes en informes técnicos, documentos de agencias o preprints que en revistas indexadas.

Resulta igualmente relevante en revisiones sobre políticas públicas, programas o implementación, donde parte de la información útil procede de organismos oficiales, instituciones o documentos técnicos. Y en temas con escasa literatura publicada, los resúmenes de congresos, tesis y otras fuentes no convencionales pueden aportar estudios o datos que ayuden a completar el panorama.

Qué fuentes conviene tener en cuenta

Entre las fuentes más relevantes en salud destacan los registros de ensayos clínicos, como ClinicalTrials.gov o la plataforma de registros de la OMS, útiles para localizar estudios terminados no publicados y, a veces, resultados disponibles directamente en el registro.

También son importantes las tesis y disertaciones, que pueden contener información más extensa que la finalmente publicada en artículos; los resúmenes y actas de congresos, especialmente valiosos en áreas muy dinámicas, aunque con limitaciones por la brevedad de la información; los informes técnicos e institucionales, incluidas evaluaciones de tecnologías sanitarias y documentos regulatorios; y los repositorios de preprints, cada vez más relevantes en determinadas áreas. A esto se suman motores y directorios como Google Scholar, BASE, OpenDOAR, ROAR o recursos especializados de literatura gris, aunque con diferentes prestaciones, coberturas y limitaciones (6).

Tipos de fuentes de literatura gris útiles para revisiones sistemáticas. (Nota: OpenGrey fue discontinuado en 2020 y hoy permanece como archivo).

Categoría	Recomendaciones
Fuentes principales a considerar siempre	– Google Scholar: amplia cobertura de literatura académica y gris, pero requiere un cribado cuidadoso debido a su baja precisión; – ProQuest: especialmente útil para tesis y disertaciones; – ClinicalTrials.gov: esencial para identificar datos de ensayos clínicos no publicados; – OpenGrey: específicamente dedicado a literatura gris (aunque actualmente archivado, sigue siendo útil a través de repositorios).
Fuentes complementarias según el tema de la revisión	– Los sitios web de organizaciones y la consulta a expertos son especialmente importantes en áreas con fuerte componente de políticas o práctica (p. ej., salud pública, educación, servicios sociales); – La búsqueda manual de actas de congresos, sitios web institucionales y materiales no indexados sigue siendo crucial cuando se espera que estas fuentes aporten evidencia relevante.
Bases de datos bibliográficas especializadas	– Scopus, PsycINFO y Web of Science pueden recuperar fuentes “semigrises” (por ejemplo, resúmenes de congresos y actas) y deben considerarse cuando sean pertinentes para la revisión.
Motores de búsqueda web generales	– Google (búsqueda general) puede recuperar documentos únicos de carácter institucional o local, pero no debe utilizarse como única estrategia; – Se recomienda el uso de búsquedas estructuradas y el registro de URL y fechas para garantizar la reproducibilidad.

Recomendaciones para la selección de bases de datos para literatura gris. Modificada y traducida de: Khalil H., Johns-Hayden A., Kynoch K. Guidance to including grey literature in systematic reviews-recommendations from an epidemiological study. Journal of Clinical Epidemiology. 2026:112222, doi: 10.1016/j.jclinepi.2026.112222.

La evidencia disponible muestra que herramientas como Google Scholar son útiles para recuperar literatura gris, pero no deben utilizarse como única fuente, ya que pueden omitir estudios relevantes y presentan limitaciones de precisión y transparencia (7).

Dificultades metodológicas de la búsqueda de literatura gris

Buscar literatura gris es posible y muchas veces necesario, pero rara vez es tan limpio, estandarizado o replicable como buscar en una base de datos bibliográfica tradicional.

No existe un único estándar de referencia y muchas de estas fuentes carecen de lenguaje controlado, interfaces potentes o posibilidades de exportación comparables a las de bases como MEDLINE o Embase. Esto obliga a trabajar más con términos en lenguaje natural, incrementa el ruido en la recuperación y dificulta tanto la reproducibilidad como la documentación. Además, muchos contenidos web cambian, desaparecen o se actualizan sin dejar rastro claro, lo que complica la trazabilidad. En algunos entornos, como Google Scholar, la falta de transparencia en el algoritmo de ordenación añade una dificultad extra (7).

Errores frecuentes

Uno de los errores más habituales es declarar de forma genérica que se buscó “en Google” o “en literatura gris” sin especificar qué fuentes concretas se consultaron, con qué estrategia, en qué fecha y con qué límites. Otro error frecuente es asumir que la literatura gris tiene menor calidad por definición. Su calidad metodológica debe valorarse con los mismos principios y, cuando proceda, con herramientas específicas que cualquier otro estudio o documento.

También es problemático no conservar evidencia documental de determinadas búsquedas o no registrar metadatos básicos como la URL, la fecha de consulta o la estrategia utilizada. En fuentes inestables, esto puede dificultar comprobaciones posteriores.

Cómo plantear una búsqueda de literatura gris

La búsqueda de literatura gris debe planificarse desde el protocolo, no añadirse al final como un gesto de exhaustividad formal. Conviene decidir desde el principio qué tipos de fuentes son pertinentes para la pregunta de investigación, cuáles son asumibles en términos de tiempo y recursos y cómo se va a documentar el proceso.

Esto implica seleccionar de forma justificada las fuentes, adaptar la estrategia a cada interfaz, registrar fechas, URLs, términos utilizados y límites aplicados, y seguir marcos de transparencia como PRISMA-S (8). También puede incluir el contacto con autores cuando se sospecha la existencia de estudios no publicados o información complementaria relevante.

En motores como Google Scholar, además, es importante asumir desde el principio que la búsqueda tiene limitaciones técnicas y que el procedimiento debe quedar claramente descrito.

Conviene identificar y mantener claramente separados los datos procedentes de literatura gris y los de estudios publicados en revistas por razones de transparencia metodológica. Esta distinción permite saber qué parte de la evidencia procede de circuitos editoriales convencionales y cuál se ha recuperado a través de registros, informes, tesis, resúmenes de congresos u otras fuentes no comerciales, facilitando la trazabilidad del proceso y la interpretación de los resultados. Además, separar ambas procedencias hace posible realizar análisis de sensibilidad y valorar hasta qué punto la inclusión de literatura gris modifica las estimaciones del efecto, los datos de seguridad o las conclusiones de la revisión.

Conclusión

La literatura gris no es un añadido accesorio ni una garantía automática de calidad. Es, sobre todo, una fuente potencialmente útil para mejorar la exhaustividad, reducir determinados sesgos y captar evidencia que no siempre circula por las vías editoriales habituales. Su búsqueda plantea dificultades y no siempre deberá hacerse con la misma exhaustividad en todas las revisiones. Pero prescindir de ella sin una justificación razonada puede dejar fuera una parte relevante de la evidencia y debilitar la solidez de la síntesis final.

BIBLIOGRAFÍA

Hopewell S, McDonald S, Clarke MJ, Egger M. Grey literature in meta-analyses of randomized trials of health care interventions. Cochrane Database Syst Rev. 2007;(2):MR000010.
McAuley L, Pham B, Tugwell P, Moher D. Does the inclusion of grey literature influence estimates of intervention effectiveness reported in meta-analyses? Lancet. 2000;356(9237):1228-31. doi:10.1016/S0140-6736(00)02786-0.
Man-Son-Hing M, Wells G, Lau A. Quinine for nocturnal leg cramps: a meta-analysis including unpublished data. J Gen Intern Med. 1998;13(9):600-6. doi: 10.1046/j.1525-1497.1998.00182.x.
Ziai H., Zhang R., Chan A-W., Persaud N. Search for unpublished data by systematic reviewers: an audit. BMJ Open. 2017;7(10):e017737, doi: 10.1136/bmjopen-2017-017737.
Golder S, Loke YK, Wright K, Norman G. Reporting of adverse events in published and unpublished studies of health care interventions: a systematic review. PLoS Med. 2016;13(9):e1002127. doi:10.1371/journal.pmed.1002127.
Khalil H, Johns-Hayden A, Kynoch K. Guidance to including grey literature in systematic reviews: recommendations from an epidemiological study. J Clin Epidemiol. 2026:112222, doi: 10.1016/j.jclinepi.2026.112222.
Haddaway NR, Collins AM, Coughlin D, Kirk S. The Role of Google Scholar in Evidence Reviews and Its Applicability to Grey Literature Searching. PLoS One. 2015;10(9):e0138237. doi: 10.1371/journal.pone.0138237.
Rethlefsen ML, Kirtley S, Waffenschmidt S, Ayala AP, Moher D, Page MJ, et al. PRISMA-S: an extension to the PRISMA Statement for Reporting Literature Searches in Systematic Reviews. J Med Libr Assoc. 2021;109(2):174-200.