La etapa de extracción de datos consiste en obtener, de forma estructurada y rigurosa, la información relevante de los estudios primarios para responder adecuadamente a la pregunta de investigación; es un proceso crítico que no solo asegura la integridad de los hallazgos, sino que también permite una comparación efectiva entre diferentes investigaciones. Dicha información suele proceder de artículos científicos revisados por pares, pero también puede encontrarse en informes regulatorios, protocolos, registros de ensayos, comunicaciones con autores o informes no publicados, cada uno de los cuales aporta un ángulo particular que enriquece la base de datos general. En las revisiones sistemáticas, la unidad de análisis es el estudio, no el informe, lo que significa que es necesario considerar el contexto completo de cada investigación. Por ello, es fundamental identificar y vincular múltiples informes que correspondan a un mismo estudio antes o después de la extracción de datos; este proceso permite evitar la duplicación de información y asegura que se capturen todos los resultados relevantes. Todos estos aspectos se desarrollan en detalle en el Capítulo 5 del Cochrane Handbook for Systematic Reviews of Interventions (1), un recurso clave que proporciona directrices actualizadas sobre cómo llevar a cabo una extracción de datos rigurosa, transparente y reproducible, así como ejemplos prácticos que pueden ayudar a los investigadores a implementar estos procedimientos de manera efectiva en sus propias revisiones sistemáticas.
En dos entradas anteriores de BiblioGetafe, «Evitar sesgos en la búsqueda bibliográfica: claves para revisiones rigurosas» (1) y «Selección de estudios sin sesgos en revisiones sistemáticas: 6 principios y 4 consejos» (2), analizamos los sesgos en las etapas de búsqueda bibliográfica y selección de estudios. En esta entrada, revisamos los errores más frecuentes que pueden surgir en la extracción de datos, su impacto sobre los resultados de la revisión y las mejores prácticas para minimizarlos y garantizar la fiabilidad del proceso. Estos errores pueden incluir desde la mala interpretación de las fuentes de datos hasta la manipulación incorrecta de los mismos, lo que puede llevar a conclusiones erróneas y, en última instancia, a decisiones inadecuadas. Para abordar estos desafíos, es fundamental identificar las causas de los errores y aplicar estrategias efectivas, como la implementación de controles de calidad rigurosos, la capacitación adecuada del personal involucrado y el uso de herramientas de software avanzadas que faciliten una extracción de datos más precisa y eficiente. De este modo, se puede mejorar significativamente la integridad y la validez de los resultados obtenidos, contribuyendo a un proceso de análisis más robusto y confiable.

Errores frecuentes
La extracción de datos no está libre de riesgos. Estos pueden deberse a:
- Mala interpretación de los datos presentados en los estudios.
- Omisión de variables relevantes.
- Errores en la recogida de datos clave como el número de participantes, medias, desviaciones estándar o tamaños del efecto (3-5).
Una revisión metodológica identificó tasas de error en la extracción de datos que oscilan entre el 8% y el 70%, dependiendo del tipo de desenlace y del diseño de la revisión (5). Afortunadamente, la mayoría de los estudios concluyen que estos errores suelen tener un impacto bajo o moderado en los resultados globales de la revisión (5-6).
¿Cómo reducir los errores?
Existen varias estrategias recomendadas:
- Uso de formularios estructurados: ayudan a definir de forma clara qué datos deben extraerse y cómo codificarlos. Los autores de revisiones suelen tener distintos perfiles profesionales y niveles de experiencia en revisiones sistemáticas. El uso de un formulario de extracción de datos contribuye a garantizar cierta consistencia en el proceso de recogida de información y resulta imprescindible para comparar los datos extraídos por duplicado. Es recomendable realizar una prueba piloto de los formularios mediante una muestra representativa de los estudios que se van a revisar, comparando extracciones independientes de varios revisores sobre un pequeño número de estudios (3). Como mínimo, el formulario de extracción de datos (o una versión muy similar) debe haber sido evaluado en cuanto a su usabilidad.
- Doble extracción de datos: Es importante proporcionar instrucciones detalladas a todos los revisores que utilizarán el formulario de obtención de datos. Al menos dos personas deben extraer de forma independiente la información para disminuir los errores y reducir los sesgos potenciales. La duplicación es especialmente importante para los datos de desenlaces, ya que estos alimentan directamente la síntesis de la evidencia y, en consecuencia, las conclusiones de la revisión. En caso de desacuerdo, el equipo ha de discutir la información extraída de cada uno de los artículos hasta llegar al acuerdo. Duplicar el proceso de extracción de datos reduce tanto el riesgo de cometer errores como la posibilidad de que la selección de datos se vea influida por los sesgos de una sola persona. Se ha demostrado que realizar la extracción de forma independiente por dos revisores reduce significativamente los errores, frente a la extracción por un único revisor con o sin verificación posterior (5). Si no es posible el doble proceso, al menos debería realizarse una verificación independiente de los datos extraídos, ya sea sobre una muestra o sobre todos los estudios incluidos.
- Mayor rigor en datos sensibles: se aconseja prestar especial atención a la información que requiere interpretación subjetiva y a los datos críticos para la síntesis, como los resultados principales. En estos casos, se justifica un proceso de extracción más exhaustivo (3).
Tabla resumen de las estrategias para reducir errores en la extracción de datos
| Estrategia | Descripción | Mejora | Referencia |
| Uso de formulario estructurado | Define claramente qué datos extraer y cómo codificarlos | Mejora la consistencia y precisión | Li et al., 2024 |
| Pilotaje del formulario | Prueba piloto previa con varios revisores sobre algunos estudios | Identifica instrucciones ambiguas o errores | Li et al., 2024 |
| Doble extracción independiente | Dos revisores extraen datos por separado | Reduce significativamente los errores y sesgos | Mathes et al., 2017 |
| Verificación por segundo revisor (si no hay doble) | Revisión de una muestra o del total por otro revisor | Detecta errores no evidentes | Mathes et al., 2017 |
| Rigor adicional para datos clave o subjetivos | Más control en la extracción de resultados primarios o interpretativos | Mayor validez en la síntesis final | Li et al., 2024 |
BIBLIOGRAFÍA
- Campos-Asensio C. Evitar sesgos en la búsqueda bibliográfica: claves para revisiones rigurosas. 2025. Available from: https://bibliogetafe.com/2025/06/23/evitar-sesgos-en-la-busqueda-bibliografica-claves-para-revisiones-rigurosas/ [Last accessed: 6/30/2025].
- Campos-Asensio C. Selección de estudios sin sesgos en revisiones sistemáticas: 6 principios y 4 consejos. 2025. Available from: https://bibliogetafe.com/2025/06/24/riesgos-y-soluciones-para-una-seleccion-de-estudios-sin-sesgos-en-revisiones-sistematicas/ [Last accessed: 6/30/2025].
- Li T, Higgins JPT, Deeks JJ. Chapter 5: Collecting data [last updated October 2019]. In: Higgins JPT, Thomas J, Chandler J, Cumpston M, Li T, Page MJ, Welch VA (editors). Cochrane Handbook for Systematic Reviews of Interventions version 6.5. Cochrane, 2024. Available from cochrane.org/handbook.
- Gøtzsche PC, Hróbjartsson A, Marić K, Tendal B. Data extraction errors in meta-analyses that use standardized mean differences. JAMA. 2007;298(4):430–7.
- Mathes T, Klaßen P, Pieper D. Frequency of data extraction errors and methods to increase data extraction quality: a methodological review. BMC Med Res Methodol. 2017;17(1):152.
- Buscemi N, Hartling L, Vandermeer B, Tjosvold L, Klassen TP. Single data extraction generated more errors than double data extraction in systematic reviews. J Clin Epidemiol. 2006;59(7):697–703.
