05 Mar ¿Qué es el entrenamiento (práctica) basado en la evidencia?
Desde IEG presentamos la traducción de un artículo reciente de Michael Rosenblat, donde se expone de manera sencilla y clara, a qué deberíamos referirnos al hablar de “práctica basada en la evidencia”.
INTRODUCCIÓN
La práctica basada en la evidencia (EBP de Evidence-based practice) es el método que permite incorporar la mejor evidencia disponible para apoyar una intervención (ejercicio, nutricional, equipamiento, etc). Consiste en utilizar
la literatura científica así como la experiencia obtenida en la clínica o en el campo. Sin embargo, esto no sugiere que debamos incorporar la literatura ciegamente. Debemos analizar la literatura de manera crítica evaluando su validez interna y externa.
La validez interna refleja la calidad del diseño del estudio, implementación y análisis de los datos con el objetivo de minimizar el nivel de sesgo y determinar una verdadera relación “causa y efecto” entre una intervención y un resultado (1). La validez externa describe las circunstancias bajo las cuales es posible generalizar los resultados de la investigación.
NIVELES DE EVIDENCIA
Nivel 1: Revisiones sistemáticas de ensayos controlados y aleatorizados
Nivel 2: Ensayos controlados y aleatorizados
Nivel 3: Estudios de casos y controles
Nivel 4: Series de casos, informes de casos.
Nivel 5: Editoriales, opinión de expertos.
METODOLOGÍA DE ESTUDIO
Es importante tener en cuenta que la mayoría de las secciones que enumeramos a continuación están presentes
en la Escala PEDro. Existen secciones adicionales descritas mas abajo que pueden agregar calidad a una apreciación crítica. De ninguna manera la lista está completa debido a que cuando se analiza la literatura críticamente, existen
muchos factores para considerar.
Revisión de la literatura
Una adecuada revisión de la literatura brinda un panorama completo del tema en la introducción. Debe incluir investigaciones previas realizadas sobre el tema y el motivo por el cual se realiza el estudio actual.
Selección de participantes
Los participantes que se incluyen en un estudio se consideran una muestra de la población de interés. Pueden
utilizarse dos formas de muestreo para seleccionar a los participantes; el muestreo probabilístico y muestreo no probabilístico (2). El tipo de muestreo puede influir en las características de la muestra que, a su vez, puede influir
en la posibilidad de generalización y en la validez externa (2).
Criterio de elegibilidad
Es una lista de condiciones que se utiliza para establecer quienes son elegibles para participar en el estudio (6). Esto afecta la validez externa, pero no la validez interna o estadística (6). Mientras mayor sea la homogeneidad de la muestra en función del criterio de inclusión/exclusión, menor será la validez externa (6).
Tamaño de la muestra
Es el número de sujetos de una población dada que participan en el estudio. Los tamaños de muestra más grandes
tienden a ser más representativos de la población.
Aleatorización
Los participantes son asignados al azar a uno de dos o más intervenciones. La aleatorización minimiza el riesgo
de variables de confusión, reduce el riesgo de sesgo y permite el análisis de relaciones directas. Una limitación importante del uso de pruebas controladas aleatorias (RCT) es que es imposible de obtener una verdadera muestra aleatoria de la población (2). Esto puede dificultar la generalización de los resultados.
Ocultamiento de la asignación
La persona responsable de determinar si un sujeto era elegible para ser incluído en una prueba desconoce
a cual grupo será asignado el sujeto (6). Si la asignación no es oculta, la decisión sobre si incluir o no a una persona en una prueba podría estar influenciada por el conocimiento de si el sujeto debe recibir el tratamiento o no. Esto
podría producir sesgos sistemáticos diferentes a los de la asignación aleatoria (6).
Cegamiento
Esto es un método que evita que los participantes y quienes recolectan y analizan los datos del estudio sepan
quiénes integran el grupo de intervención y quiénes integran el grupo control (1). Cuando los sujetos no conocen bajo cual tratamiento están, es menos probable que los resultados del tratamiento se deban a un efecto placebo (6). El cegamiento de los asesores asegura que el sesgo personal no afecte los resultados (6).
Posibilidad de comparar los valores al inicio del estudio (línea de base)
La comparación en la línea de base consiste en la comparación de los valores de grupos (intervención y control)
al inicio del estudio. No debe existir ninguna diferencia estadísticamente significativa entre los grupos. Una aleatorización adecuada debe asegurar que los grupos sean similares en la línea de base. Esto puede aportar una indicación de sesgo potencial que se produce por casualidad con la asignación aleatoria (6). Una diferencia significativa entre los grupos puede indicar un problema con los procedimientos de aleatorización (6).
Variables (Parámetros)
La medición de las variables es el método utilizado para evaluar el efecto de la intervención. El propósito de la
medición de variables es diferenciar entre los sujetos en un momento dado, predecir un evento o resultado subsecuente y evaluar el cambio a lo largo del tiempo.
Variables de medición estandarizadas:
1. Tener instrucciones explícitas de administración, puntajes e interpretación de los resultados.
2. Están validadas en la medida que la información concerniente a sus propiedades de medición haya sido estimada,
informada y defendida en la literatura que ha sido revisada por pares.
3. Las variables de medición son válidas, confiables, sensibles y específicas.
Mediciones de validez
1. La variable de medición mide lo que se piensa que mide (validez aparente).
2. La variable de medición es apropiada para la población de interés (validez de contenido).
3. Las variables de medición proporcionan resultados que son consistentes con la metodología estándar o gold standard (validez de criterio).
Mediciones de confiabilidad
1. Las múltiples mediciones en un individuo proporcionarán resultados consistentes (test-re-test/confiabilidad absoluta), entre supervisores (confiabilidad inter-operador) y en un mismo supervisor (confiabilidad intra-operador)
2. La variable de medición puede determinar el grado en que existe la condición (confiabilidad relativa)
La sensibilidad es la capacidad de una prueba de detectar la presencia de una condición de manera confiable
(3). Por consiguiente, si la prueba es negativa, el sujeto no tiene la condición (verdadero positivo/total los resultados positivos; SNOUT= SeNsitivity-rule out).
La especificidad es la capacidad de una prueba para detectar la ausencia de una condición de manea confiable (3).
Por consiguiente, si la prueba es positiva, el sujeto tiene la condición (verdaderos negativos/total de resultados negativos; SPIN=SPecificity-rule in).
Intervención
La intervención debe ser descrita de forma tal que pueda ser reproducida. Una descripción inadecuada
disminuye la validez interna porque no queda claro cual es el mecanismo exacto que provocó el cambio en los resultados.
Seguimiento adecuado
El número de sujetos que completaron la prueba y aportaron los datos de seguimiento para el análisis estadístico debe ser suficiente. El grupo PEDro establece que los datos provenientes de un mínimo de 85% de sujetos aumenta la validez interna (6). Es importante que las mediciones de las variables se realicen en todos los sujetos asignados
al azar en los diferentes grupos. Los sujetos que no pueden ser seguidos pueden diferir sistemáticamente de los que sí fueron seguidos, y esto introduce potencialmente un sesgo. La magnitud del sesgo potencial aumenta en proporción a los sujetos que no pueden ser seguidos (6).
Análisis de intención de tratar
Ésta es una estrategia que asegura que sean analizados todos los pacientes asignados ya sea al grupo que
recibió un tratamiento o al grupo control, hayan recibido o no el tratamiento prescrito y hayan completado o no el estudio (1). Cuando se excluyen pacientes del análisis, se destruye la razón principal de la aleatorización, lo que
conduce a sesgo potencial (6).
Comparaciones entre-grupos
Esta comparación es una comparación estadística de un grupo con otro. Se realiza para determinar si la
diferencia entre los grupos es mayor a la que puede ser atribuida al azar (6).
Estimaciones puntuales (tamaño de efecto) y variabilidad
Una estimación puntual o tamaño de efecto es un valor que representa la estimación más probable de la verdadera
población (4). Algunos ejemplos incluyen la diferencia entre medias, el coeficiente de regresión, la d de Cohen y el coeficiente de correlación.
Es importante considerar la variabilidad del tamaño del efecto (estimación puntual). Algunos ejemplos de variabilidad incluyen: Desviación estándar, error estándar y los intervalos de valores. La desviación estándar (SD) es una estimación del grado de dispersión (variabilidad) de los puntos correspondientes a datos de los individuos de la muestra con respecto a la media muestral (3). El error estándar (SEM) es la desviación estándar de los estadísticos de la prueba (estimación puntual) obtenidos a partir de todas las muestras obtenidas al azar de la población (3). Se usa como cuantificación de la variabilidad de los valores medios que se calculan para construir los intervalos de confianza. Debido a que la desviación estándar siempre es mayor que el error estándar, los autores a veces presentan los datos en forma de “Media±SEM” en lugar de “Media±SD”. Esto subestima la verdadera variabilidad
y puede confundir al lector.
Es frecuente presentar la variabilidad en forma de intervalo de confianza (CI). Un intervalo de confianza es el intervalo de valores que abarca la población, con una probabilidad dada (4). El ancho del CI depende del SEM y del grado de confianza que nosotros escogemos arbitrariamente (normalmente 90%, 95%, o 99%). Utilizando un CI de 95% nosotros estamos 95% seguros que la verdadera media de la población se ubicará en el rango de valores dentro del intervalo. Si un CI de 95% incluye un cero, indicaría que existe la posibilidad que el cambio medio de una intervención en una población dada sea cero. Por consiguiente, el resultado no será estadísticamente significativo.
Limitaciones del estudio
Una descripción de las limitaciones del diseño y metodología del estudio aporta transparencia porque debe describir los potenciales sesgos. Esto incluye una explicación de los posibles errores en la validez interna y externa.
REFERENCIA
- Akobeng A. Understanding randomized controlled trials. Arch Dis Child 2005;90:840-844.
2. Carter R, Lubinsky J, Domholdt E. Rehabilitation Research. 4th ed. 2010. Elsvier; St. Louis, Missouri.
3. Gaddis G, Gaddis M. Introduction to biostatistics: part 3, sensitivity, specificity, predictive value, and hypothesis testing. Ann Emerg Med 1990;19:145-151.
4. Nakagawa S, Cuthill I. Effect size, confidence interval and statistical significance: a practical guide for biologists. Biol Rev 2007;82(4):591-605.
5. Pannucci C, Wilkins E. Identifying and avoiding bias in research. Plast Reconstr Surg 2010;126(2):619-625.
6. Physiotherapy Evidence Database. PEDro Scale (1999). http://www.pedro.org.au/english/downloads/pedro-scale/. Accessed on January 27, 2015.
Publicación original:
- Michael Rosenblat.What is evidence-based coaching (practice)?. Enero, 2015. Disponible
desde: http://www.evidencebasedcoaching.ca/
Referencias relacionadas:
- https://www.pedro.org.au/spanish/downloads/pedro-scale/