El estudio observacional

Mirta Ciocca^{1 ID}· Ricardo Mastai^{1 ID}· Arturo Cagide^{2 ID}

¹ Hospital Alemán de Buenos Aires.
² Hospital Italiano de Buenos Aires.
Ciudad Autónoma de Buenos Aires, Argentina.

Acta Gastroenterol Latinoam 2025;55(2): 70-78

Recibido: 04/05/2025 / Aceptado: 02/06/2025 / Publicado online: 30/06/2025 / https://doi.org/10.52787/agl.v55i2.489

Una historia de ficción

En un centro especializado en enfermedades hepáticas se ha estado empleado un nuevo fármaco (“Tto. X”) para el tratamiento de la hipertensión portal. Los profesionales están convencidos de que la intervención reduce la hemorragia digestiva asociada a este síndrome clínico.

Realizado un análisis estadístico demuestran que con el Tto. X, efectivamente hubo una disminución significativa de aquella complicación, con una p < 0,05.

Pero surge un interrogante: ¿habrán recibido el tratamiento solamente los pacientes con mejor condición clínica y pronóstico favorable, como por ejemplo menor edad, menor grado de hipertensión portal, o ausencia de plaquetopenia? Si así fuera, ¿la p < 0,05, se debe al tratamiento o a que la intervención actuó como una “seleccionadora” de una población de menor riesgo?

El diseño observacional

La Figura 1 ilustra un estudio observacional ficticio, donde la variable de evolución, punto final del estudio o “outcome”, podría estar asociada a la variable de exposición (objetivo de la investigación) pero también a un cierto número de confundidores (o covariables) que pueden condicionar aquella asociación.

Por ejemplo, como se adelantó, si una intervención puede modificar favorablemente el outcome -para el caso mortalidad de causa hepática o hemorragia digestiva no mortal- se indica preferentemente a pacientes con mayor número de plaquetas o una enfermedad de menor severidad, ese beneficio podría deberse al tratamiento, pero también a que el procedimiento "seleccionó" individuos con menor riesgo de hemorragia. Obsérvese que la condición detallada requiere la asociación de los confundidores con la intervención.

En otras palabras, todo desbalance en la prevalencia de confundidores entre los grupos en comparación puede alterar la asociación objetivo del estudio. De modo que, cuando se considera solo la relación entre intervención y outcome mediante un análisis univariado o no ajustado, la p resultante podría no tener valor clínico en cuanto al efecto del tratamiento.

En principio, la situación descripta no afecta a los ensayos randomizados (experimentales) ya que la indicación de intervenir no resulta de una decisión médica sino del azar, de modo que los confundidores se distribuyen en forma balanceada en ambos grupos, con y sin intervención, por lo que la asociación exposición / outcome se "independiza" de sus efectos. Sin embargo, el azar puede fallar en ocasiones, especialmente si la muestra es de tamaño reducido.

El procedimiento habitual para resolverel problema en un ensayo de seguimiento es el método multivariado de regresión logística o tiempo al evento de riesgos proporcionales de Cox (de aquí en más "modelo de Cox").

Con esta metodología se analizan en conjunto, la variable de exposición y los confundidores (seleccionados por su asociación estadística aislada o el aporte bibliográfico (variables independientes). (Figura 1). Este procedimiento es habitualmente referido como ajuste. Si en el análisis multivariado la exposición se asocia con significación estadística al outcome (variable dependiente) se concluye que dicha asociación no está condicionada a confundidores.

El análisis multivariado requiere una cierta proporción entre el número de variables independientes y la prevalencia/incidencia de la variable de evolución o outcome, lo que en ciertas condiciones limita las posibilidades para aplicar esta metodología.

Figura 1. Estudio multivariado

Score de Propensión ("Propensity Score", PS)

Una segunda metodología estadística es igualar los confundidores de modo que resulten balanceados en los grupos con intervención y control.

La Figura 2 ilustra el procedimiento. Como primer paso se estima estadísticamente la asociación entre los confundidores (ahora variables independientes) y la exposición (ahora variable dependiente), empleándose un análisis multivariado (para el caso regresión logística).

De su resultado se deriva el Propensity Score (PS) que es la probabilidad de quedar expuesto a la intervención independientemente de los confundidores. Los individuos con similar PS deberían tener igual probabilidad de recibir el tratamiento en investigación, hayan sido tratados o no con la intervención motivo del estudio.

Una ventaja que ofrece el PS sobre el análisis multivariado es que el número de las variables independientes no será limitado por la prevalencia del outcome, ya que la intervención, a diferencia del outcome, siempre tendrá suficiente número de observaciones.

Figura 2. Propensity score y análisis derivados

Variables de exposición y variables de evolución (outcome)

Hay cierto debate acerca de qué variables deben incluirse en el cálculo de PS. En general deberían ser todas aquellas que el investigador considera que condicionan un determinado tratamiento o intervención. En principio las variables determinantes del outcome deberían también incluirse.

Como en cualquier análisis multivariado, el problema es que solo se consideran las variables independientes conocidas y disponibles y como resultado de esa situación el PS puede presentar defectos en la predicción de la exposición al tratamiento o intervención.

Para calcular la exactitud del modelo en el cálculo del PS puede aplicarse la curva ROC y, si bien hay discrepancias en el valor a considerar como adecuado, la mayoría de los autores lo ubican en 0,80.

PS, ajuste de covariables y estimación del outcome

Apareamiento

Siguiendo la metodología anterior cada individuo quedará caracterizado, según sus características basales o confundidores, por un determinado PS. Algunos individuos del grupo intervención tendrán similar PS que los del grupo control, de modo que es posible aparear pacientes de ambos grupos según su PS. (Figura 3).

Ahora bien, un número significativo de individuos de ambos grupos, tratados y no tratados, serán excluidos al no disponerse del correspondiente par. Ese número de excluidos se relaciona en forma directa con el grado de desbalance de confundidores entre ambos grupos de la muestra original del estudio. De este modo, la conclusión del ensayo y su traslado a la práctica, se limita exclusivamente a la muestra emparejada, sin poder generalizarse a la totalidad de la población.

Figura 3. Apareamiento

Ponderación inversa de la probabilidad de tratamiento (IPTW)

Este procedimiento, a diferencia del apareamiento, incluye la totalidad de la muestra en estudio.

Ahora bien, mientras que con el apareamiento el ajuste se logra reduciendo la población hasta que los confundidores se igualen en los grupos a comparar, en el IPTW ese objetivo se alcanza incrementando dicha población con individuos con similar tasa de confundidores mediante una argucia matemática.

La Figura 4 es un ejemplo teórico que compara el grupo de intervención con el grupo control. El número de plaquetas, dicotomizada en >10⁵ mcL y ≤10⁵ mcL, es el único confundidor considerado para este ejemplo.

Hay un desbalance evidente ya que los individuos en el grupo tratado con plaquetas >10⁵ son tres y solo uno en el grupo control. Se debe ajustar la covariable plaquetas para que ambos grupos puedan ser comparados en cuanto a un determinado outcome, por ejemplo, mortalidad de causa hepática o hemorragia digestiva no mortal. Para ello se estima el PS en cada uno.

Si se aplica la estrategia de macheo, se podrían integrar dos pares de 2 pacientes cada uno, tratado y control, que compartieran similar PS: la muestra quedaría limitada a solo 4 individuos. (Figura 4)

Si en el mismo ejemplo se emplea el IPWT el ajuste de la covariable plaquetas se alcanza, como ya se adelantó, incrementando artificialmente el número de observaciones mediante el procedimiento detallado en la Figura 5.

En el cálculo se emplea también el PS, pero en este caso, al no reducir el número de observaciones, se puede generalizar el resultado de la investigación a una población más representativa de la práctica clínica habitual.

Ahora bien, en un contexto real, la probabilidad de tratamiento queda condicionada a múltiples confundidores cuyo efecto global está representado en el PS, el cual será diferente para cada individuo. (Figura 6). El procedimiento, similar al explicado a propósito de la Figura 5, si bien reduce el desbalance, no es perfecto, persistiendo ciertas diferencias en la distribución de los individuos con plaquetopenia entre los grupos con y sin tratamiento, lo cual se debe al efecto de los otros confundidores.

La estrategia detallada a propósito de las plaquetas debe aplicarse a todas las variables o confundidores disponibles contemplados al calcular el PS.

Figura 4. Apareamiento

Figura 5. Inversa de la probabilidad ponderada (IPTW)

Figura 6. Inversa de la probabilidad ponderada (IPTW)

Estimando el grado de ajuste

La precisión del ajuste es un aspecto crítico cuando se aplica el método de IPTW para incluir la totalidad de los individuos en estudio, los cuales seguramente presentarán diferencias sustanciales en la prevalencia de múltiples confundidores.

Para evaluar el grado de ajuste alcanzado, se emplea usualmente la diferencia absoluta estandarizada (DAE), es decir la diferencia medida en unidades de desvío estándar, existente para cada una de las variables de confusión luego del ajuste por IPTW. En general se acepta que el margen que asegura un ajuste adecuado es una diferencia inferior a 0,10, aunque en ocasiones se extiende a < 0,20, lo que de alguna manera quita consistencia a las conclusiones del estudio.

La Figura 7 grafica la DAE antes y después del ajuste, mostrando el desbalance previo y el éxito del procedimiento.

Figura 7. Evaluación del ajuste por IPTW en el ensayo teórico

PS, IPWT y análisis derivados

En la bibliografía médica actual no es infrecuente que en los estudios observacionales figuren los términos "Propensity Score" y “Población IPWT”, por lo cual es necesario conocer la base conceptual de estas metodologías estadísticas.

Con ambos procedimientos se trata de disponer de dos poblaciones que, en principio, solo difieran en cuanto a si han recibido o no la intervención objetivo del estudio, ya que el resto de las variables condicionantes de la evolución han sido “igualadas”.

Desde aquí, sería posible continuar con el análisis estadístico confeccionando la curva ajustada de Kaplan y Mayer y estimar si existe diferencia significativa entre los grupos, empleando el log Rank Test o el Modelo de Cox.

Siguiendo con el ejemplo teórico de este escrito, sería factible graficar la relación entre los odds ratio del outcome (nuevamente mortalidad hepática o hemorragia digestiva no mortal) con diferentes covariables expresadas como dato continuo, por ejemplo el recuento de plaquetas, la edad o el tiempo de protrombina, considerando de este modo exactamente el punto de corte determinante del pronóstico.

Un ensayo observacional realizado con la finalidad de evaluar una intervención o estimar el valor de un índice pronóstico siempre constituye un desafío metodológico. La clave es el procedimiento de ajuste de covariables para hallar el valor real de la asociación motivo de la investigación.

La exactitud del PS para estimar la probabilidad de ser intervenido es un condicionante de la metodología de IPTW. Nuevamente, las variables confundidoras no incluidas, desconocidas o no contempladas, constituyen un punto crítico del procedimiento estadístico.

Habitualmente, un ensayo clínico tiene por finalidad predecir, a partir de un conjunto de datos disponibles (variables independientes), otro (variable dependiente, punto final o outcome), temporalmente presente (estudio diagnóstico) o que aparecerá algún tiempo después (estudio pronóstico). El cualquier caso, el outcome queda condicionado a una multiplicidad de esos condicionantes, estadísticamente definidos como variables independientes.

Ahora bien, a partir del resultado se podrá generar un score, como por ejemplo la probabilidad de hemorragia digestiva por várices esofágicas o la mortalidad en la insuficiencia hepática crónica.

En otros casos interesa conocer solo el efecto de una de esas variables independientes.

Ocurre entonces que, si la variable que es motivo de estudio está asociada a otras (variables confundidoras), podría surgir el siguiente interrogante: “¿la evolución favorable es debida a la efectividad del tratamiento en estudio o se debe a que ese tratamiento fue indicado en individuos de menor riesgo?” En estos casos se requiere aislar la asociación de interés de los confundidores, condición referida metodológicamente como ajuste. Los estudios aleatorizados constituyen la opción ideal, ya que al asignar en forma aleatoria el tratamiento, los confundidores quedarán balanceados entre los grupos en observación.

En los estudios observacionales esta problemática es el aspecto central y el mayor condicionante del resultado, sea el objetivo de la investigación la búsqueda de un indicador pronóstico o el efecto de una intervención. La metodología aplicada puede ser, entre otras, el análisis multivariado, el propensity score o el inverso de la probabilidad ponderada. Dicha complejidad estadística afecta no solo el diseño sino también la interpretación de la información bibliográfica.

En los ensayos observacionales la información necesaria o input, proviene de la práctica médica habitual, registrada en la historia clínica o en una base de datos, en ocasiones internacionales y de gran volumen (Big Data). De tal modo, al no modificar el accionar médico cotidiano, es claramente un reflejo cabal del “mundo real”, del accionar asistencial y no una condición experimental, como ocurre en los estudios aleatorizados. Ello mismo es determinante, además, del menor costo y factibilidad para concretar la investigación.

El espectro de la validez metodológica de un ensayo observacional es amplio, donde en un extremo está el registro de datos históricos de la historia clínica, frecuentemente con información faltante u obtenida sin una sistemática predefinida. El otro extremo corresponde a un diseño con valor metodológico superior, el cual requiere un protocolo ad hoc, con una precisa metodología estadística y de otros condicionantes imprescindibles, como precisar las condiciones de inclusión y exclusión y la definición a priori de los puntos finales primarios y secundarios, entre otros parámetros.

La opción ensayos aleatorizados vs. observacionales es falsa: ambas metodologías se complementan en el avance del conocimiento médico.

Tal vez, lo que sí merece una consideración especial, es la afirmación del físico Richard Feynman cuando concluye: "es mucho más interesante vivir con cierta incertidumbre, que vivir con respuestas que pueden estar equivocadas". (It is much more interesting to live with uncertainty than to live with answers that might be wrong”).

Propiedad intelectual. Los autores declaran que los datos presentes en el manuscrito son originales y se realizaron en las instituciones a las cuales pertenecen.

Financiamiento. Los autores declaran que no hubo fuentes de financiación externas.

Conflicto de interés. Los autores declaran no tener conflictos de interés en relación con este artículo.

Aviso de derechos de autor

© 2025 Acta Gastroenterológica Latinoamericana. Este es un artículo de acceso abierto publicado bajo los términos de la Licencia Creative Commons Attribution (CC BY-NC-SA 4.0), la cual permite el uso, la distribución y la reproducción de forma no comercial, siempre que se cite al autor y la fuente original.

Cite este artículo como: Ciocca M, Mastai R y Cagide A. El estudio observacional. Acta Gastroenterol Latinoam. 2025;55(2):70-78. https://doi.org/10.52787/agl.v55i2.489

Correspondencia: Mirta Ciocca
Correo electrónico: cioccamirta@gmail.com

Acta Gastroenterol Latinoam 2025;55(2):70-78