ZZZPHGLOLEURVFRP INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Sven Hernberg
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
ZZZPHGLOLEURVFRP
Traducido por: Dres. Magda Campins Martí y José Rossello Urgel
Revisado por: Dr. Josep Vaqué Rafart
Título original: Introduction to Occupational Epidemiology
© CRC Press, Inc., 1992 © Ediciones Díaz de Santos, S.A., 1995 Juan Bravo, 3A. 28006 Madrid España
Reservados todos los derechos. «No está permitida la reproducción total o parcial de este libro, ni su tratamiento informático, ni la transmisión de ninguna forma o por cualquier medio, ya sea electrónico, mecánico, por fotocopia, por registro u otros métodos, sin el permiso previo y por escrito de los titulares del Copyright.»
ISBN en lengua inglesa: 0-87371-636-1 ISBN en lengua española: 978-84-7978-187-3 Depósito legal: M.34.587 -1994
Fotocomposición: Fer, S.A. Impresión: Fareso, S.A. Encuadernación: Novimar, S.L.
Contenido
Prólogo a la edición española.........................................................
XIII
Prefacio..........................................................................................
XV
Acerca del autor.............................................................................
XIX
Capítulo 1. Introducción............................................................
1
Lugar de la Epidemiología en la Ciencia ....................................... Niveles de la investigación epidemiológica ................................... Causalidad ................................................................................... Las hipótesis en la investigación epidemiológica .......................... Bibliografía ...................................................................................
4 9 11 16 19
Capítulo 2. Algunas medidas epidemiológicas básicas .................
21
Tasas crudas................................................................................... 21 Prevalencia .............................................................................. 22 Incidencia................................................................................. 24 Latencia.................................................................................... 30 Riesgo ...................................................................................... 33 Razón de tasas y diferencia de tasas......................................... 33 Odds ratio................................................................................. 36 Medidas estandarizadas de morbilidad ........................................ 37 Mortalidad proporcional ............................................................. 45 Las asociaciones exposición-efecto y exposición-respuesta ............ 48 Bibliografía ............................................................................................. 52
VII
VIII
CONTENIDO
Capítulo 3. Fuentes de la información ...........................................
55
Estadísticas vitales .......................................................................... Registros de defunción.............................................................. Otros registros de morbilidad .................................................. Registros de población .................................................................. Registros de exposición .................................................................. Enlace de registros .......................................................................... Confidencialidad ........................................................................... Datos de exposición ..................................................................... Medidas de exposición química .............................................. Recogida de datos de exposición............................................... Aproximaciones a los datos de exposición ............................ Matrices de exposición laboral ................................................ Exposiciones múltiples ............................................................. Exposiciones no químicas ....................................................... Enmascaramiento de los verdaderos efectos por los datos crudos de exposición ............................................................. Indicadores de morbilidad.............................................................. Mediciones ............................................................................... «Dureza» del indicador .......................................................... Cuestionarios y entrevistas........................................................ Sensibilidad y especificidad ...................................................... Bibliografía ....................................................................................
56 56 59 62 63 64 67 69 70 71 72 73 74 75
Capítulo 4. Diseños de estudios epidemiológicos y sus aplicaciones en Medicina Ocupacional .................................................. Introducción ................................................................................... Encuestas descriptivas..................................................................... Encuesta sobre la salud de los trabajadores .............................. Observación de la morbilidad en relación con la ocupación, el área de trabajo o ciertas exposiciones ............................... Identificación de riesgos — Alarmas ....................................... La morbilidad ocupacional nacional y las estadísticas de mortalidad ................................................................................. Estudios transversales de la base del estudio................................... Diseños longitudinales — Consideraciones iniciales ...................... Estudios de base de cohortes ......................................................... Estudios de censo ...................................................................... Muestreo de casos y controles en una base de cohortes ......... Estudios de base de población dinámica .......................................
75 77 77 78 79 80 84
85 85 90 90 93 94 95 96 98 100 100 116 122
CONTENIDO
IX
Principios del diseño de casos y controles ................................ Estudios de casos y controles no pareados ............................. Estudios de casos y controles pareados ................................... Estudios de mortalidad proporcional......................... _._................ Estudios de intervención................................................................ Elección del diseño del estudio ...................................................... Temporalidad prospectiva o retrospectiva ............................... Censo o muestreo ................................................................... Bibliografía ....................................................................................
123 127 128 131 132 139 139 141 145
Capítulo 5. Validez interna, precisión y generalización ..............
147
Introducción .................................................................................. Validez interna .............................................................................. Validez de la selección ............................................................. Validez de la información ....................................................... Control del sesgo de información........................................ Validez de la comparación ....................................................... Sesgo de confusión ............................................................. Control del sesgo de confusión .......................................... Efecto del trabajador sano ....................................................... Precisión ........................................................................................ Generalización .............................................................................. Bibliografía ....................................................................................
147 149 149 156 161 164 170 179 185 192 199 201
Capítulo 6. Problemas específicos en el estudio de algunas patologías relacionadas con el trabajo ............................................
205
Introducción .................................................................................. Cáncer............................................................................................ Exposiciones ocupacionales...................................................... Niveles de la epidemiología del cáncer ................................... Problemas en el diseño del estudio........................................... Enfermedades respiratorias crónicas inespecíficas ........................ Definición................................................................................. Factores de riesgo relacionados con el trabajo ......................... Indicadores de morbilidad y su medición................................. Valoración de la exposición...................................................... Tabaquismo ............................................................................. Otros aspectos de la validez...................................................... Trastornos musculoesqueléticos ....................................................
205 208 208 213 215 222 222 223 224 228 229 230 231
X
CONTENIDO
Dolor lumbar ............................................................................ Trastornos del cuello y de las extremidades superiores............. Osteoartrosis.............................................................................. Indicadores de morbilidad y su medición ................................ Valoración de la exposición ...................................................... Otros aspectos de la validez....................................................... Enfermedad coronaria ................................................................. Factores de riesgo relacionados con el trabajo ......................... Actividad física y estrés laboral ................................................. Indicadores de morbilidad y su medición ................................ Valoración de la exposición ...................................................... Otros aspectos de la validez....................................................... Respuestas conductuales y síntomas psicosomáticos...................... Factores de estrés en el trabajo ................................................. Sintomatología psicosomática y conductual como consecuencia del estrés relacionado con el trabajo ............................ Problemas en el diseño del estudio............................................ Bibliografía .....................................................................................
231 233 233 234 239 240 242 242 243 245 248 249 251 251
Capítulo 7. Planificación de un estudio: el protocolo......................
261
¿Por qué se necesita un protocolo del estudio? .............................. El plan del estudio.......................................................................... El estudio piloto............................................................................. El diario del proyecto .................................................................... La publicación .............................................................................. Bibliografía ....................................................................................
261 262 273 274 276 278
Capítulo 8. Aspectos éticos............................................................
279
Bibliografía ....................................................................................
286
Capítulo 9. Algunas pautas para la interpretación de los estudios epidemiológicos ........................................................................
287
Introducción................................................................................... Comprobación de la validez ........................................................ Significación estadística ................................................................ Errores positivos y negativos ......................................................... Resultados falsos positivos ....................................................... Resultados falsos negativos .....................................................
287 290 293 300 300 305
252 253 256
CONTENIDO
XI
Falta de potencia................................................................. Falta de sensibilidad ........................................................... Clasificación errónea........................................................... Miscelánea de errores ......................................................... Evidencias en favor de las inferencias causa-efecto ....................... Bibliografía ....................................................................................
308 312 312 314 315 319
Índice alfabético....................................................................................
321
Prólogo a la edición española
La Salud Ocupacional es el área de la Salud Pública dedicada a la prevención de las enfermedades y lesiones relacionadas con el trabajo. Al igual que la Salud Pública, la Salud Ocupacional descansa o pivota sobre la Epidemiología, ciencia que permite realizar la vigilancia de los procesos y condiciones, describir los patrones de presentación de la enfermedad, identificar los potenciales factores causales, adoptar las necesarias medidas de control y evaluar la eficacia de las intervenciones. Por ello, es del todo recomendable que el profesional de la Salud Ocupacional posea unos sólidos conocimientos epidemiológicos. El libro del profesor Sven Hernberg facilita una introducción básica a la Epidemiología en Salud Ocupacional. Esta obra no es una simple recopilación de información epidemiológica, ni una revisión actualizada, sino una meditada y justificada selección de temas, expuesta de forma amena y práctica, realizada por una persona con largos años de dedicación a la materia. El Dr. Hernberg ha llevado a cabo notables actuaciones en la resolución de problemas epidemiológicos ocupacionales, ha desarrollado destacados proyectos de investigación, posee una gran experiencia docente y, además, es editor de una de las revistas más prestigiosas en la actualidad sobre Salud Ocupacional. Como fruto de esta fecunda actividad, en este libro el autor presenta el núcleo esencial de la Epidemiología Ocupacional. XIII
XIV
PRÓLOGO A LA EDICIÓN ESPAÑOLA
Desde los años setenta la Salud Pública de Finlandia destaca entre los países avanzados por un nivel que podríamos llamar de excelencia en dos campos, la Epidemiología y la Salud Ocupacional. Baste recordar dos realizaciones muy conocidas, el proyecto de investigación sobre epidemiología cardiovascular en Karelia del Norte, y la avanzada organización de la Salud Ocupacional en todo el país. Como hecho interesante cabe destacar que el Dr. Hernberg y este libro se hallan en la confluencia de las dos citadas áreas de tanto prestigio. A su vez el libro constituye una divulgación de los conceptos del epidemiólogo finlandés, profesor Olli Miettinen, que en los últimos veinte años ha sido uno de los artífices de la moderna Epidemiología. El autor se halla influido e inspirado por Miettinen, circunstancia que se refleja en el libro, cuya lectura recomendamos como paso previo para profundizar en la obra de Miettinen. Los conceptos de «relación de ocurrencia» y de «base del estudio» son aportaciones originales de Miettinen, de amplia aceptación actual, que de forma pedagógica se exponen en este libro. Toda la terminología epidemiológica usada por el Dr. Hernberg se ha adaptado al castellano a excepción del vocablo «odds ratio», que no posee una traducción precisa y que por otro lado ya es de uso habitual en nuestra literatura médica. Algunos términos propios de la jerga epidemiológica profesional, como por ejemplo el uso del vocablo «el material» para designar a los sujetos del estudio, y de «un estudio ad hoc» para expresar un trabajo específicamente diseñado para el problema planteado, que quizás puedan sorprender a lectores no avezados, se usan en el sentido y forma originales. En resumen, me complace presentar un libro que sin entrar en formulaciones complejas, ni en aspectos que corresponderían al análisis epidemiológico avanzado, proporciona una concienzuda introducción a la Epidemiología Ocupacional. Dr. Josep Vaqué Rafart Profesor Titular de Medicina Preventiva y Salud Pública Universitat Autónoma de Barcelona. Jefe de Servicio de Medicina Preventiva y Epidemiología. Ciutat Sanitaria «Valí d'Hebrón». Barcelona.
Prefacio
La Epidemiología ha sido considerada como la disciplina que ha originado la Salud Pública. Por otro lado, muchos de los conocimientos de la Medicina Ocupacional moderna derivan de estudios epidemiológicos. Esto es especialmente cierto para los trastornos relacionados con el trabajo que no se consideran enfermedades ocupacionales clásicas. Estas enfermedades se caracterizan por tener una etiología multifactorial y sus manifestaciones pueden ser indistinguibles de las de las enfermedades generales. Por ejemplo, un trastorno en la espalda debido a un trabajo físico pesado no difiere clínicamente de un trastorno similar provocado por lesiones deportivas o por otras causas. Del mismo modo, un cáncer de pulmón causado principalmente por la exposición a sales de níquel es indistinguible de uno causado, por ejemplo, por el consumo de cigarrillos. En estos casos el diagnóstico etiológico individual no es posible. Solamente mediante el estudio de grupos de personas puede identificarse y cuantificarse la contribución etiológica de los distintos factores, entre los que se hallan los ocupacionales. Asimismo, hay muchos síndromes no específicos o síntomas que pueden ser inducidos, en mayor o menor grado, por factores ocupacionales. Entre ellos se incluyen la bronquitis, la cefalea, la fatiga, disfunciones de los nervios periféricos y otros muchos. El estudio de la etiología de estas manifestaciones de morbilidad también requiere un enfoque epidemiológico. Los investigadores, como productores de información epidemiológica, se hallan en una posición clave cuando se trata de escoger temas pertinentes, desarrollar los estudios con destreza e inXV
XVI
PREFACIO
terpretar los resultados correctamente. Sin embargo, los lectores de los informes epidemiológicos también necesitan profundizar en Epidemiología. Deben ser capaces de formar su propia opinión crítica sobre la validez de los resultados y estar en posición de juzgar si los investigadores han sido correctos en sus conclusiones. Existen muchos tipos diferentes de «consumidores» de información epidemiológica, como los administradores, el personal directivo y los profesionales de la salud de diversos tipos; es la de los médicos de Salud Ocupacional una categoría numerosa. La educación de estos «consumidores» es, por consiguiente, cada vez más importante. Este libro va dirigido principalmente a los «consumidores», especialmente a los médicos de Salud Ocupacional. También será útil como una primera introducción a la epidemiología para aquellos que se especializan en Salud Ocupacional y los que desean dedicarse a la investigación epidemiológica. A pesar de que se halla enfocado de forma principal a la Medicina Ocupacional, y la mayoría de los ejemplos se refieren a este campo, muchos de los principios de la Epidemiología se aplican perfectamente a otras disciplinas. Así, los profesionales que inician una especialización en Salud Pública, Higiene Ocupacional, Ergonomía y otros campos de la prevención pueden beneficiarse del libro. También ayudará a los administradores dedicados al establecimiento de estándares, en una mejor comprensión de los datos científicos básicos. Ya que este libro pretende ser de un nivel elemental, se han omitido los aspectos técnicos del análisis de datos. Los que estén interesados en avanzar en sus conocimientos epidemiológicos, incluyendo al análisis de datos en su campo de atención, es recomendable que consulten libros de texto más avanzados, por ejemplo, los de Rothman4, Checkoway et al.1 y Elwood2. El libro más destacado de Miettinen3, Theoretical Epidemiology, es adecuado para estudios muy avanzados; sin embargo, el texto se entiende mejor si se lee en conjunción con un curso introductorio de Epidemiología. En el primer capítulo de este libro se presenta una introducción sobre la naturaleza de la investigación no experimental, destacando los aspectos en que estos estudios difieren de la investigación experimental. En el segundo capítulo se introducen las medidas más importantes utilizadas en la investigación epidemiológica. En el tercer capítulo se exponen brevemente las fuentes de los datos. El cuarto hace una presentación de los diseños de los estudios epide-
PREFACIO
XVII
miológicos y en el quinto se discuten los problemas de la validez y la generalización. El capítulo sexto es una revisión más específica de los problemas hallados en los estudios epidemiológicos en los cinco campos más problemáticos, a saber, el cáncer, la enfermedad coronaria, las enfermedades respiratorias crónicas no específicas, los trastornos musculoesqueléticos y los problemas psicosociales. En el capítulo séptimo se expone un esquema para redactar el protocolo de un estudio y el capítulo octavo se refiere a aspectos éticos. El último capítulo proporciona una orientación sobre la interpretación de los estudios epidemiológicos y discute las razones de los resultados falsos negativos y falsos positivos. Como la epidemiología, que es un tema abstracto, a menudo resulta difícil de comprender por el principiante, he ilustrado el texto con numerosos ejemplos. También he tratado de simplificar diversas materias, tal vez hasta el punto de que algunos investigadores experimentados podrían llegar a sorprenderse. Sin embargo, por mi propia experiencia, primero como estudiante y más tarde como profesor de Epidemiología, he visto que los fundamentos no se comprenden si se exponen demasiados detalles y afirmaciones condicionales en las fases iniciales del proceso de aprendizaje. Este libro no está escrito para mis doctos colegas. Pretende ser una introducción fácilmente comprensible a la Epidemiología Ocupacional para los que trabajan en Salud Ocupacional. Creo que muchos potenciales lectores de este libro representan a los «consumidores» de epidemiología. Los capítulos sobre las medidas básicas de la epidemiología, los aspectos de la validez, la epidemiología de algunas enfermedades comunes y la interpretación de los resultados de estudios, se han escrito especialmente para estas personas. Los fundamentos del diseño de estudios también deben ser conocidos por los lectores de estudios epidemiológicos a efectos de asegurar su mejor comprensión. Sin embargo, algunos capítulos, por ejemplo, partes del capítulo sobre diseño de estudios y las guías para un protocolo del estudio, van dirigidos a aquellos que se inician en el campo de la investigación. Me gustaría dar las gracias a muchos de mis colegas que han aportado una crítica constructiva a las distintas versiones del manuscrito. Los comentarios realizados por Markku Nurminen, Ph.D., D.Sc, y Timo Partanen, M. Se, me han sido especialmente útiles. Georgianna Oja, B.A., revisó la mayor parte del texto en inglés y
XVIII
PREFACIO
colaboró en la edición del manuscrito. La señora Tarja Hokkanen llevó a cabo gran parte del mecanografiado y la señora Ritva Järnström dibujó las figuras. Mi más sincera gratitud a todos. El profesor Olli S. Miettinen ha sido mi maestro en epidemiología. Desde 1972 he tenido el placer de disfrutar varios de los excelentes cursos avanzados que ofrece anualmente en Helsinki. Todo mi texto se halla influido por su pensamiento. Si hay interpretaciones defectuosas en las que el texto no se halle de acuerdo con sus principios, el error es enteramente mío. La Finnish Work Environment Fund ha contribuido a la publicación de este libro con una beca que hizo posible que obtuviese un permiso de mi lugar de trabajo, el Institute of Occupational Health de Helsinki, durante los veranos de 1988, 1989 y 1990. Esta ayuda fue crucial para poder escribir este libro. BIBLIOGRAFÍA 1. Checkoway, H., Pearce N.E., Crawford-Brown D.J. Research Methods in Occupational Epidemiology, New York: Oxford University Press, 1989. 2. Elwood, J.M. Causal Relationships in Medicine: A Practical System for Critical Appraisal, Oxford: Oxford University Press, 1988. 3. Miettinen, O.S. Theoretical Epidemiology: Principies of Occurrence Research in Medicine, New York: John Wiley & Sons, 1985. 4. Rothman, K.J. Modern Epidemiology, Boston: Little Brown and Company, 1986. Existe versión en castellano: Epidemiología moderna, Madrid: Ed. Díaz de Santos, 1987.
Acerca del autor
Sven Hernberg es doctor en Medicina y nació en Helsinki, Finlandia, en el año 1934. Se licenció en Medicina en la Universidad de Helsinki en el año 1946 y obtuvo la especialización en Medicina Ocupacional en el año 1964. En 1967 recibió el título de doctor con una tesis sobre los efectos del plomo en la membrana de los eritrocitos. En 1960 se incorporó al Instituto Nacional para la Salud Ocupacional, en Helsinki, primero como asistente investigador y más tarde como médico especialista en Salud Ocupacional. En 1972 fue nombrado director del nuevo departamento de Epidemiología y Bioestadística y, en 1974, director de investigación del Instituto' Finlandés de Salud Ocupacional, una organización que actualmente cuenta con una plantilla superior a 500 miembros titulares. El profesor Hernberg ha desarrollado una notable actividad en muchas organizaciones internacionales. A menudo ha sido consejero temporal de la Organización Mundial de la Salud (OMS) y de la Agencia Internacional de Investigación sobre el Cáncer (IARC). En 1980 fundó y fue nombrado decano del Comité Científico sobre Epidemiología en Salud Ocupacional de la Comisión Internacional sobre Salud Ocupacional, la organización mundial más antigua en este campo, fundada en 1906. En 1981 fue elegido vicepresidente de la Comisión Internacional y, en 1987, su presidente, cargo que XIX
XX
ACERCA DEL AUTOR
mantiene hasta 1993. En 1983 fue elegido Miembro Honorario del Real Colegio de Médicos de Irlanda, así como del Real Colegio de Médicos de Londres (Facultad de Medicina Ocupacional). En 1990 fue nombrado Miembro Distinguido del Consejo de Salud Ocupacional de Canadá. Es miembro de otras organizaciones internacionales. El profesor Hernberg ha publicado más de 260 artículos originales, revisiones y capítulos de libros sobre aspectos relacionados con la Salud Ocupacional, principalmente en las áreas de la Toxicología Clínica Ocupacional y la Epidemiología Ocupacional. Sus temas más importantes han sido la toxicología del plomo, la toxicología de los solventes y el cáncer ocupacional. Es Editor de la revista Scandinavian Journal of Work, Environment, and Health, desde 1974, y miembro del consejo editorial de diversas revistas internacionales.
_____________________________________________________________
1
Introducción
El primer estudio en el campo de la Medicina Ocupacional que podríamos etiquetar de epidemiológico fue publicado en 1775 por Sir Percival Pott, quien llamó la atención sobre la elevada ocurrencia de cáncer de escroto entre los deshollinadores. A pesar de que Sir Percival no pudo explicar el mecanismo de dicha enfermedad, describió la conexión entre una exposición ocupacional, limpiar chimeneas, y dicho tipo de cáncer. La etiología precisa de la enfermedad se aclaró más tarde. Los deshollinadores de la vieja Inglaterra empezaban a trabajar a temprana edad porque sólo los muchachos jóvenes eran capaces de entrar en las chimeneas y trabajar desde su interior. Sus ropas quedaban impregnadas de hollín, que contiene diversos hidrocarburos aromáticos policíclicos y otros productos de la combustión, muchos de ellos cancerígenos. Las áreas de la piel con más pliegues, como el escroto, estaban en contacto casi permanente con el hollín cancerígeno porque, en aquellos tiempos, ni la ropa ni la piel se lavaban con frecuencia. La observación de Sir Percival es un ejemplo de cómo un epidemiólogo puede inferir una relación causal entre una exposición y una enfermedad, a pesar de que no se conozca el mecanismo biológico de actuación. Hay otros muchos ejemplos en los que la observación de una asociación epidemiológica ha facilitado la primera pista de una conexión causal entre una exposición y una enfermedad, mucho antes de que el mecanismo fuese conocido. Entre los estudios iniciales, se hallan los de Pirchan y Sikl7, que demostraron que casi la mitad de los mineros de las minas de oro y plata de Joachimsthal y Schneeberg fallecían por cáncer de pulmón (más tarde se demostró que era debido a los derivados del radón); 1
2
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
los de Sir Richard Dolí3, que demostró un exceso de cáncer de pulmón en los trabajadores del gas; y los de Case y colaboradores1, que observaron un exceso extremadamente elevado de cáncer de vejiga en los trabajadores expuestos a aminas aromáticas en la producción de tintes. Sin embargo, a pesar de las observaciones aisladas de Sir Percival, se necesitaron más de 150 años para llegar al establecimiento de los métodos epidemiológicos en el estudio de las enfermedades relacionadas con el trabajo. Puede decirse que los estudios de Dolí y de Case y colaboradores representan el inicio de la Epidemiología Ocupacional moderna. El gran retraso puede explicarse en parte por el subdesarrollo de la epidemiología de las enfermedades no infecciosas en general, puesto que el estudio epidemiológico de las enfermedades degenerativas crónicas y de las enfermedades neoplásicas no tuvo lugar hasta los años 50. Otra explicación podría ser que la Medicina Ocupacional fue básicamente una disciplina clínica hasta bien entrados los años 60, y se halla aún así en algunos países. Como los casos de evidente patología clínica ocupacional eran frecuentes, existía una limitada motivación para estudiar las manifestaciones tempranas o las secuelas tardías a nivel de grupo. Además, la causa de un caso típico de enfermedad ocupacional es evidente incluso sin ninguna investigación. Cualquiera con nociones básicas de Medicina Ocupacional se da cuenta de que la etiología del envenenamiento por plomo es la exposición al plomo. En las últimas tres décadas ha cambiado la naturaleza de la Medicina Ocupacional en el mundo desarrollado. Las manifestaciones evidentes y clásicas de las enfermedades ocupacionales han sido cada día menos frecuentes. Algunas formas de enfermedad, como por ejemplo, la parálisis debida al plomo, el manganismo, la silicotuberculosis y la aplasia de médula ósea por inhalación de benzol han desaparecido. Hoy en día la máxima preocupación está en los efectos subclínicos o a largo plazo de las exposiciones ocupacionales. Como consecuencia, el interés de los investigadores se ha decantado hacia el estudio de dichos efectos. Estas manifestaciones por lo general no son específicas y, desde un enfoque clínico centrado en el individuo, no siempre pueden relacionarse con una determinada exposición o con una combinación de exposiciones. Establecer una relación causa-efecto entre la manifestación de una enfermedad y una exposición ocupacional requiere el estudio de un
INTRODUCCIÓN
3
grupo de individuos, y a veces de extensas poblaciones. Es necesario, por lo tanto, un enfoque epidemiológico. Una enfermedad ocupacional típica representa el extremo de un continuo. El otro extremo viene representado por las enfermedades relacionadas con el trabajo, cuya etiología es ocupacional sólo en un menor grado. Incluso las enfermedades cuya etiología es mayoritariamente no ocupacional, pero cuyas manifestaciones se agravan o se exacerban debido a factores ocupacionales, pueden considerarse como enfermedades relacionadas con el trabajo. Por ejemplo, una lesión de origen deportivo en la espalda empeora notablemente si el trabajo se desarrolla en posición encorvada, y por ello los síntomas se consideran relacionados con el trabajo. La Organización Mundial de la Salud (OMS) ha definido recientemente las enfermedades relacionadas con el trabajo abarcando la totalidad de su espectro, no refiriéndose solamente a las enfermedades típicas con compensación económica (ver también el Capítulo 6)4'9. El estudio de esta morbilidad multicausal se ha convertido recientemente en otra misión principal de la Epidemiología Ocupacional. La identificación de los factores etiológicos aislados de una enfermedad con etiología multicausal, es decir, la determinación de la fracción etiológica ocupacional (ver el Capítulo 4), requiere técnicas epidemiológicas perfeccionadas, que deberán ser más perfectas cuanto más débil sea el factor de interés. Sin embargo, puede ser importante identificar factores etiológicos ocupacionales débiles porque usualmente puede eliminarse su causa al adoptar medidas de prevención en el lugar de trabajo. Las enfermedades relacionadas con el trabajo, caracterizadas por un largo y silente período de latencia entre el inicio de la exposición al factor causal y la manifestación de la enfermedad, están adquiriendo cada vez más importancia en Medicina Ocupacional. Muchas enfermedades degenerativas crónicas pertenecen a esta categoría, como por ejemplo las enfermedades musculoesqueléticas, las cardiovasculares y diversos trastornos pulmonares. El cáncer relacionado con el trabajo es probablemente la más estudiada de las enfermedades ocupacionales. Estos son algunos de los desafíos que han llevado a la Medicina Ocupacional a evolucionar desde la clínica a una disciplina de orientación epidemiológica. En Medicina Ocupacional la prevención no sólo es importante, sino que tiene más posibilidades que en
4
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
otros campos de la Medicina. En principio, aunque no siempre sucede en la práctica, la prevención de riesgos ocupacionales es algo sencillo. En primer lugar debe identificarse el agente etiológico, a continuación deben cuantificarse sus efectos y, por último, ha de eliminarse el agente. La investigación epidemiológica tiene un papel importante en los dos primeros pasos de esta cadena, al ayudar a identificar el agente y al cuantificar los riesgos ocupacionales. LUGAR DE LA EPIDEMIOLOGÍA EN LA CIENCIA La Epidemiología ha sido definida y redefinida en múltiples ocasiones. Una de las definiciones más simples y claras es la siguiente: La Epidemiología es la disciplina que estudia la ocurrencia de las enfermedades en el hombre. La Epidemiología ha sido considerada la disciplina que dio origen a la Salud Pública y, realmente, tiene una estrecha asociación con la Medicina Preventiva. La investigación epidemiológica se utiliza en la administración y planificación sanitarias, en la valoración de riesgos y en la evaluación de la eficacia de los tratamientos médicos. Recientemente, los métodos epidemiológicos también se han aplicado en la evaluación de prestación de servicios sanitarios. Los usos científicos de la epidemiología incluyen el estudio de las causas de las enfermedades, la descripción de su historia natural, la evaluación de la eficacia de tratamientos médicos y el estudio de la eficacia de ensayos preventivos. Sin querer menospreciar de ningún modo la importancia de las aplicaciones administrativas de la investigación epidemiológica, este libro se centra mayoritariamente en el uso científico de los métodos epidemiológicos, sobre todo en el estudio de las causas de enfermedad. La Epidemiología es la disciplina que estudia la ocurrencia de las enfermedades en el hombre.
El estudio epidemiológico de las enfermedades relacionadas con el trabajo puede ser tanto descriptivo como etiológico (a menudo el
INTRODUCCIÓN
5
término «analítico» se usa en lugar de «etiológico»). La principal función en la Epidemiología Ocupacional es asociar la presencia de morbilidad a exposiciones en el trabajo (el término «exposición» se usa a lo largo del presente texto en un sentido muy amplio), es decir, el estudio de la ocurrencia de enfermedades en relación con los determinantes relacionados con el trabajo. Por lo tanto, la Epidemiología Ocupacional se ocupa de la relación de ocurrencia entre las enfermedades relacionadas con el trabajo y los factores que determinan su aparición y curso. «La relación de ocurrencia» es un término que Miettinen usa de forma concreta para describir el estudio de la relación entre un parámetro de resultado (morbilidad) y sus determinantes (características de las que depende la morbilidad)6. Podemos decir que el estudio de las relaciones de ocurrencia es el verdadero objetivo de la investigación epidemiológica. La relación de ocurrencia puede ser vista tanto en términos descriptivos como causales. El primer paso en la investigación de un problema etiológico es la búsqueda de relaciones causales (hasta el punto de que la metodología epidemiológica provee los fundamentos para juzgar la probabilidad de causalidad; ver el Capítulo 9). Uno de los aspectos más importantes de la Medicina Ocupacional es la prevención; una prevención efectiva no es factible si no se conocen las causas de la enfermedad que prevenir. El siguiente paso es caracterizar la relación de ocurrencia en cuanto a factores que la modifican. La descripción de los aspectos cuantitativos de una relación de ocurrencia no siempre es necesaria para entender la naturaleza de un problema científico, pero este conocimiento es importante para establecer asociaciones de exposición-efecto y exposición-respuesta, que son importantes para la actividad administrativa de elaboración de normas y estándares (ver el Capítulo 3). Cada enfermedad o lesión tiene su propia epidemiología. De ahí que términos tales como epidemiología del cáncer, epidemiología de los accidentes y epidemiología de las enfermedades cardiovasculares sean de uso común. El término «Epidemiología Ocupacional» puede considerarse como una abreviatura de «Epidemiología de las Enfermedades Ocupacionales», que estaría de acuerdo con una clasificación centrada en la enfermedad. Por otro lado, la Epidemiología Ocupacional también podría considerarse centrada en los determinantes, en cuyo caso abarcaría el estudio de todas las consecuencias para la salud, tanto deletéreas como preventivas, re-
6
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
sultantes de factores ocupacionales. El hecho de que ningún sistema de clasificación abarque todo lo comprendido bajo el nombre de Epidemiología Ocupacional puede servirnos de ejemplo para ver el desorden que aún existe en el pensamiento epidemiológico. El denominador común de los estudios epidemiológicos de diversas enfermedades y accidentes es la metodología no experimental, que es similar para todos los estudios en sus aspectos más relevantes, aunque existen diferencias de detalle. Las revistas de epidemiología muestran la gran diversidad existente en materia de «epidemiología». En un mismo volumen se pueden encontrar artículos sobre (la epidemiología de) el sarampión, el aborto espontáneo, el cáncer, las enfermedades de la columna lumbar, las enfermedades cardiovasculares, el síndrome de inmunodeficiencia adquirida, los accidentes del trabajo y muchos otros. Incluso otras disciplinas aparte de la Medicina, tales como la Sociología, Psicología, Veterinaria, Silvicultura (por ejemplo, el estudio de la «epidemiología» de los efectos de la lluvia acida), usan métodos de investigación no experimentales de carácter similar. El significado tradicional de epidemiología, sin embargo, se ha referido al estudio de las enfermedades humanas (en griego «epidemos» significa «sobre la población»). En los inicios, las enfermedades infecciosas eran el principal objetivo de la investigación epidemiológica y la epidemiología fue considerada durante largo tiempo como sinónimo del estudio de las epidemias. Las enfermedades infecciosas son por lo general agudas, en el sentido de que el período de incubación entre la exposición al agente infeccioso y la aparición de la enfermedad es relativamente corto, aunque existen, sin embargo, numerosas excepciones, tales como la tuberculosis, la lepra y la infección por el virus de la inmunodeficiencia humana. Cuando el período de incubación es corto, la relación causa-efecto es fácil de detectar y los requerimientos metodológicos son menos exigentes que para las enfermedades crónicas con largos períodos de incubación. Actualmente el énfasis en la investigación epidemiológica se ha decantado hacia el estudio de las enfermedades no infecciosas. Aunque algunas de estas enfermedades son agudas, la mayoría son crónicas, en el sentido de que necesitan un largo período de tiempo para desarrollarse. La etiología de las enfermedades crónicas no infecciosas es también más compleja que la de la mayoría de las infecciones. Estas circunstan-
INTRODUCCIÓN
7
cias hacen que en el método epidemiológico que utilizar en ellas sean necesarios unos requisitos más estrictos. La interpretación de los resultados de estos estudios también resulta más difícil. La investigación epidemiológica es de tipo no experimental, con la excepción de los ensayos clínicos y quizás de algunos estudios de intervención (ver el Capítulo 4). Existen diferencias notables entre las investigaciones experimentales y las no experimentales. En los experimentos los investigadores pueden disponer de unas óptimas condiciones, controladas y científicas. Pueden decidir qué individuos (generalmente animales de experimentación) serán asignados a las categorías de exposición y a las de no exposición. Además, pueden decidir las condiciones de la exposición (por ejemplo, intensidad, duración y grado de variación). Asimismo, pueden asegurar que no se producen interferencias en las exposiciones y pueden estandarizar otros factores del entorno que podrían interferir en el fenómeno estudiado (alimentación, luz, temperatura, etc.). Las variables de resultado también pueden medirse bajo condiciones controladas. Por el contrario, en la investigación no experimental, los investigadores tienen escasa o ninguna influencia sobre estas condiciones. Ello es un obstáculo severo para el estudio de las relaciones causales. Por lo tanto, en los estudios etiológicos el planteamiento experimental tiene muchas más ventajas que el no experimental. Lo más decisivo es la posibilidad de randomizar a los sujetos, lo cual sólo puede realizarse en la investigación experimental. El término randomización significa que los sujetos, animales o personas, son asignados de forma aleatoria al grupo expuesto y al grupo no expuesto. El objetivo de la randomización es eliminar los errores sistemáticos debidos a las características propias de los sujetos, tales como la edad, factores genéticos y estado nutritivo. Si la randomización tiene éxito, estas variables se distribuirán simétricamente entre los dos grupos. Cuanto más extensos sean los grupos, mayor será la probabilidad de éxito en la randomización. Sin embargo, si los grupos son pequeños, dicha distribución puede fallar debido al azar. Es como lanzar una moneda 100 veces o sólo 10. En el primer caso, la probabilidad de una distribución equitativa entre caras y cruces es mayor que en el segundo. En la investigación no experimental las condiciones de validez del estudio deben crearse mediante otros métodos. Si los errores
8
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
sistemáticos no se pueden evitar, se obtendrán unos resultados distorsionados y su interpretación será difícil e incluso, a veces, imposible. Estos problemas serán tratados en el Capítulo 5. Aunque los experimentos generalmente tienen más fuerza para establecer relaciones causales que los estudios no experimentales, la epidemiología todavía tiene, por muchas razones, un papel importante en la investigación médica. En primer lugar, es más natural estudiar las enfermedades humanas en los propios seres humanos. En segundo lugar, en los seres humanos los experimentos que conlleven exposiciones perjudiciales rara vez son aceptables desde el punto de vista ético. Por otro lado, en Medicina Ocupacional son escasos los problemas que pueden estudiarse con experimentación humana. En tercer lugar, muchas enfermedades relacionadas con el trabajo requieren años e incluso décadas para desarrollarse. Y experimentos de tan larga duración no son factibles. Cuarto, no hay modelos animales apropiados para ciertas enfermedades, como por ejemplo, los trastornos lumbares, que por consiguiente deben ser estudiados en los propios seres humanos. Por último, la extrapolación desde los animales de experimentación a los seres humanos está plagada de problemas debido a las diferencias existentes en la estructura genética, metabolismo, conducta y otros aspectos. Tales consideraciones explican por qué la investigación epidemiológica ha sido, y es aún, una fuente importante de conocimiento médico, y la Medicina Ocupacional no es una excepción. Los seres humanos se hallan expuestos continuamente a una gran variedad de factores biológicos, químicos y físicos en su ambiente de trabajo. Aunque la meta de la Medicina Ocupacional es crear unas condiciones saludables en el trabajo, no puede negarse el hecho de que persisten tales exposiciones. Los niveles de exposición en los distintos lugares de trabajo son, en general, de mayor magnitud que los que tienen lugar en el ambiente general. De este modo, los trabajadores industriales pueden servirnos de modelo para el estudio de los efectos de los factores ambientales. La oportunidad de extrapolar los conocimientos toxicológicos y de otro tipo a la población en general, permite atribuir a la Medicina Ocupacional, incluida la epidemiología, una perspectiva más amplia que la que presupone el mismo campo. Desafortunadamente, este hecho con frecuencia es olvidado por los investigadores y administradores con actividades en el área de la salud pública. No tiene sentido desapro-
INTRODUCCIÓN
9
vechar las situaciones de exposición creadas por la sociedad industrial, aunque desde el punto de vista científico las condiciones no sean las ideales. NIVELES DE LA INVESTIGACIÓN EPIDEMIOLÓGICA Ya hemos afirmado antes que la Epidemiología desempeña un papel importante en la administración de Salud Pública como base para la adopción de decisiones. Por otro lado, la investigación epidemiológica es decisiva en el estudio científico de las relaciones de ocurrencia entre las manifestaciones de las enfermedades y sus determinantes. Los métodos de investigación en estas dos áreas difieren en algunos puntos. La investigación epidemiológica generalmente se clasifica en: (1) epidemiología descriptiva, (2) epidemiología etiológica (analítica) y (3) epidemiología de intervención (experimental). Se podría discutir si la epidemiología de intervención debe hallarse al mismo nivel jerárquico que las otras dos categorías. La epidemiología de intervención puede ser considerada como uno de los métodos para resolver problemas etiológicos. Siguiendo esta línea de pensamiento, la clasificación de la epidemiología de intervención en un tercer nivel podría conducir a una confusión conceptual entre los objetivos del estudio y la metodología. Sin embargo, las intervenciones pueden también reducir la frecuencia de enfermedad en una población, aunque sólo tengan objetivos prácticos (de salud pública). La epidemiología descriptiva se interesa por la presencia de la enfermedad o de sus manifestaciones en poblaciones diferentes, sin ningún propósito de interpretación causal de asociaciones. Sería interesante conocer, por ejemplo, la relación entre edad y dolor lumbar, o entre cefaleas y el hecho de trabajar en ciertos departamentos de una fábrica, sin ninguna ambición de interpretación causal. Alguien puede estar interesado en conocer la frecuencia de hipertensión arterial en un lugar de trabajo, con la finalidad única de determinar los recursos necesarios para la implantación de un programa de control de la misma. En el ámbito de la Salud Ocupacional, los estudios descriptivos pueden, por ejemplo, tratar sobre los diagnósticos de lugares de trabajo o de grupos ocupacionales, la identificación de problemas de salud relacionados con el trabajo, la mo-
10
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
nitorización de los cambios en las condiciones de trabajo, y la determinación de los valores normales para las variables bioquímicas o para concentraciones de xenobióticos (productos químicos extraños) en el organismo humano. Se dice a menudo que la epidemiología descriptiva puede generar hipótesis para la investigación etiológica. Sin embargo, en este caso, el límite entre «descriptivo» y «etiológico» no está claro. La epidemiología etiológica investiga la causalidad de la relación de ocurrencia entre enfermedades y factores genéticos o ambientales (los determinantes). La relación más simple es la asociación cruda, que significa que los factores que la distorsionan o la modifican todavía no han sido identificados. Una asociación cruda no da una imagen completa, o ni siquiera correcta de la relación de ocurrencia. Una relación puede modificarse por muchos factores, por ejemplo, la inmunidad o la susceptibilidad, otros determinantes concomitantes de la enfermedad y muchos más. Estos modificadores del efecto también deben medirse y sus efectos ser valorados para obtener una imagen más completa de la naturaleza de la relación de ocurrencia. Además, esta relación puede distorsionarse por factores extraños, errores sistemáticos como los llamados de confusión (Capítulo 5), que deben controlarse en el estudio para reflejar la correcta naturaleza de la relación. Tanto los modificadores de efecto como los de confusión deberían ser valorados y tenidos en cuenta en el estudio de las relaciones causales. Debemos hacer hincapié en que la causalidad de una relación no puede observarse directamente; debe inferirse, y las inferencias son abstractas. La epidemiología cualitativa se ocupa de la existencia real de una relación de ocurrencia entre dos fenómenos, el factor determinante y la enfermedad. Investiga si una determinada exposición causa cierta enfermedad. En Medicina Ocupacional, la epidemiología cualitativa investiga la relación entre exposiciones ocupacionales (en un sentido amplio), por un lado, y enfermedades, síntomas y trastornos funcionales, por otro. La mayoría de las enfermedades tienen múltiples causas y uno de los objetivos principales es ver si los factores relacionados con el trabajo son una de las causas de las enfermedades multicausales. Una vez que ya se ha establecido su conexión cualitativa, la epidemiología cuantitativa investiga las relaciones dosis-efecto y dosisrespuesta existentes entre exposición y enfermedad; es decir, cuánta
INTRODUCCIÓN
11
enfermedad es causada por diferentes niveles y duraciones de la exposición. En Medicina Ocupacional, este tipo de investigación se utiliza mayoritariamente con el fin de establecer bases científicas para normas y estándares higiénicos. La epidemiología de intervención, cuando se aplica para resolver problemas etiológicos, estudia los efectos de los cambios de las condiciones de exposición en la morbilidad. La epidemiología de intervención tiene cierta semejanza con la investigación experimental (de ahí que se le llame a menudo epidemiología experimental), pero mientras no se pueda llevar a cabo la randomización, difiere en su aspecto principal de la verdadera investigación experimental. (Los ensayos clínicos, uno de los tipos de epidemiología de intervención, son verdaderos experimentos.) La epidemiología experimental se puede utilizar para estudiar si la asociación observada entre dos fenómenos es realmente causal. Si un cambio en la exposición cambia la morbilidad, la probabilidad de causalidad en la relación es más plausible. Mediante métodos epidemiológicos de intervención también se puede estudiar la eficacia de programas de asistencia sanitaria. Son pocos los estudios de intervención publicados en el terreno de la Medicina Ocupacional. CAUSALIDAD Es importante darse cuenta de que, a pesar de que exista una asociación entre dos fenómenos, la conexión no puede interpretarse automáticamente como causal. Una asociación puede ser causal, ser debida a sesgo o al azar, o ser únicamente aparente. Toda la investigación etiológica, tanto experimental como no experimental, investiga si un fenónemo (la enfermedad) tiene realmente su causa en otro (la exposición), es decir, si la asociación observada es causal. En Medicina, el objetivo de establecer la causalidad entre una enfermedad y sus factores determinantes es aprender sobre la etiología de dicha enfermedad. Es razonable prevenir una enfermedad eliminando las causas cuando se conoce su etiología; tal es el caso de una exposición ocupacional tóxica. En caso contrario, la prevención será fortuita, aunque existen casos de prevención con éxito sin el conocimiento de la causa exacta. Así por ejemplo, John Snow, o quien fuese en aquella ocasión, no conocía la existencia
12
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
del vibrión colérico cuando logró detener la epidemia de cólera en Londres en 1855. Una asociación observada puede ser causal, sesgada, aleatoria o aparente.
Una asociación entre dos fenómenos, A y B, aparte de ser causada por error sistemático o por circunstancias aleatorias, puede ser causal o puede reflejar una asociación estadística sin causalidad. Si A causa B, A es la verdadera causa de B. Por ejemplo, el consumo de cigarrillos, A, causa cáncer de pulmón, B. Si «eliminamos» el tabaco (es decir, que nunca ha ocurrido o ha cesado), la posibilidad de ocurrencia de cáncer de pulmón es menor. Al contrario, el incremento en el consumo de cigarrillos incrementa la posibilidad de un cáncer de pulmón. A veces, una exposición, A, causa tanto una enfermedad, B, como otros fenómenos, C o D, que desprovistos de cualquier efecto etiológico pueden estar asociados a B. En esta situación, la enfermedad, B, se halla estadísticamente asociada con C y D a pesar de que ninguna de estas variables es causal para B. Por ejemplo, el consumo de cigarrillos, A, puede producir una coloración amarillenta en los dedos, C, y además el hábito de fumar se asocia con el hecho de llevar cerillas, D. Por ello, el color amarillo en los dedos puede asociarse estadísticamente con el cáncer de pulmón y lo mismo el hecho de llevar cerillas, aunque no son la causa del cáncer. Lavarse los dedos con un detergente fuerte o abandonar el hábito de llevar cerillas no previene el cáncer de pulmón. Especialmente en el caso de enfermedades agudas pueden establecerse asociaciones estadísticas entre enfermedad y anormalidades en los parámetros bioquímicos sanguíneos. A veces es difícil valorar si estas anormalidades son causa o consecuencia del proceso agudo. En otras palabras, ¿B causa A o B es consecuencia de A? Distinguir entre asociaciones causales y no causales es primordial al hacer inferencias etiológicas en investigación. Tal como se ha mencionado antes, el investigador debe asegurarse de que la asociación observada no presente sesgo, es decir que no pueda ser ex-
INTRODUCCIÓN
13
plicada por un error sistemático (ver el Capítulo 5). También debe existir una alta probabilidad de que no sea debida al azar (ver los Capítulos 5 y 9). Sin embargo, el concepto de causalidad es más complejo que todo esto. Una causa puede conducir a un efecto pasando por varios pasos intermedios, por lo que puede hablarse de «cadena causal». La cadena causal puede expresarse como A → B → C → D → E, donde A es la exposición, E la enfermedad y B, C, y D los precursores de la enfermedad. Ejemplo 1. Supongamos que los mineros que estuvieron fuertemente expuestos al polvo de cuarzo entre 1900 y 1920 presentan un exceso de mortalidad debido a insuficiencia ventricular derecha (cor pulmonale). La cadena causal tiene los siguientes pasos: el polvo de cuarzo, A, causa fibrosis pulmonar, B, que provoca deterioro restrictivo de la función pulmonar, C, que a su vez incrementa la tensión de la arteria pulmonar, D, que causa insuficiencia ventricular derecha, E. Se conocen cadenas causales similares para muchas enfermedades, aunque pueden no llegar a conocerse todos los pasos intermedios. Ciertas enfermedades pueden tener etiologías que son «redes causales» en lugar de cadenas, tal como expone Friedman en su libro Primer of Epidemiology5. La enfermedad coronaria y los trastornos lumbares son buenos ejemplos de enfermedades con «red» etiológica. La relación causa-efecto puede tomar forma de cadena o de red.
El concepto de causalidad basada en redes implica varias causas, que no sólo producen la enfermedad de forma conjunta, sino que también interaccionan unas con otras. La multicausalidad es, pues, un fenómeno complejo y existen causas de muchos tipos diferentes. Una causa suficiente de una enfermedad es algo concreto de lo que siempre resulta la aparición de la misma. Las causas suficientes generalmente son complejas y están constituidas por varios componentes; es raro encontrar causas suficientes simples. La exposi-
14
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
ción exclusiva al virus de la gripe no es suficiente para la aparición de la gripe, por ejemplo, cuando la persona expuesta es inmune debido a una reciente infección o a la vacunación. El otro componente de la causa suficiente para que surja la enfermedad es, pues, la susceptibilidad. La mera exposición al plomo es una causa suficiente para la intoxicación por plomo solamente si el nivel de exposición es suficientemente elevado (a bajos niveles de exposición, la resistencia media de algunos individuos expuestos es elevada y les protege de la intoxicación). En Toxicología, «suficiente» es un concepto relativo que depende tanto de la dosis como de la resistencia de cada individuo. De una causa suficiente siempre resulta la aparición de la enfermedad.
Por otro lado, la exposición a ciertos agentes tóxicos, como el plomo, siempre es una causa necesaria para la aparición de la enfermedad. Si no hay exposición, la enfermedad en cuestión no puede surgir. En otras palabras, la intoxicación por plomo no puede desarrollarse en ausencia de exposición al plomo, mientras que de la exposición al plomo no siempre resulta una intoxicación por plomo (si la exposición es débil o si el sujeto tiene una gran resistencia). «Suficiente» y «necesario» son pues conceptos totalmente diferentes. Si se elimina una causa necesaria se puede prevenir el desarrollo de la enfermedad sin ejercer influencia sobre los otros componentes de la causa suficiente. Una enfermedad no puede surgir sin una causa necesaria.
Tal como se ha dicho anteriormente, hay muy pocas causas suficientes que no sean complejas. Aunque no hay duda de que el consumo de cigarrillos provoca cáncer de pulmón, sólo una minoría de fumadores contrae la enfermedad. No todos los individuos expuestos a Mycobacterium tuberculosis adquieren una tuberculosis. La exposición a disulfuro de carbono provoca ataques coronarios solamente en algunos de los individuos expuestos. Un solo fac-
INTRODUCCIÓN
15
tor —como la exposición a un agente contagioso o tóxico— no es suficiente para la aparición de la mayor parte de las enfermedades. Una causa, para ser suficiente, necesita como norma muchos componentes, a menudo de distintos tipos. Estos componentes o partes pueden llamarse causas contributorias, y diversas causas contributorias constituyen una causa suficiente. Supongamos que cualquiera de las siguientes combinaciones lleva a la aparición de la enfermedad X: A+B+C+D o A+B+E+F o A+C+G+H Cada combinación es una causa suficiente para X. A, que es un componente de todas las combinaciones, es una causa necesaria (¡pero no suficiente!) para el desarrollo de X. Suponiendo que varias causas suficientes operen en una población (por ejemplo, consumo de tabaco, exposición ocupacional a hidrocarburos policíclicos aromáticos y exposición doméstica a los derivados del radón en relación con el cáncer de pulmón), puede calcularse la contribución relativa o fracción etiológica de cada una de ellas (ver el Capítulo 4). La fracción etiológica se define como la fracción de casos cuya enfermedad ha sido provocada por la exposición, o la cifra total de enfermedad causada por cada factor causal. Las interacciones entre distintas causas contributorias pueden ser aditivas o multiplicativas. Debido a complicados patrones de interacción y solapamiento, la suma de las causas contributorias aisladas usualmente excede el 100%; de hecho, su límite más bajo es el 100% y el más elevado puede ser cualquier cifra superior (por ejemplo, ver citas 2 y 8). Tomemos como ejemplo una avalancha, cuya causa necesaria es la nieve; por lo tanto el 100% de las avalanchas están provocadas por la nieve. Sin embargo, la nieve no es una causa suficiente, porque también se necesita una pendiente pronunciada, que es otra causa necesaria, aunque no suficiente. Así que puede decirse también que el 100% de todas las avalanchas son
16
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
provocadas por pendientes empinadas. Además es bien sabido que la nieve en estas pendientes no siempre ocasiona avalanchas. La nieve debe tener unas características determinadas, tales como una cierta composición cristalina; el papel que tiene la temperatura también es importante, y a menudo es necesario un evento desencadenante, como un ruido fuerte o un esquiador que cruza la pendiente. La suma de las partes de estas causas contributorias forma de manera conjunta la causa suficiente de la que resulta la avalancha, y que excede en mucho el 100%. El patrón causal de muchas enfermedades es similar. Un factor etiológico determinado puede tener distinta fuerza de morbilidad según los efectos concomitantes de otros factores. Estos factores reciben el nombre de modificadores del efecto y actúan, como su nombre indica, modificando los efectos. Por ejemplo, el consumo de tabaco modifica el efecto de la exposición al asbesto en la incidencia de cáncer de pulmón: de hecho la multiplica. De forma parecida, muchas sustancias y gases irritantes provocan comparativamente más irritación bronquial en los fumadores que en los no fumadores. Como resultado de una modificación del efecto, la pendiente de la curva exposición-respuesta cambia. LAS HIPÓTESIS EN LA INVESTIGACIÓN EPIDEMIOLÓGICA Una hipótesis representa un elemento tentativo de conocimiento científico o una asunción sobre la naturaleza de alguna cosa. Puede pensarse en ella como parte de una teoría, que sería un elemento «más grande». En la investigación epidemiológica las hipótesis generalmente se refieren a fenómenos de causa-efecto, es decir, se asume que la exposición A causa la enfermedad B. Una hipótesis científica debe ser contrastable, lo que significa que la corrección o incorrección de sus consecuencias puede ser verificada (o falseada) públicamente. Las hipótesis que no cumplan esta premisa deben ser rechazadas o modificadas de forma alternativa y contrastarse de nuevo. La historia de la Medicina está llena de ejemplos de falsas hipótesis y teorías que tuvieron deletéreas consecuencias para los enfermos, antes de que las concepciones erróneas fueran contrastadas científicamente, rechazadas y enterra-
INTRODUCCIÓN
17
das. Basta mencionar algunos casos, como la creencia (aquí se duda en usar la palabra «hipótesis») en los efectos curativos de la flebotomía; que los focos de inflamación fuesen la causa de una serie de enfermedades reumáticas, renales y otras; que el descanso prolongado en cama es beneficioso para muchas enfermedades, como el infarto de miocardio; que ciertos preparados médicos tengan algún efecto curativo; y la hipótesis (aquí quizás podamos permitirnos dicho término) de que la leche protege de la intoxicación por plomo, y así sucesivamente. Las hipótesis generalmente se rechazan o se modifican a raíz de nuevos descubrimientos o por ensayos clínicos bien diseñados u otros estudios. La investigación epidemiológica también tiene un lugar en este proceso. Una hipótesis científica debe ser contrastable.
La investigación epidemiológica etiológica se lleva a cabo, con frecuencia, para comprobar hipótesis que postulan que algún factor causa una determinada enfermedad. En Epidemiología Ocupacional, usualmente, el objetivo consiste en revelar una conexión causal entre una exposición ocupacional y una enfermedad no específica. En general, la enfermedad es multifactorial; el factor relacionado con el trabajo es uno solo entre varios, lo cual significa que no es una causa suficiente. Si este factor es una causa suficiente, la causalidad es tan evidente y en general tan conocida, que no es necesario ningún estudio epidemiológico. Las enfermedades ocupacionales desconocidas provocadas por nuevos productos químicos pueden constituir una excepción; en este caso se necesita un estudio epidemiológico para mostrar, por primera vez, la relación existente. Se ha dicho que la investigación etiológica consiste en la prueba de una hipótesis en estudio. Por otro lado, también evalúa la hipótesis en estudio en relación con su opuesta, la hipótesis nula. Bajo la hipótesis nula no existen diferencias entre los grupos en estudio, en contraste con lo que postula la hipótesis en estudio. Si el resultado del estudio no va a favor de la hipótesis nula, sino más bien a favor de la hipótesis en estudio, la credibilidad de esta última aumenta. Al contario, si el resultado es favorable a la hipótesis nula,
18
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
la credibilidad de la hipótesis en estudio disminuye. Si el resultado está de acuerdo con ambas hipótesis, el estudio no es valorable. Si por el contrario, los resultados no están de acuerdo con ninguna de las hipótesis, entonces hablan a favor de una segunda hipótesis alternativa no nula6. La investigación epidemiológica también puede llevarse a cabo sin ninguna hipótesis previa. Por ejemplo, pueden explorarse los factores asociados a una determinada enfermedad o, de forma alternativa, estudiarse los distintos trastornos provocados por cierta exposición. (La jerga epidemiológica se refiere a este tipo de estudios como «ir de pesca».) La forma más sencilla de plantear una hipótesis científica es «la exposición A provoca la enfermedad B»; por ejemplo, la exposición al asbesto provoca carcinoma bronquial. Las hipótesis también pueden combinarse de la siguiente manera: «la exposición A causa las enfermedades Bi, B2, ..., Bi»; por ejemplo, la exposición al asbesto causa carcinoma bronquial, mesotelioma pleural,..., y asbestosis. La hipótesis también puede formularse como «la enfermedad B tiene su causa en los factores (exposiciones) A1 A2,..., Ai»; por ejemplo, el carcinoma bronquial tiene su causa en el consumo de cigarrillos, la exposición al asbesto, a cromados,..., y a emanaciones de polvo de las fundiciones. Existe una diferencia conceptual entre tales formulaciones de hipótesis y los estudios puramente exploratorios sin ninguna hipótesis previa, como «exploremos los factores asociados con la enfermedad B». Tanto si se ha formulado una hipótesis previa como si no, en el análisis estadístico se deberá escoger entre pruebas unilaterales o bilaterales y el peso que se da a un determinado valor de p. Una constelación completamente inespecífica puede plantearse de la siguiente manera: «las exposiciones Ai, A2, ..., A¡ causan las enfermedades B1 B2,..., B¡». Por ejemplo, en un trabajador de una fundición, la exposición al plomo, arsénico, níquel, cobre, zinc, cadmio y dióxido de azufre causa carcinoma bronquial, carcinoma gástrico, carcinoma de próstata y enfermedad coronaria. Esto no constituye un conjunto de hipótesis que contrastar, sino más bien una generación de hipótesis, y el desarrollo de un estudio válido y eficiente para dicha constelación puede ser irrealizable. En la práctica pueden contrastarse varias hipótesis en el marco del mismo estudio. Por ejemplo, un estudio de casos y controles (ver
INTRODUCCIÓN
19
el Capítulo 4) puede diseñarse para el estudio de una hipótesis específica, como es el tema de la exposición a hidrocarburos clorados y cáncer hepático. Si se dispone del historial completo de exposiciones de estos individuos, pueden contrastarse también otras hipótesis; por ejemplo, si la exposición a pesticidas causa cáncer hepático. Incluso se pueden usar otros tipos de cáncer como enfermedad control e investigar los efectos de alguna otra exposición sobre esta enfermedad, usando entonces los casos de cáncer de hígado como controles. Aunque todo ello se lleva a cabo como un solo estudio, formalmente el estudio comprende distintos subestudios separados, cada uno de ellos con su propia hipótesis. BIBLIOGRAFÍA 1. Case, R.A.M, M.E. Hosker, D.B. McDonald, y J.T. Pearson. «Tumours of the urinary bladder in workmen engaged in the manufacture of certain dyestuff intermediates in the British chemical industry, part I». Br. J. Ind. Med. 11:75(1954). 2. Colé, P. y F. Merletti. «Chemical agents and occupational cancen». Environ. Pathol. Toxicol. 3:399 (1980). 3. Dolí, R. «The causes of death among gas workers with special reference to cáncer of the lung». Br. J. Ind. Med. 9:180 (1952). 4. El Batawi, M.A. «Work-related diseases: a new program of the World Health Organisation». Scand. J. Work Environ. Health, 10:341 (1984). 5. Friedman, G. Primer of Epidemiology (New York: MacGraw-Hill, 1974). 6. Miettinen, O.S. Theoretical Epidemiology: Principies of Occurence Research in Medicine (New York: John Wiley & Sons, 1985). 7. Pirchan, A. and H. Sikl. «Cáncer of the lung in the miners of Jachymov (Joachimsthal)». Am. J. Cáncer 15:681 (1932). 8. Rothman, K.J. Modern Epidemiology (Boston: Little Brown and Company, 1986). Existe versión en castellano: Epidemiología moderna (Madrid: Ed. Díaz de Santos, 1987). 9. WHO Expert Committee. «Identification and control of work-related diseases». Report of a WHO Expert Committe. WHO, Ginebra, 1985, Tech. Report ser. 714.
2 Algunas medidas epidemiológicas básicas
Desafortunadamente, la terminología epidemiológica es variada e imprecisa. Esta situación deriva de una inexactitud tanto conceptual como lingüística. El objetivo del presente capítulo es definir y describir algunas medidas epidemiológicas habituales, sobre todo las que son relevantes para la Medicina Ocupacional. Para muchas medidas existe más de un término, que puede poseer o no idéntico significado. Como norma sólo se presenta un término para cada medida, pero cuando la terminología paralela es prevalente, entonces se indican también los sinónimos.
TASAS CRUDAS En el Capítulo 1 se definió la Epidemiología como la disciplina de la ocurrencia de las enfermedades en las poblaciones humanas. Los epidemiólogos distinguen dos tipos principales de poblaciones. Es una población dinámica aquella que tiene rotación de individuos. La población de una ciudad o los empleados de una fábrica constituyen buenos ejemplos. La gente se traslada a una ciudad o se emplea en una fábrica, o se va de la ciudad o deja su empleo; los individuos nacen y mueren. Tal población posee rotación; es dinámica. El otro tipo de población es una cohorte. Sus miembros han sido definidos en un cierto punto en el tiempo, por ejemplo, al nacer, o al inicio de la investigación, y permanecen en la cohorte para 21
22
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
siempre, incluso después de muertos. En consecuencia, en una cohorte no hay rotación de individuos; se trata de una población fija. Las enfermedades se desarrollan en ambos tipos de población. La ocurrencia de enfermedades significa, por un lado, la prevalencia o existencia de una situación particular en una población en un punto determinado del tiempo («tener la enfermedad»), o alternativamente, puede significar la incidencia o aparición (o desaparición) de un estado particular en una población durante un período de tiempo («contraer la enfermedad» o «curarse»). Ambas medidas pueden ser crudas (por ejemplo, referidas a toda la población) o específicas (por ejemplo, referidas a distintos segmentos de la misma, como grupos de edad). Prevalencia Ya que la prevalencia mide la presencia de estados de enfermedad en una población —no en individuos—, cuanto más larga sea la duración de la enfermedad o condición, mayor sentido tendrá la prevalencia. Eventos agudos, como la muerte súbita, no pueden medirse de ningún modo mediante la prevalencia. Los estados a que nos referimos incluyen condiciones permanentes (por ejemplo, grupos sanguíneos, invalidez), o enfermedades crónicas, como silicosis o diabetes. La palabra crónica no significa necesariamente irreversible o incurable, sino solamente que permanece mucho tiempo. Por ejemplo, en una empresa de madera los trastornos de la espalda provocan que el 7% de los hombres se hallen de baja laboral en un determinado día. La prevalencia de este trastorno es entonces de un 7% durante este día. A pesar de que la espalda puede ser dolorosa durante largo tiempo, este trastorno generalmente mejora. La prevalencia se expresa normalmente como la tasa de prevalencia (TP), es decir, la proporción de personas enfermas en una población en un determinado punto en el tiempo, o
Al ser una proporción, la TP es adimensional. Generalmente se expresa como el número de casos de enfermedad por cada 100.000,
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
23
10.000 o 1.000 personas, dependiendo de la frecuencia de la enfermedad. Ejemplo 1. Se efectúa un cribaje de diabetes en una fábrica. Supongamos que se diagnostican 23 casos entre los 2.473 empleados. Supongamos también que todos los empleados han sido sometidos al cribaje. La TP de la diabetes en esta empresa sería de 23/2.473 = 93/10.000 = 0,0093 = 0,93%. Esta información puede utilizarse para la planificación de visitas regulares, aunque deberían tenerse en cuenta factores tales como la edad, sexo y raza para proporcionar información más específica de la ocurrencia de la enfermedad. La tasa de prevalencia cuantifica la proporción de individuos con una enfermedad en la población en estudio
Anteriormente se distinguía entre prevalencia puntual y prevalencia de período, por ejemplo, durante un año. Sin embargo, la prevalencia de período es un concepto difuso. Se obtiene al sumar la incidencia acumulada (ver más adelante) durante el período en cuestión y la prevalencia puntual existente al principio del período. Una distinción tan formal no tiene sentido en investigación epidemiológica porque en la práctica muy pocos estudios pueden medir algo durante un corto lapso de tiempo (por ejemplo, un día). De ahí que el concepto de «prevalencia» se refiera generalmente a aquello que se detecta durante el período de estudio, sin hacer distinción entre lo que había al principio y lo que ha aparecido más tarde. Si la condición es estable, apenas hay diferencia entre la prevalencia puntual y la de período; si la duración de la enfermedad es corta, entonces la diferencia aumenta. Se necesita, por lo tanto, un cuidadoso diseño del estudio para describir la prevalencia de manera que sea significativa para lo que pretende el estudio. La prevalencia de una enfermedad no debe interpretarse necesariamente como una cuestión del todo o nada. Por ejemplo, podemos clasificar la enfermedad en subcategorías de gravedad como leve, moderada, o grave, pongamos por caso para la hipertensión, y estudiar la prevalencia de estos estados por separado, por ejemplo, en relación con la exposición al ruido.
24
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Incidencia Cuando una persona contrae una enfermedad, él o ella pasa del segmento saludable de población al segmento enfermo (respecto a una enfermedad específica), o incluso sale fuera de éste si la enfermedad es mortal y la población dinámica. En una población, este movimiento de individuos del estado de salud al de enfermedad se describe mediante la incidencia, que es una medida de la ocurrencia de nuevos casos de enfermedad en la población en un período de tiempo. La incidencia puede expresarse de dos maneras. La tasa de incidencia (TI), llamada también densidad de incidencia (DI), describe el número de nuevos casos de una enfermedad en una población durante un período de tiempo respecto al total de individuos de la población. Su dimensión es tiempo"1.
El número de individuos que componen la población del denominador puede ser, tanto su cifra media durante el período de estudio, como su tamaño en la mitad del período. Si la población es especialmente extensa, como la población de un país entero o de su capital, lo más factible es utilizar su tamaño en la mitad del período de estudio. Ejemplo 2. Los obreros de una fundición de metal estuvieron bajo observación durante 8 años. Durante ese período se diagnosticaron 53 nuevos casos de intoxicación por plomo. Durante el estudio hubo una continua rotación de trabajadores, pero además la fundición se expandió e incrementó su número de trabajadores. Supongamos que el número de trabajadores fuera de 520 al inicio del seguimiento y que aumentase equilibradamente hasta 680. La tasa de incidencia se calculará de la siguiente manera: Nuevos casos: 53 Tamaño medio de la población: (520 + 680)/2 = 600 Tiempo de seguimiento: 8 años TI = 5 3/(600x8) = 0,011/año
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
25
El tamaño de una población dinámica normalmente no es constante durante todo el tiempo y tampoco cambia de forma estable como en el ejemplo 2. Por otro lado, una cohorte puede definirse de manera que se pueden permitir nuevas entradas durante un período de tiempo, por ejemplo, 10 años. Entonces el denominador puede construirse, primero, calculando el período de tiempo «en riesgo» para cada individuo y, después, sumando los tiempos individuales. El tiempo en riesgo para cada persona comienza el primer día de seguimiento y se define como el número de años o meses en que él o ella se halla en observación y constituye un candidato para el evento. El seguimiento finaliza cuando el individuo sufre el primer ataque de la enfermedad (entonces ya no estará más «en riesgo»), o cuando se termina el estudio. Así, el denominador estará formado por la suma de los períodos de seguimiento de todos los individuos en estudio.
Generalmente el tiempo se expresa en personas-año, pero si el seguimiento es corto, es más factible utilizar personas-mes. Siempre que la enfermedad se manifieste una vez finalizada la exposición (por ejemplo, cáncer), deben calcularse las personas-año independientemente de si el sujeto fue apartado o no de la exposición, ya fuese una tarea, ocupación, área geográfica u otra. Por el contrario, si el hecho de interés es súbito y relacionado en el tiempo con una exposición continuada (por ejemplo, un accidente o una intoxicación aguda), no es pertinente el cálculo de las personas-año una vez ha terminado la exposición del sujeto. En el primer caso la población se estudiará mejor como una cohorte, y en el segundo como una población dinámica. A veces el problema estriba en saber si varios ataques de la enfermedad en un mismo individuo deberían contabilizarse como incidencia. La respuesta es «No». Sólo se debe tener en cuenta el primer ataque. Si hablamos de un primer ataque de intoxicación por plomo como en el ejemplo 2, los trabajadores son candidatos a contraer la intoxicación únicamente hasta el momento en que se han intoxicado, no durante el estado de intoxicación, o después de su curación. Sin embargo, también se podría hacer un estudio so-
26
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
bre la recurrencia de la intoxicación por plomo entre aquellos que ya han sufrido un episodio. Entonces, solamente los que se han recuperado del primer ataque son candidatos a la recurrencia. Tomando las cifras del ejemplo 2, la población en riesgo sería 53 y no 600, y la relación personas-año no debería calcularse desde que empiezan a trabajar sino a partir de que el trabajador vuelve al trabajo después del primer episodio. En ambos casos, la incidencia se define del mismo modo, es decir, como la ocurrencia del evento en cuestión entre aquellos individuos que pueden adquirirlo, los candidatos. Ejemplo 3. Supongamos que a comienzos de 1991 se investiga los casos de cáncer de pulmón en una fundición de hierro y que el seguimiento empezó el 1 de enero de 1950 y finalizó el 31 de diciembre de 1989. Debemos calcular, entonces, el período de riesgo de cada trabajador de forma individual. Para mostrar cómo se calculan las personas-año, seleccionemos 10 empleados (A a J) de un total de 1.000. Supongamos que el historial de exposición de estos 10 trabajadores es el siguiente: A: Empezó a trabajar el 1 de enero de 1950 a los 20 años. Aún trabaja en la fundición. B: Empezó a trabajar el 1 de enero de 1950 a los 20 años. Dejó el trabajo en 1959. C: Empezó a trabajar el 1 de enero de 1950 a los 35 años. Se jubiló en 1980. D: Empezó a trabajar el 1 de enero de 1950 a los 20 años. Murió en 1975. E: Empezó a trabajar el 1 de enero de 1960 a los 20 años. Dejó el trabajo en 1979. F: Empezó a trabajar el 1 de enero de 1953 a los 53 años. Murió en 1967. G: Empezó a trabajar el 1 de enero de 1972 a los 20 años. Aún trabaja en la fundición. H: Empezó a trabajar el 1 de enero de 1956 a los 20 años. Trabajó durante 2 meses, lo dejó y volvió al trabajo en 1961. Volvió a dejar el empleo en 1966. I: Empezó a trabajar el 1 de enero de 1951 a los 40 años. Se jubiló en 1975 y murió en 1985. J: Empezó a trabajar el 1 de enero de 1975 a los 20 años. Aún trabaja.
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
27
Tabla 2.1. Cálculo de las personas-año para los trabajadores A-J en diferentes categorías de edad y década de observación.
Las personas-año en riesgo pueden calcularse tal como se expone en la Tabla 2.1 (no existen criterios mínimos para el empleo, no se tiene en cuenta el período de latencia, véase la discusión más adelante). El número total de personas-año en el subconjunto es 286. Como la enfermedad estudiada es el cáncer de pulmón, que tarda años en desarrollarse, las personas-año también deben calcularse después de que los trabajadores dejen el empleo (los trabajadores B, C, E, H e I), pero naturalmente no después de su muerte (trabajadores D, F e I). Si ahora suponemos que se dispone de una muestra del 1% de la cohorte, podemos decir que el número de personas-año ha sido 28.600. Si suponemos que se ha observado un número total de 15 de casos de cáncer de pulmón, se obtiene: TI = 15/28.600 años = 1/1.907 años = 52/100.000 años aproximadamente.
28
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
La incidencia también puede expresarse en términos de incidencia acumulada (IA). Esta medida es útil para poblaciones fijas (por ejemplo, cohortes). Una cohorte puede ser de tipo ocupacional, formada por trabajadores expuestos a un factor común en un cierto punto en el tiempo, o puede ser el conjunto de una población nacional nacida en un determinado año o partes de la misma. Por ejemplo, podemos estudiar la incidencia de muerte por cardiopatía isquémica durante 50 años, en los varones nacidos en Manchester en 1920, o la población de estudio puede ser una cohorte de trabajadores de una fundición como en el ejemplo 4. La IA expresa la proporción de la población que ha contraído la enfermedad en cuestión durante un determinado período de tiempo.
La IA habitualmente se expresa en forma de porcentaje; por ejemplo: el 14% de los hombres nacidos en Manchester en 1920 murieron por infarto de miocardio antes de cumplir los 50 años. Ejemplo 4. Supongamos que se estudia la incidencia de cáncer de pulmón durante 30 años, en una cohorte de 2.704 trabajadores de una fundición estudiados entre 1951 y 1980. Supongamos que han ocurrido 78 casos de cáncer. Entonces, IA30 = 78/2.704 = 0,029 = 3% aproximadamente La incidencia acumulada expresa la proporción de una población, definida al comienzo, que ha experimentado la enfermedad bajo estudio durante un período de tiempo determinado.
La IA es una función de la TI específica por unidad de tiempo y de la duración del seguimiento. Incluso si dicha TI permanece constante durante el seguimiento, la IA aumenta con el tiempo, debido a que conforme éste transcurre contraen la enfermedad más individuos. Las muertes debidas a otras causas que se han producido durante el seguimiento distorsionan la estimación de la IA, so-
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
29
Figura 2.1. Relación entre prevalencia, incidencia y duración de la enfermedad.
bre todo cuando el tiempo de seguimiento es largo; su efecto debe tenerse en cuenta. Si se asume que la enfermedad es rara entre la población en estudio, y que tanto la TI como la duración media de la enfermedad son constantes en el tiempo, existe una relación entre la prevalencia, la incidencia y la duración (Figura 2.1): P=IxD en la que P = prevalencia I = incidencia D = duración media. Ejemplo 5. Supongamos que se producen 120 casos de resfriado común entre 750 trabajadores en el mes de abril, que la
30
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
incidencia es constante y que la duración media (baja por enfermedad) es de 7 días. I =(120/750)/mes = 0,16/mes D = 7 días/30 días = 0,23 meses y
En otras palabras, un 3,7% de la plantilla laboral, o sea unos 28 trabajadores de media, se hallan de baja por enfermedad debido a resfriado común cada día del mes de abril.
Si la duración media no es constante, por ejemplo, si hay dos evoluciones diferentes de la enfermedad, una sin y otra con complicaciones, los casos prevalentes estarán sobrerrepresentados en aquella que tenga la duración más larga. De igual forma, los tipos de cáncer con evolución rápidamente mortal estarán infrarrepresentados en un programa de cribaje de cáncer. Esta distorsión puede llevar a una conclusión incorrecta sobre los beneficios de un programa de cribaje. Si se juzga el beneficio sólo a partir de comparaciones del tiempo de supervivencia de los casos detectados mediante el programa, por un lado, con los casos detectados mediante procedimientos diagnósticos iniciados a partir de los síntomas, por otro, entonces se haría un juicio demasiado optimista de la eficacia del cribaje, pues los casos con una duración más larga (desde que se detecta hasta la muerte), que son los casos con un curso más benigno, estarían sobrerrepresentados entre los casos prevalentes. En tal caso, los casos prevalentes no son representativos de todos los casos. Por el contrario, los pacientes que buscan asistencia médica porque tienen síntomas, tienen una proporción de neoplasias más alta y, en cualquier caso, una evolución más rápida. Latericia Muchas enfermedades no se manifiestan de forma inmediata sino que aparecen algún tiempo después de haberse inducido. Tar-
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
31
dan un tiempo en desarrollarse. Este período de tiempo se llama «período de inducción». Puede interpretarse como el lapso de tiempo transcurrido desde la inducción de una enfermedad crónica hasta su manifestación. Sin embargo, solamente en contadas ocasiones puede determinarse el momento exacto de la inducción de una enfermedad crónica. Por otro lado, usualmente se conoce el comienzo de la primera exposición. Así, el período de tiempo entre el comienzo de la exposición y la manifestación de la enfermedad, o «período de latencia», se usa habitualmente en los estudios epidemiológicos como sustituto del período de inducción biológica, incluso aunque desde el comienzo de la exposición no necesariamente resulte una inducción immediata. Podemos considerar el período de latencia como la suma del período de preinducción y el verdadero período de inducción. Siempre que se estudia epidemiológicamente una enfermedad crónica de evolución lenta, se debe tener en cuenta el período de latencia. Así, el número de personas-año de exposición no debería calcularse hasta que haya pasado cierto tiempo desde el inicio de la exposición. Por ejemplo, si se estudia la incidencia de cáncer de pulmón entre los trabajadores expuestos al asbesto, no debería calcularse el número de personas-año para los primeros años de exposición. Los casos de cáncer de pulmón que tengan lugar en este período no se deberían tener en cuenta, ya que este primer período será omitido del análisis. (Además, los cánceres detectados en este período reflejarían la incidencia de fondo, no el riesgo adicional ocasionado por la exposición al asbesto). En la práctica, el período de latencia empieza immediatamente después del inicio de la exposición y acaba cuando se ha diagnosticado la enfermedad.
Puesto que el período de latencia es desconocido para la mayoría de enfermedades, en los estudios epidemiológicos debe efectuarse una aproximación. A veces es posible estimar un período de latencia medio a partir de la distribución de los datos del estudio, pero para la mayoría de las enfermedades y agentes de exposición no existen suficientes datos exactos. A pesar de que se sabe que
32
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
muchos cánceres se caracterizan por tener un largo período medio de latencia, su duración exacta generalmente no se conoce. Se acostumbra a usar 20 años como media operativa. Alrededor de cada media hay una distribución de valores; por ello, sería demasiado estricto despreciar el período entero. En epidemiología del cáncer, la mitad del promedio postulado, o sea 10 años, es lo que generalmente se considera adecuado restar desde el inicio de la exposición de cada persona. Como es poco probable que la exposición en cuestión provoque cáncer durante los primeros 10 años, se considera que la persona no está aún «en riesgo» durante este período. Los casos que se detectan durante estos años probablemente se deben a otras causas («riesgo de fondo»), aunque puede haber excepciones. Estudios en supervivientes de la bomba de Hiroshima han sugerido que la leucemia tiene un período de latencia más corto. Tres o quizás cinco años constituyen una aproximación más apropiada de lo que debe tenerse en cuenta respecto al tiempo de latencia de la leucemia en los estudios epidemiológicos. Los llamados agentes promotores pueden tener incluso un período de latencia más corto (ver el Capítulo 6). Si no se conoce bien la latencia, se puede intentar valorar dos o tres períodos distintos y ver cuál de ellos produce un efecto más claro. Cuando el período de latencia es largo, el investigador debe tratar de diseñar la investigación de tal manera que la población en estudio comprenda un número suficiente de individuos con un largo período de exposición (y/o individuos cuya exposición se produjo mucho tiempo atrás), en caso contrario, el estudio será ineficiente. Si estas condiciones no pudieran cumplirse, se debería considerar seriamente el abandonar la investigación. Ejemplo 6. Supongamos que el problema que estudiar es la incidencia de cáncer de pulmón en trabajadores de sistemas de aislamiento expuestos al asbesto entre los años 1935 y 1990. El trabajador A fue contratado en 1940. Suponiendo que el período de latencia medio del cáncer de pulmón por exposición al asbesto es de 20 años, el cálculo de las personas-año empieza en 1950, porque la mitad del promedio del período de latencia asumido es de 10 años. En 1990 el sujeto ha acumulado 40 personas-año (en lugar de 50). El trabajador B fue contratado en 1981 y ha estado bajo seguimiento durante 9 años, pero como la mitad del período de latencia asumido es de 10 años, el individuo no pertenece a la población en riesgo.
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
33
Riesgo Incidencia y prevalencia son medidas de grupo (es decir, de características de poblaciones, no de individuos aislados). Riesgo denota la probabilidad de cada individuo de contraer la enfermedad en cuestión en un cierto período de tiempo (por ejemplo, un año, 10 años, toda la vida). Cuando se conoce la IA de una enfermedad se puede calcular el riesgo medio individual de los miembros de esta población. Sin embargo, como el riesgo es una probabilidad, no puede ser observado. Ejemplo 7. Supongamos que la mortalidad por enfermedad coronaria en hombres de 51-60 años de cierta población, durante un determinado período de tiempo, es del 10%. Así, el riesgo medio de cada hombre perteneciente a esta población también es del 10%. Sin embargo, los individuos mueren o siguen vivos, por lo que al final del período el concepto no tiene sentido para los supervivientes, a pesar de que la mortalidad haya sido del 10% para la población. Además, este riesgo medio es una medida cruda porque muchos factores pueden modificar el riesgo individual. Al medir dichos factores (por ejemplo, presión arterial, colesterol sérico, consumo de tabaco), se puede obtener una estimación más precisa del riesgo, habida cuenta de que se dispone de una función del riesgo basada en el estudio y que contiene de forma accesible los factores más relevantes. Riesgo es la probabilidad de un individuo de contraer una determinada enfermedad. Razón de tasas y diferencia de tasas
La TP y la TI describen la frecuencia de una determinada enfermedad en una población. Son medidas completamente descriptivas. Para que tengan un significado científico deben compararse con algún valor de referencia. La TP, la TI y la IA pueden compararse dividiendo la medida en el grupo de exposición por la de un grupo de referencia (ver también el Capítulo 4). En consecuencia, la razón de tasas (RR) es la tasa del grupo expuesto (Rexp) dividida por la tasa del grupo de referencia (Rref) o
34
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
RR = Rexp/Rref Sinónimos habituales de la razón de tasas son: «razón de riesgos» y, especialmente, «riesgo relativo». Por los motivos expuestos antes, el término «tasa» es más correcto que el de «riesgo» como medida poblacional. Ejemplo 8. Supongamos que el tema que estudiar es la tasa de mortalidad por enfermedad coronaria en los trabajadores expuestos a disulfuro de carbono. Tanto el grupo expuesto como el grupo de referencia comprenden 343 hombres al comienzo del estudio. Se asume que después de 8 años de seguimiento han muerto de enfermedad coronaria 20 hombres expuestos y 9 del grupo de referencia. Por ello,
El riesgo relativo es la tasa del grupo de expuestos dividida por la del grupo de referencia.
Si el RR es mayor que 1, la morbilidad del grupo de exposición es más elevada que la del grupo de referencia y el riesgo individual de contraer la enfermedad es, como consecuencia, más alto para cada persona expuesta que para cada una de referencia. Si el RR es menor que 1, la morbilidad en el grupo de exposición es menor y el riesgo de cada individuo expuesto es menor. Siempre que el estudio sea válido y suficientemente extenso (ver el Capítulo 5), se puede postular que la exposición en cuestión causa la enfermedad en el primer caso y la previene en el segundo. El RR es un estimado puntual («la mejor estimación») y por ello varía aleatoriamente. Si se repitiera el mismo estudio, el RR estimado seguramente sería diferente, debido a esta variación aleatoria. Para hacerse una idea de los límites de esta variación, se puede calcular un intervalo de confianza, IC, para el RR. El IC es un recorrido de valores entre cuyos límites se halla, con una determinada probabilidad, el verdadero valor del RR. Generalmente se ex-
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
35
presa como un intervalo del 95% y a veces del 99%. Sin embargo, si la hipótesis contrastada es unilateral (la exposición sólo puede causar la enfermedad, pero no prevenirla), se prefiere un intervalo del 90%. Si el límite inferior del intervalo de confianza es mayor que 1, el RR es estadísticamente significativo para el nivel de confianza escogido. El intervalo de confianza señala los límites del recorrido de la variación aleatoria del RR.
El IC95 de la IA se calcula mediante la siguiente fórmula (N número de personas):
El IC95 de la DI es (T = número de personas-año):
El IC95 del RR es:
donde Ji es la raíz cuadrada del valor χ 2 usado en la prueba de significación estadística. Ejemplo 9. En el ejemplo 8, se calculó una IA del 5,8% de enfermedad coronaria entre los trabajadores expuestos al disulfuro de carbono. El IC95 se calcula de la siguiente manera:
36
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
La medida de significación estadística para la diferencia entre los grupos expuestos y los no expuestos es χ 2 = 4,35; por lo tanto el IC95 para el RR se calcula de la siguiente manera:
Como el límite inferior es mayor que 1, la mortalidad por enfermedad coronaria entre los expuestos es estadísticamente significativa.
La diferencia absoluta entre dos medidas de morbilidad, la diferencia de tasas (DT), también conocida como diferencia de riesgos o riesgo atribuible, se obtiene restando la tasa de los expuestos de la del grupo de referencia,
El IC de la DT se calcula de la siguiente manera:
Ejemplo 10. Con las cifras del ejemplo 8, DT la = 0,058 0,026 = 0,032. En otras palabras, por cada 1000 hombres expuestos, el exceso de mortalidad en 8 años debido a enfermedad coronaria es de 32 casos (IC95 de 22 a 58). La diferencia de tasas se calcula restando la tasa del grupo de referencia de la del grupo expuesto.
Odds Ratio
Hasta ahora se han presentado las medidas típicas de los estudios de cohorte y de los transversales (ver el Capítulo 4). En los estudios de casos y controles (o de casos-referentes), no se pueden obtener estimaciones directas de la TP o de la TI. En su lugar, las comparaciones se refieren a las diferencias en las frecuencias de exposición entre casos y controles. Así, se puede calcular un estimado indirecto del RR. La estructura del diseño de los estudios de casos
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
37
y controles se presenta en el Capítulo 4. En resumen, los pacientes que presentan la enfermedad en estudio, los casos, se seleccionan a partir de la base del estudio. Una muestra de personas sin la enfermedad se utiliza como grupo de referencia; constituyen los controles o referentes. Seguidamente se recogen los antecedentes de exposición, tanto respecto a una exposición concreta, por ejemplo, los disolventes hidrocarbonados clorados, como respecto a todas las exposiciones relevantes, por ejemplo, la historia laboral al completo. A continuación se procede a clasificar y codificar las exposiciones, y los casos y los controles se clasifican como «expuestos» y «no expuestos» respecto a una exposición en un tiempo. Deben fijarse unos criterios mínimos de «exposición». Entonces, se divide el número de casos expuestos por el de no expuestos, y el número de controles expuestos por el de no expuestos. El resultado obtenido es la respectiva «odds» de haber sido expuesto en los casos y en los controles. A partir de estas «odds» se calcula la odds ratio (OR) de la siguiente manera: casos expuestos/casos no expuestos OR = controles expuestos/controles no expuestos La OR, el RR, y la DT se discuten en el Capítulo 4. MEDIDAS ESTANDARIZADAS DE MORBILIDAD La morbilidad de una población depende de sus características específicas, especialmente de su distribución de edades, sexo, grupos sociales y razas. También puede depender del momento cronológico del estudio. La edad es un importante determinante de la morbilidad, especialmente para las enfermedades degenerativas crónicas y las neoplasias. Para muchos procesos se observan tasas de morbilidad diferentes entre hombres y mujeres, tales como la enfermedad coronaria, diversos tipos de cáncer y el ulcus péptico. Para otras, en cambio, no existen diferencias por sexo, por ejemplo, para la mayoría de las enfermedades infecciosas. La morbilidad suele ser superior en los estratos sociales más bajos. En países multirraciales, como Estados Unidos, la raza también es un importante determinante de la morbilidad. En los estudios epidemiológicos lie-
38
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
vados a cabo en América, es clásico distinguir entre «blancos» y «no blancos». Las diferencias en la morbilidad encontradas entre diferentes grupos étnicos son, en gran parte, explicables por factores sociales. La religión puede ser también un factor importante; así, por ejemplo, las enfermedades relacionadas con el alcohol son raras entre los musulmanes. En los últimos 50 años, muchas enfermedades han experimentado cambios en su frecuencia. Por ejemplo, en los países desarrollados la tuberculosis ha disminuido, mientras que el cáncer de pulmón ha aumentado, al principio en los hombres y más tarde en las mujeres. En muchos países industrializados, las enfermedades coronarias aumentaron hasta entrados los años 70, en que se estabilizaron; posteriormente, en los 80 empezaron a disminuir. Estas características poblacionales deben tenerse siempre en cuenta a la hora de comparar tasas de morbilidad. Las medidas crudas describen a la población sin tener en cuenta estos aspectos. Tal como se ha mencionado antes, una tasa cruda se calcula de forma sencilla al dividir el número de casos por el número de personas o de personas-año de la población. La razón de tasas y la diferencia de tasas, ambas crudas, se calculan de acuerdo con el mismo principio. Sin embargo, debe tenerse en cuenta que las medidas crudas de dos o más poblaciones sólo pueden compararse si las características de dichas poblaciones son similares, lo cual ocurre raramente. Por lo tanto, las medidas crudas deben ser ajustadas o estandarizadas para que la comparación tenga sentido. Ajustar significa que alguna distribución, por ejemplo, las distribuciones de edades del estudio y de la población de referencia, se modifican artificialmente de forma que correspondan a una distribución común y estándar de edades. Por ejemplo, si se quiere estudiar la mortalidad de la población en estudio, primero se debe estar seguro de que la estructura de edades de esta población corresponde a la de la población de referencia. Si esto no es así, lo cual suele ser lo más frecuente, debe ajustarse. Este ajuste se llama estandarización por edad, lo que significa que la distribución por edades de ambas poblaciones son ajustadas de acuerdo con una distribución por edades común. Esta distribución común puede ser la de la población en estudio, la de referencia o una combinación de ambas. Cualquier población puede, en principio, ser usada como estándar, y muchas poblaciones pueden ser estandarizadas con la misma población estándar.
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
39
Tabla 2.2. Mortalidad de dos poblaciones hipotéticas, por ejemplo, durante 5 años.
En Epidemiología Ocupacional generalmente se prefiere como estándar la distribución por edades de la población de expuestos, debido a que en ella se produce el fenómeno de interés8. También pueden hacerse ajustes por otros factores con la finalidad de controlar el sesgo de confusión (ver el Capítulo 5). La estandarización es uno de los métodos de ajuste; puede ser directa o indirecta. El ejemplo 11 se refiere a la estandarización directa de una tasa de mortalidad. En él la estandarización se efectúa por edad, y se toma como estándar la distribución por edades de la población expuesta. La distribución estándar se aplica como peso o ponderación a las incidencias (tasas de mortalidad) de cada subcategoría de edad de la población de referencia. De esta manera, el número observado de «casos» de cada categoría de edad de la población de referencia se ha cambiado a lo que debería haber sido, si su distribución de edades hubiera sido la misma que la de la población expuesta. Las tasas pueden ahora compararse directamente para cada categoría de edad y para la población global; se obtendría la razón de tasas estandarizadas (RTE). Ejemplo 11. Supongamos que se desea comparar la mortalidad de dos poblaciones con diferente estructura de edades. Las características de estas poblaciones se muestran en la Tabla 2.2. En razón a la sencillez se utilizan dos poblaciones de igual tamaño, y con un número total de muertes similar en cada una. Las tasas crudas de mortalidad son 9,2 y 9,0 por 1.000, respectivamente. Dado que la estructura de edades de ambas poblaciones es diferente —la población de referencia es más anciana— las tasas crudas no son comparables. Para conseguir su compa-
40
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
rabilidad, se ajusta de forma artificial la estructura de edades de la población de referencia para que sea similar a la población expuesta (estandarización directa, ver más adelante), usando esta última como «estándar». El ajuste se lleva a cabo calculando el número de muertes que deberían haber ocurrido en la población de referencia si hubiese tenido, por un lado, las mismas tasas de mortalidad específicas por edad que fueron observadas en ella y, por otro, la distribución de edades de la población expuesta. Población expuesta: (0,005 x 3.000) + (0,010 x 2.000) + (0,020 x 1.000) = 55 Estas cifras son las observadas, ya que se ha utilizado la población expuesta como estándar. Población de referencia: (0,005 x 3.000) + (0,005 x 2.000) + (0,013 x 1.000) = 38 Aquí las tasas son las observadas, pero el número de personas en cada grupo de edad se ha ajustado artificialmente para que corresponda a la distribución en la población expuesta. Las tasas de mortalidad estandarizadas de forma directa pueden calcularse de la siguiente manera: Población expuesta: (55/6.000) x 1.000 = 9,2% (exactamente igual que en la Tabla 2.2) Población de referencia: (38/6.000) x 1.000 = 6,3% (usando la tasa estandarizada) RTE = 9,2/6,3= 1,46
El ejemplo 11 es un ejercicio sencillo de estandarización directa; los datos del ejemplo 12 han sido tomados de un estudio publicado (M. Numinen, comunicación personal)7. Ejemplo 12. Se compara la mortalidad por enfermedad cardiovascular en los médicos con la de otros grupos ocupacionales de igual nivel educativo. En la Tabla 2.3 se muestra cómo los casos observados de muerte se estandarizaron por el método directo. La distribución por edad de los médicos se utilizó para ponderar la distribución de las tasas de mortalidad de los otros grupos. La tasa de mortalidad cruda entre los médicos para 1000 per-
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
41
Tabla 2.3. Mortalidad por enfermedad cardiovascular en los médicos comparada con la de personal directivo y la de los abogados.
sonas-año fue de 87 x 1.000/23.080 = 3,77. La cifra correspondiente para los directivos fue de 434 x 1.000/87.490 = 4,96 y la de los abogados de 104 x 1.000/18.356 = 5,67. La tasa de mortalidad estandarizada para los directivos se calculó para cada categoría de edad utilizando la proporción de médicos que había en cada categoría como peso o factor de ponderación, de la siguiente manera: 0,0724 x (1/2.471) + 0,2079 x (5/8.755) + ... + 0,0085 x (21/939) = 0,00356 = 3,56/1.000 personas-año La mortalidad estandarizada para los abogados se calculó del mismo modo. Los resultados mostraron que las tasas de mortalidad eran bastante similares en todos los grupos ocupacionales, a pesar de que las tasas crudas diferían considerablemente.
Mientras que la estandarización directa usa unos pesos proporcionales a los tamaños de cada categoría de edad de la población «estándar», la estandarización indirecta es un método en el cual el estándar proporciona un conjunto de tasas en vez de una distribución de pesos. Este conjunto es aplicado a la distribución por edades de la población de interés, la población «expuesta». La están-
42
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Tabla 2.4.
Tasas de mortalidad crudas y estandarizadas y razón de tasas estandarizadas (RTE) para directivos y abogados comparadas con las de los médicos.
darización indirecta genera una tasa «esperada» o cifra esperada para la tasa cruda (número de casos observados en la población en estudio). La estandarización es el ajuste de dos o más tasas a una distribución común.
Ejemplo 13. Supongamos que mediante el uso de una estandarización indirecta debe compararse la mortalidad de una población expuesta a la de la población general. El número de muertes observadas y la mortalidad de ambas poblaciones se muestran en la Tabla 2.5. La razón de tasas cruda es 240/118 = 2, pero como el grupo Tabla 2.5.
Estandarización indirecta.
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
43
expuesto es más viejo que la población de referencia, la edad actúa como factor de confusión en la comparación (ver el Capítulo 5). Mediante la estandarización indirecta se puede comparar el número de casos observados en el grupo expuesto con los que habrían ocurrido, si tuviera las mismas tasas especificas por edad que la población de referencia. De 35 a 54 años: 4.711 x 73,3 x 10-5 = 3,45 De 55 a 64 años: 28.585 x 238 x 10-5 = 68,03 La suma de estas cifras esperadas es 71,48. El RR estandarizado por edad es 80/71,48 = 1,12, así que hay muy poca diferencia entre la mortalidad de las dos poblaciones. La razón estandarizada indirecta más conocida y más usada es
la razón de mortalidad estandarizada (RME). Tradicionalmente, se utiliza cuando se compara la mortalidad de un grupo expuesto con la de la población general. Se calcula de la siguiente manera: RME = O/E x 100 donde O = número de casos observados en el grupo expuesto E = número de casos esperados en la población expuesta, según la mortalidad (morbilidad) de la población de referencia Generalmente la razón O/E se multiplica por 100, y por esto la RME es 100 veces el RR. Si la RME es mayor que 100, la mortalidad en el grupo expuesto se halla aumentada. Una RME menor que 100 es más difícil de interpretar, en especial si se ha usado la población general como población de referencia, debido a que por lo general diversos factores extraños hacen disminuir la tasa de mortalidad observada entre los trabajadores. Este fenómeno, llamado «efecto del trabajador sano», se tratará en el Capítulo 5. La razón de mortalidad estandarizada es una razón estandarizada indirecta que describe la mortalidad de una población expuesta en relación con la de la población general.
44
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
Existen otras medidas de morbilidad que pueden compararse de manera similar siempre que se disponga de los valores esperados. La abreviación RME también se usa algunas veces para designar la razón de morbilidad estandarizada cuando se comparan otras medidas de morbilidad. Es preferible usar el término razón de incidencia estandarizada (RIE), que puede emplearse tanto para las razones estandarizadas de forma directa como indirecta. La RME puede calcularse tanto para la mortalidad total como para las distintas causas de muerte por separado (mortalidad por causas específicas). En general, la mortalidad total es demasiado cruda y poco específica para permitir dar sentido a la información sobre los efectos de muchas exposiciones, mientras que la RME específica de causa facilita mucha más información. A veces, una RME específica de causa puede ser muy elevada, aunque la RME para todas las causas sea menor que 100. Como ya se ha visto en el ejemplo 13, los valores esperados se calculan a partir de las tasas reales de la población de referencia (por ejemplo, estadísticas nacionales de mortalidad), que se ajustan o aplican a las cifras que correspondan de la distribución por edades de la población expuesta. El ejemplo 14 muestra el cálculo de la RME. Ejemplo 14. Koskela et al.2 estudiaron la mortalidad de una cohorte de trabajadores de fundición. Compararon la mortalidad de dichos trabajadores con la de la población general finlandesa masculina de 1967; este año fue representativo del período de seguimiento. Las cifras de mortalidad estandarizada por edad en los hombres pueden hallarse en la publicación de la Organización Mundial de la Salud, World Health Statistics Annual. En la Tabla 6 se muestra cómo se calculó la RME para todas las causas. Por ejemplo, el número de muertes esperadas para el grupo de edad de 15 a 24 años se ha calculado de la siguiente manera: 114,7 x 8.737/105 = 10,0 La RME para esta categoría es 3/10 = 0,3 = 30 y para la cohorte entera es 224/249,5 = 0,898 = 90. Como para calcular la RME específica de cada grupo expuesto se usa la propia distribución por edades del grupo como estándar,
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
45
Tabla 2.6.
Mortalidad total de los trabajadores de fundición.
no es correcto comparar directamente los valores de las RME de distintas poblaciones. Estas cifras no se hallan estandarizadas mutuamente, y los valores esperados de cada población dependen de su estructura de edades3'810. Por ejemplo, si la RME para cáncer de pulmón de una cohorte americana de trabajadores de fundición es 154 y el de una cohorte británica es 177, no puede concluirse a partir de estas cifras que el riesgo de contraer cáncer de pulmón sea más elevado en los trabajadores ingleses de fundición. Dos o más razones de mortalidad estandarizada no pueden compararse directamente porque no han sido estandarizadas mutuamente
MORTALIDAD PROPORCIONAL A veces, los registros de una población expuesta son tan deficientes que no pueden calcularse las personas-año. Entonces, no es posible calcular la RME ni cualquier otra medida absoluta de morbilidad, porque no se dispone de ningún denominador. En tal caso, no pueden ser estimadas la tasa total de mortalidad ni las tasas absolutas de mortalidad por causas específicas. Sin embargo, si se dispone de los certificados de defunción, se puede estudiar la mortalidad por causas específicas en términos relativos, comparando la
46
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
proporción de muertes debida a una causa específica en el grupo expuesto con la de la población de referencia. De ello deriva la razón de mortalidad proporcional (RMP). Generalmente se usa la población general como población de referencia. Los datos sobre la población general pueden obtenerse de las estadísticas de mortalidad nacionales (o regionales). La RMP debería estandarizarse por edad y período de tiempo. Se calcula de la siguiente manera:
donde a = número de muertes en la población expuesta debidas a la causa en estudio b = número de muertes en la población de referencia debidas a la causa en estudio c = número de muertes en la población expuesta debidas a las restantes causas d = número de muertes en la población de referencia debidas a las restantes causas Ejemplo 15. Supongamos que nos interesa conocer la mortalidad de los trabajadores de una gran industria química. Supongamos que los historiales de los trabajadores son incompletos y no permiten el cálculo de las personas-año. Por ejemplo, no se conoce con exactitud el número de trabajadores empleados en el período en estudio, de 1941 a 1980, ni tampoco el tiempo exacto en que los trabajadores empezaron a trabajar. Pero sí sabemos que en total murieron 790 trabajadores entre 1951 y 1980, y se dispone de copias de sus certificados de defunción. Según los certificados, 174 murieron de cáncer y, de éstos, 66 murieron de cáncer de pulmón. Para todos los cánceres, a = 174 y c = 790-174 = 616. Entonces, a/(a+c) = 174/790 = 0,22. Las correspondientes cifras de b y d se obtienen a partir de las estadísticas de mortalidad nacionales (o regionales), las cuales deben estandarizarse por edad para corresponder a la distribución por edades de las muertes en la población expuesta. Como el período de estudio abarca 30 años, un año no es lo suficientemente representativo y, por ello se seleccionan, por ejemplo, tres años representativos, 1955, 1965 y 1975, y la media de estos años se utiliza como valor de referencia. Supongamos que b/(b+d) = 0,18. Entonces, la RMP
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
47
= 0,22/0,18 = 1,22 (es decir, hay una relativa sobremortalidad por cáncer). La RMP para el cáncer de pulmón se calcula del mismo modo. Ahora, a = 66, c = 724 y a/(a+c) = 0,09. Si b/(b+d) = 0,06, entonces la RMP = 0,09/0,06 = 1,5. La mortalidad proporcional por cáncer de pulmón es bastante alta, pero como no sabemos si la mortalidad debida a otras causas ha sido más baja que la esperada en términos absolutos, esta interpretación debe hacerse con mucha cautela. A pesar de que la RMP es fácil de calcular y que a veces es la única alternativa, debemos conocer sus puntos débiles. Primero, incluso si la mortalidad total de la población en estudio ha aumentado, la proporción de muertes debidas a una sola enfermedad puede no ser elevada. Realmente, la tasa absoluta de esta enfermedad puede ser más alta que en la población de referencia, pero debido a que la mortalidad total también es alta, la proporción no se modifica necesariamente. En segundo lugar, la mortalidad proporcional de la enfermedad en estudio se halla influida por cambios en la mortalidad por otras causas. Si el conjunto de «c» aumenta, el de «a» disminuye, independientemente de si la exposición en estudio ha tenido o no influencia en «a». En otras palabras, si una causa de muerte está sobrerrepresentada, entonces algunas otras deberán estar infrarrepresentadas. Cuanto más frecuente sea «la otra causa», mayor será su efecto. Por ejemplo, si en una comparación basada en la mortalidad proporcional, la exposición en cuestión incrementa la mortalidad tanto de la enfermedad coronaria como del cáncer de pulmón (como es el caso del consumo de tabaco), entonces el incremento de muertes debido a enfermedad coronaria, que es una causa frecuente de muerte, enmascara la mortalidad por cáncer de pulmón. A pesar de estas consideraciones, un análisis de mortalidad proporcional puede sugerir que un factor relacionado con el trabajo aumenta la ocurrencia de una enfermedad determinada. Ejemplo 16. En la primera fase del estudio sobre los efectos de la exposición al disulfuro de carbono y la ocurrencia de 1enfermedad coronaria, analizamos la mortalidad proporcional . Hallamos que el 52% de las muertes en aquellos que habían trabajado en una fábrica de rayón viscosa desde 1945 hasta 1966 fueron debidas a enfermedad coronaria. El valor esperado de la
48
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
estandarización por edad fue sólo del 32%. Así, la RMP fue 52/ 32 x 100 = 163%, que era estadísticamente significativo. Un seguimiento prospectivo mostró que durante los primeros 5 años, de 1967 hasta 1972, se produjeron 14 muertes por enfermedad coronaria entre los expuestos, comparado con sólo 3 en el grupo de referencia. La razón de tasas fue de 4,7, también estadísticamente significativa". Este estudio se discute con más detalle en los ejemplos presentados en los Capítulos 4 y 5.
Sin embargo, en ausencia de datos que permitan el cálculo de las cifras esperadas, hay una alternativa a la RMP. En lugar de utilizar la razón de proporciones se puede calcular la razón de las odds de la enfermedad de interés4. Si se usan los mismos símbolos que con la RMP, la odds para los expuestos es a/c, y la de la población de referencia es b/d. Así, la odds ratio de mortalidad (ORM) es:
Dejando aparte la enfermedad en cuestión, si en lugar de usar todo el resto de causas, se escoge una causa específica como enfermedad de referencia que no esté causada ni prevenida por la exposición de interés, se evitan muchas incertidumbres que tienen lugar al usar todas las otras causas como referencia. Por ejemplo, la ORM es independiente del tamaño del conjunto de las otras causas de mortalidad, sobre todo si la causa de muerte de referencia se escoge con profundización en el problema en estudio. La fórmula ORM = (a/c)/(b/d) también puede expresarse como ad/bc, que equivale a la razón de tasas (ver el Capítulo 4). De hecho, el uso de la ORM en lugar de la RMP adopta el punto de vista del estudio de casos y controles, en los que a y b son los casos y c y d los controles (se discute con más detalle en el Capítulo 4). ASOCIACIONES EXPOSICIÓN-EFECTO Y EXPOSICIÓN-RESPUESTA Cuando se ha establecido una relación cualitativa entre dos fenómenos, la exposición y la morbilidad, el siguiente paso es investigar su relación cuantitativa (por ejemplo, cuánta enfermedad
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
49
producen diferentes niveles de exposición). Esta información es de fundamental importancia para la fijación de estándares de higiene. En el terreno de la farmacología, la relación cuantitativa se basa en el conocimiento de la dosis. Sin embargo, en el campo de la Salud Ocupacional generalmente no se conoce la dosis, y por ello el concepto de exposición es más pertinente que el de dosis. Aunque los términos efecto y respuesta con frecuencia se usan como sinónimos en Epidemiología, en Toxicología y Farmacología tienen significados distintos y, al menos en Epidemiología Ocupacional, existen motivos para hacer una distinción entre ambas. Un grupo de trabajo sobre toxicología de los metales, en su reunión de Tokio en 1974, definió efecto como «el cambio biológico causado por una exposición»6. Cuando se conocen los valores numéricos de la exposición y del efecto, se puede calcular la asociación exposición-efecto. La asociación entre la concentración de plomo en sangre, por un lado, y la concentración de ácido aminolevulínico (AAL) en orina, por otro, nos puede servir como ejemplo. A partir de esta asociación puede estimarse el nivel medio de excreción de AAL en orina en relación con cualquier nivel medio de plomo en sangre. Este mismo grupo de trabajo definió respuesta como «la proporción de individuos de una población que presentan valores indicativos de un efecto anormal» (por ejemplo, una concentración de AAL que exceda los 5 mg/1 en orina). Cuanto más alto sea el nivel de exposición, más elevada será la proporción de individuos con valores anormales. Esta relación se llama asociación exposición-respuesta. La asociación exposición-efecto describe el efecto medio para cada nivel de exposición. Como ninguna población es homogénea, esta descripción puede conducir a error. La asociación exposiciónrespuesta muestra las variaciones individuales con mayor sensibilidad, porque describe la proporción de la población que tiene reacciones anormales para cada nivel de exposición. Es necesario definir el término «anormal» a la hora de describir la conexión entre exposición y morbilidad en lo que hace referencia a la relación exposición-respuesta. En el caso de una respuesta del todo o nada, como es el caso del cáncer, o de cualquier muerte por dicha causa, no hay problema, pero en el caso de variables continuas, como el nivel de colesterol o la excreción urinaria de AAL, debe contarse
50
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
con un punto de corte. En este contexto es irrelevante argumentar lo que es normal y anormal, lo que importa es que debe definirse algún punto de corte en el recorrido de valores. Ejemplo 17. Seppäläinen et al.9 estudiaron los efectos a largo plazo de la exposición a plomo sobre la velocidad de conducción de los nervios periféricos. La exposición fue evaluada mediante mediciones de la concentración de plomo en sangre (Pb-S) tomadas con anterioridad. Se disponía de mediciones efectuadas durante todo el período de exposición. Se probaron tres medidas distintas de Pb-S (la media ponderada de Pb-S en función del tiempo, la medida más reciente de Pb-S y el valor más elevado de Pb-S). De éstas, la última fue la que mostraba una mejor correlación con las velocidades de conducción del nervio y fue la escogida. La correlación fue estadísticamente significativa para varios nervios; los valores altos del Pb-S correspondían a velocidades de conducción bajas. La figura 2 muestra esta asociación exposición-efecto. En ella se utiliza como ejemplo la velocidad de conducción sensorial (VCS) del nervio radial. La línea recta muestra la asociación promedio entre Pb-S y VCS. Sin embargo, existe una gran dispersión y, por ello, la información que proporciona dicho promedio es limitada. En este estudio también se examinó la asociación exposiciónrespuesta. Se definió como respuesta positiva una velocidad inferior a dos desviaciones estándar de la media, calculada a partir de un extenso conjunto de material normal, recogido previamente por el Instituto de Salud Ocupacional de Helsinki. La Tabla 2.7 muestra los individuos con al menos un valor «anormal» que fueron distribuidos según la categoría de exposición. Esta manera de estudiar la asociación muestra la proporción de individuos con valores anormales. La epidemiología cuantitativa tiene utilidad científica y práctica. El conocimiento de las asociaciones exposición-efecto y exposición-respuesta contribuye a la comprensión de un problema científico. Este conocimiento es también fundamental para el establecimiento de normas higiénicas y estándares. El establecimiento de estándares tiene dos etapas. La primera implica la evaluación del conocimiento científico biomédico en términos cuantitativos. En base a esta evaluación se puede definir un nivel de exposición «segura». El concepto de «segura» tiene va-
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
51
Figura 2.2. Ejemplo de una asociación exposición-efecto. Se presenta la velocidad de conducción de los impulsos sensoriales en el nervio radial (VCS) en relación con el valor más alto de plomo en sangre (Pb-S) medido durante el período de seguimiento. Las mediciones se realizaron en 78 obreros que trabajaban con plomo y en 34 controles.
Tabla 2.7.
Ejemplo de una asociación exposición-respuesta.
" La media de Pb-S de los controles era de 11 µg/100 ml.
52
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
rías definiciones. Una de ellas es que no debe detectarse ningún efecto adverso en el nivel definido como seguro. Entonces, este nivel puede usarse como el límite de exposición basado en la salud. Un estándar administrativo no solamente es científico, sino también una decisión tecnológica, económica y social. Es un compromiso administrativo, diferente en los distintos países, mientras que el estándar basado en la salud tiene una función más universal y es únicamente biológico. En la fijación de estándares administrativos puede aceptarse un cierto nivel de riesgo (o más bien se tolera). En tales situaciones, la decisión es totalmente diferente del proceso científico de definir un estándar basado en la salud. El científico, naturalmente, debería también participar en el procedimiento social, pero sólo como consejero, no como artífice de decisiones. BIBLIOGRAFÍA 1. Hernberg, S., T. Partanen, C.-H. Nordman y P. Sumari. «Coronary heart disease among workers exposed to carbon disulphide». Br. J. Ind. Med. 27:313(1970). 2. Koskela, R.-S., S. Hernberg, R. Kärävä, E. Järvinen y M. Nurminen. «A mortality study of foundry workers». Scand. J. Work Environ. Health 2(Suppl. 1):73(1976). 3. Miettinen, O.S. «Standarization of risk ratios». Am. J. Epidemiol, 96:383 (1973). 4. Miettinen, O.S. y J.D. Wang. «An alternative to the proportionate mortality ratio». Am. J. Epidemiol, 114:144 (1981). 5. Miettinen, O.S. Theoretical Epidemiology. Principies of Occurrence Research in Medicine (New York: John Wiley & Sons, 1985). 6. Nordberg, G.F. Ed. «Eftects and dose-response relationship of toxic metáis», in Proceedings from an International Meeting on the Toxicology of Metals, Tokyo, 1974. (Amsterdam: Elsevier, 1976). 7. Rimpelä, A., M. Nurminen, P. Pulkinnen, M. Rimpelä y T. Valkonen. «Lääkarien kuolleissuus: auttaako ammattitaito omassa terveydenhuollossa (Mortalidad de los médicos: ¿es útil la experiencia médica en el cuidado de la propia salud?)» Suom. Lääkaril 6:414. (1987), (resumen en inglés). 8. Rothman, K.J., Modern Epidemiology. (Boston, MA: Little, Brown 1986), p. 358. Existe versión en castellano: Epidemiología moderna (Madrid: Ed. Díaz de Santos, 1987).
ALGUNAS MEDIDAS EPIDEMIOLÓGICAS BÁSICAS
53
9. Seppäläinen, A.M., S. Hernberg y B. Kock, «Relationship between blood levéis and nerve conduction velocities». Neurotoxicology 1:313-32 (1979). 10. Silcock, H. «The comparison of occupational mortality rates». Popul. Stud. (London) 13:183(1959). 11. Tolonen M., S. Hernberg, M. Nurminen y K. Tiitola. «A follow-up study of coronary heart disease in viseóse rayón workers exposed to carbón disulphide». Br. J. Ind. Med. 32:1 (1975).
3 Fuentes de la información
Varios países, especialmente los nórdicos como Dinamarca, Finlandia, Islandia, Noruega y Suecia poseen buenos registros, tanto nacionales como regionales o locales, el uso de los cuales facilita notablemente la investigación epidemiológica. No es así en muchos otros países. Cuando no existen buenos registros, los datos deben conseguirse a través de otras vías más incómodas. Desafortunadamente, la creciente preocupación pública existente en muchos países por la confidencialidad ha conducido a que la legislación restrinja el uso de los registros y a veces incluso lo impida. En líneas generales los registros pueden clasificarse en: estadísticas vitales, registros de población y registros de exposición. La investigación epidemiológica por lo general requiere el uso de diversos registros o, alternativamente, de otras fuentes de información (véase figura 3.1). Ya que la accesibilidad de los registros, su tipo y calidad, así como la legislación que concierne a su uso, varían de forma significativa de un país a otro, no es posible en el presente capítulo describir con detalle cuál es su organización y cómo se usan en la investigación epidemiológica. En cambio, nos centraremos más en sus características generales, que se aplican independientemente de las condiciones nacionales. Para obtener información específica, los investigadores deberían siempre familiarizarse en primer lugar con las fuentes de información de su propio país. 55
56
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Figura 3.1. Gráfica que muestra el uso de las fuentes de información en un país con buenos registros.
ESTADÍSTICAS VITALES Registros de defunción
El registro de las defunciones se realiza de forma más o menos completa en Estados Unidos, Canadá, Europa, Japón, Australia y algunos otros países industrializados, pero en el resto de países es deficiente. En general, los registros de defunción son centrales o nacionales, aunque también los hay de nivel regional e incluso local, como por ejemplo, los registros parroquiales. Los datos del registro de defunciones se toman del certificado de defunción, en el que generalmente figuran el nombre, las fechas de nacimiento y defunción, el sexo y la ocupación del difunto, así como las causas primarias y contribuidoras de la muerte. Desde un punto de vista epidemiológico, la causa principal de muerte y la edad del difunto son los datos más importantes. En muchos países, también se registran los números de identificación personal, que no sólo facilitan la identificación de cada persona, sino que también posibilitan el enlace automático de los diferentes registros que contienen dicho número. (Se discutirá más adelante en este capítulo.) Cuanto más amplia sea la clasificación, mejor será la fiabilidad
FUENTES DE LA INFORMACIÓN
57
de la causa de muerte registrada. El dato de la muerte siempre puede ser aceptado como cierto. Además, las principales causas de defunción (como cáncer, enfermedades cardiovasculares o muertes violentas) por lo general se registran correctamente. La posibilidad de una mala clasificación aumenta cuando el diagnóstico es poco específico. Por ejemplo, cáncer primitivo y cáncer metastásico pueden confundirse. La fiabilidad de los registros de defunción varía de un país a otro. Su calidad, hasta cierto punto, está relacionada con la frecuencia de las autopsias, aunque no completamente, porque un certificado de defunción puede haber sido escrito ya antes de la autopsia, y no haberse corregido después para incluir los últimos hallazgos. Las variaciones regionales de la frecuencia de autopsias dentro de un mismo país pueden comportar diferencias sistemáticas en la exactitud. Determinadas causas de defunción pueden ser difíciles de diferenciar con precisión sin una autopsia, como es el caso de las muertes súbitas, en las que algunos médicos se inclinan hacia el infarto de miocardio, y otros hacia un accidente vascular cerebral. Conocer la localización primitiva de un cáncer también puede requerir una autopsia. Cuanto más amplia sea la clasificación, más fiable será la causa de defunción registrada
Además, diferentes enfermedades se registran en proporciones distintas si la causa de muerte se debe a varias enfermedades. El cáncer aparece en un elevado porcentaje de los certificados de defunción, mientras que otras enfermedades, como la diabetes, la hipertensión y la neumonía, no se registran con tanta frecuencia, a pesar de haberse diagnosticado también en la defunción. Aunque en más de la mitad de los certificados de defunción aparecen dos o más diagnósticos, en las estadísticas de mortalidad de forma habitual sólo se registra uno —la causa principal de la muerte—. Por lo tanto, los otros diagnósticos no pueden utilizarse en los estudios de mortalidad. Ejemplo 1. Supongamos que se investiga la mortalidad por cáncer de próstata en los trabajadores expuestos al cadmio. A pe-
58
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
sar de que el cáncer de próstata es un hallazgo secundario frecuente en las autopsias, especialmente en las categorías de edad avanzada, sólo los cánceres registrados como la causa primaria de la muerte en los expuestos pueden usarse en un estudio de mortalidad para asegurar la comparabilidad con los datos de mortalidad nacional, puesto que las causas secundarias no están bien registradas en las estadísticas nacionales de mortalidad. Sin embargo, si los datos de los trabajadores expuestos se comparan con los de un grupo de referencia ad hoc, entonces es válido comparar las causas secundarias (preferiblemente como una categoría independiente) siempre que la precisión del diagnóstico sea simétrica entre ambos grupos. En los estudios de mortalidad solamente puede utilizarse la causa primaria de muerte si el grupo de referencia es la población general.
A pesar de que en el certificado de defunción se registra la ocupación, la mortalidad ocupacional no puede estudiarse directamente a partir de los registros de mortalidad, por dos razones principales. La primera es que no existe ningún sistema satisfactorio para codificar las ocupaciones con fines de investigación. Ni siquiera la Clasificación Nórdica de Ocupaciones, considerada internacionalmente como de gran calidad, es ideal para este fin. En segundo lugar, la ocupación registrada pocas veces proporciona información completa, o incluso correcta, sobre toda la historia laboral del difunto. La mayoría de personas han tenido varios empleos a lo largo de su vida, y a menudo su último empleo (la ocupación final) tiene poco que ver con posibles riesgos ocupacionales anteriores. Además, los familiares cercanos suelen referir una ocupación «mejor» que la verdadera. Por ejemplo, el dueño de una pequeña fábrica que ha efectuado todo tipo de trabajos manuales, y que consecuentemente ha estado expuesto a muchos tóxicos químicos y físicos, aparecerá como «director» en su certificado de defunción. En las personas de edad avanzada, la ocupación aparece generalmente como «jubilado». En la mayoría de los casos no hay información sobre la ocupación en aquellos individuos que han pasado a ser asociales en las últimas etapas de su vida. Incluso si la
FUENTES DE LA INFORMACIÓN
59
variable ocupación estuviera registrada correctamente, las ocupaciones abarcan unas categorías tan extensas desde el punto de vista de exposiciones específicas, que incluso unos riesgos relativamente altos quedarían enmascarados si se usasen las ocupaciones como aproximación a las exposiciones. Así que los registros de mortalidad, como tales, no proporcionan información útil para estudiar las relaciones causales entre exposiciones ocupacionales y diferentes enfermedades. Los registros de defunción no pueden usarse como tales para el estudio de la mortalidad ocupacional.
Sin embargo, los registros de defunción (y también otros registros de morbilidad) son útiles en otros aspectos. En primer lugar, aportan datos para el cálculo de las cifras esperadas. En segundo lugar, pueden usarse para identificar los casos de enfermedades en estudio, una vez se ha definido la población que investigar a partir de otras fuentes. Por ejemplo, se puede definir una cohorte de expuestos a partir de un registro de empleados de una empresa, y luego usar el registro de defunciones como fuente de información sobre las causas de muerte de los miembros fallecidos de la cohorte. Otros registros de morbilidad
Existen registros nacionales y regionales de morbilidad en varios países. Algunos cubren todas las causas de enfermedad, como por ejemplo, los registros de altas hospitalarias de Finlandia y Dinamarca, que, entre otros ítems, contienen el número de identificación personal y el diagnóstico. Además muchos institutos nacionales de pensiones e instituciones de seguros de enfermedad disponen de registros de morbilidad. Estos registros pueden usarse para el estudio de indicadores de morbilidad, dejando aparte la muerte, sobre todo para aquellas enfermedades que no se han registrado en los certificados de defunción (por ejemplo, trastornos musculoesqueléticos) o que se han registrado de forma incompleta (por ejemplo, la diabetes). De todas formas, la calidad de estos registros varía. Por ejemplo, el mismo diagnóstico puede haber sido
60
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
registrado mediante códigos distintos, especialmente si el período de interés es prolongado. La precisión diagnóstica de los registros de morbilidad dista de ser exacta y varía dependiendo del hospital, la región geográfica y otros factores. La legislación sobre confidencialidad impide o al menos complica el uso de los datos de los registros en muchos países. En muchos países se han puesto a punto registros de enfermedades específicas. Los registros de cáncer, en particular, han sido de gran utilidad para la Epidemiología Ocupacional. Todos los países nórdicos tienen unos excelentes registros nacionales de cáncer, muchos de ellos establecidos desde hace más de 40 años. En algunos estados norteamericanos y en otros países europeos también existen registros de cáncer. Una breve descripción del Registro de Cáncer de Finlandia ilustra cómo puede utilizarse esta fuente de información en el estadio epidemiológico del cáncer relacionado con el trabajo. Ejemplo 2. El Registro Finlandés de Cáncer se fundó en 1952. La anotación de los casos se basa en los informes de los hospitales, de los centros de atención primaria, de los laboratorios de anatomía patológica y de los médicos privados. Como media se reciben cinco informes distintos para cada paciente. Junto a la declaración obligatoria establecida en 1961, este sistema de múltiples informes garantiza una cobertura de prácticamente el 100%, a pesar de que recientemente se ha hecho evidente una tendencia hacia cierta negligencia en la declaración. Estudios de control de calidad también han mostrado que la precisión en el diagnóstico es buena, incluso mejor que la del registro nacional de mortalidad, en lo que se refiere a la localización primitiva3'6. La identificación personal se basa en el número de identificación personal; el registro también contiene datos sobre la ocupación, domicilio, fecha y causa de la muerte. Los datos del tumor incluyen su localización primitiva, la fecha del diagnóstico, cómo se llegó al diagnóstico, la histología e información sobre el tratamiento. Un patólogo experto comprueba todos los diagnósticos y los clasifica según la localización primitiva. Cada año se declaran más de 14.000 casos. El Registro de Cáncer publica anualmente un folleto llamado «Incidencia de Cáncer en Finlandia». El Registro ha tenido un papel central en el desarrollo de la epidemiología del cáncer en general, y de la del cáncer ocupacional en el conjunto del país. Ha publicado sus propias encuestas
FUENTES DE LA INFORMACIÓN
61
sobre cáncer ocupacional y, además, ha contribuido en casi todos los estudios sobre epidemiología del cáncer ocupacional llevados a cabo en Finlandia. Con la ayuda del Registro de Cáncer se puede estudiar no sólo la mortalidad sino también la incidencia del cáncer. Un estudio de incidencia es especialmente informativo cuando la letalidad del tipo de cáncer es baja. La disponibilidad de casos incidentes también permite aumentar el número de casos en los estudios de cohortes. En los estudios de casos y controles la posibilidad de usar casos incidentes significa que muchos pacientes pueden ser localizados mientras todavía están vivos. La calidad de la historia laboral generalmente es mejor cuando se obtiene del paciente directamente y no de un familiar cercano. El Registro de Cáncer también puede proporcionar las cifras de comparación de esperados para los estudios de cohortes en incidencia de cáncer. En los estudios de casos y controles tanto los casos de cáncer como los controles con cáncer pueden obtenerse del Registro. Cuando se trata de un tumor raro, el acceso a todos los casos que han tenido lugar en el país es una gran ventaja. Sin embargo, la legislación sobre confidencialidad prohíbe contactar con los pacientes o con sus familiares haciendo uso de la información registrada; el contacto debe hacerse a través del hospital que ha tratado al paciente. Esta regulación ha provocado un notable exceso de trabajo. En estudios de cohortes los casos incidentes de cáncer pueden identificarse a partir de un registro de cáncer. En estudios de casos y controles, ambos, casos y controles con cáncer, pueden obtenerse del registro.
Algunos países, entre los que se encuentran Dinamarca, Finlandia y Suecia tienen registros de malformaciones congénitas. Aunque su notificación es obligatoria, la cobertura de dichos registros es mucho menor que la de los registros de cáncer. El hecho de que las malformaciones menores con frecuencia no se comuniquen es un problema. Además, algunas malformaciones se diagnostican algunos meses después del nacimiento. Los registros nórdicos se han utilizado en muchos estudios sobre causas de malformaciones congénitas relacionadas con el trabajo.
62
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Muchos países tienen registros sobre accidentes de trabajo. Estos varían de un país a otro en cuanto a cobertura, tipo de información registrada y gravedad de los accidentes incluidos (por ejemplo, algunos países registran accidentes menores y otros sólo aquellos que producen baja por enfermedad). Internacionalmente sólo son comparables las tasas de accidentes fatales. En algunos países como Dinamarca, Finlandia y Suecia, se dispone de registros nacionales sobre enfermedades relacionadas con el trabajo. La precisión del diagnóstico varía de una enfermedad a otra, y la relación de la enfermedad notificada con el trabajo a menudo es discutible. Se produce tanto una sobredeclaración como una infradeclaración. La calidad de estos registros no es muy buena y es problemático su uso en investigación epidemiológica. Muchos países tienen registros nacionales o regionales de muchas otras enfermedades. Algunas de ellas se hallan potencialmente más relacionadas con el trabajo que otras. Así, existen registros de tuberculosis, accidentes vasculares cerebrales, infarto de miocardio y enfermedades renales. Su potencial uso para la investigación epidemiológica depende de su calidad, la legislación sobre confidencialidad y otros aspectos. REGISTROS DE POBLACIÓN
En Epidemiología Ocupacional los registros de población se usan principalmente para realizar un control de las personas que han abandonado un estudio de seguimiento, o para localizar los sujetos en estudios de casos y controles de base poblacional. Los registros de población contienen números de identificación personal y por ello pueden combinarse con otros registros. Sin embargo, su calidad y accesibilidad varían enormemente de un país a otro. Si los registros de población son malos o si su uso con fines de investigación se halla restringido, entonces deben usarse métodos sustitutorios para efectuar el seguimiento de los individuos. Ello incluye el uso de guías telefónicas, agencias de tarjetas de crédito, registros parroquiales e incluso agencias de detectives privados. Obviamente, tales fuentes no son las ideales; por ello el éxito del seguimiento de las cohortes puede alcanzar cifras tan bajas como un 90%, o incluso menores en algunos países, mientras que en los países
FUENTES DE LA INFORMACIÓN
63
nórdicos se consideran como el límite inferior de aceptación porcentajes del 97 al 98%. Un censo es un recuento periódico de toda la población de un país. Por lo general se registran diversos datos demográficos, incluyendo la ocupación y la rama industrial. En algunas ocasiones se han relacionado datos crudos del censo con datos de morbilidad posterior, como por ejemplo, los datos del censo de 1970 con los datos de cáncer de 1980. En algunos países los registros locales de población, por ejemplo, los registros parroquiales, se recogen y mantienen como registros centrales de población.
REGISTROS DE EXPOSICIÓN
Si definimos «exposición» en términos amplios, los registros de las empresas, de grupos ocupacionales (por ejemplo, médicos, dentistas, albañiles y submarinistas) y los archivos militares pueden ser considerados como registros de exposición. En algunos países los archivos de ventas y aduanas se ordenan según los componentes tóxicos, y consecuentemente pueden hallarse poblaciones expuestas a partir de las compañías listadas como usuarias. En algunos países, como es el caso de Dinamarca y Finlandia, los institutos nacionales de Salud Ocupacional guardan registros de todas las mediciones higiénicas que realizan. Por ejemplo, el instituto finlandés visita unos 4.000 lugares de trabajo cada año y almacena los registros de todas las mediciones. Estas mediciones de exposición, aunque no son en ningún caso representativas, se han usado repetidamente para documentar y cuantificar la exposición, especialmente en estudios de casos y controles de cáncer ocupacional. La convención 139 de la Organización Internacional del Trabajo (OIT), concerniente a la prevención y control de los riesgos ocupacionales causados por carcinógenos, fue ratificada por más de 20 países a finales de 1990, entre ellos, Dinamarca, República Federal de Alemania, Finlandia, Hungría, Italia, Japón, Noruega, Suecia, Suiza y Yugoslavia, pero no Canadá y Estados Unidos. Los países ratificantes se comprometieron a establecer registros a escala
64
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
nacional de los trabajadores expuestos a carcinógenos. Sin embargo, hasta el momento sólo Finlandia lo ha realizado (en 19792). El objetivo de la OIT es promover la prevención del cáncer ocupacional, porque se asume que un empresario preferirá cambiar una sustancia carcinógena por otra no carcinógena para evitar ser incluido en el registro. Su objetivo primario no fue la investigación. La calidad de los datos de exposición no puede ser de otra manera más que inexacta y cruda, puesto que la información se recoge de forma rutinaria de miles de trabajadores. Además, como la evidencia de carcinogenicidad debe ser fuerte antes de que una sustancia química sea incluida en la lista, estos registros sólo han tenido un uso limitado en la investigación epidemiológica sobre cáncer ocupacional. Es difícil de concebir cómo podrían ayudar a la identificación de nuevos carcinógenos. Como máximo, pueden ayudar a encontrar sujetos expuestos para ser incluidos en estudios de cohortes, especialmente cuando la exposición es dispersa, como ocurre en muchos centros pequeños de trabajo. ENLACE DE REGISTROS
Los estudios de enlace de registros son cada vez más y más frecuentes debido al incremento de la disponibilidad de registros informatizados, en los que la identificación de los individuos registrados se basa en su único número de identificación personal. Como ya se ha comentado, la información recogida en los censos previos puede combinarse con información del registro de cáncer con el fin de estudiar la morbilidad por cáncer ocupacional. De manera similar, la mortalidad de cohortes ocupacionales puede seguirse a través del enlace de la cohorte con un registro regional o nacional de causas de muerte. Sin embargo, este método de estudio de la morbilidad de grandes poblaciones plantea varios problemas. Como los registros generalmente se establecen y mantienen con fines administrativos y no científicos, los datos registrados tienen limitaciones desde el punto de vista de la investigación epidemiológica. Aunque son útiles para calcular números esperados, para identificar «casos» en estudios de cohortes y para seleccionar los sujetos en los estudios de casos y controles, y aunque la disponibilidad de buenos registros de población facilita enormemente la lo-
FUENTES DE LA INFORMACIÓN
65
calización de las personas, no se recomienda el uso mecanizado de los datos de tales registros para la investigación. Muchos datos registrados son crudos y los errores de clasificación frecuentes. El control de calidad de los datos de grandes poblaciones (de cientos de miles o incluso de millones de personas) siempre es más difícil que el realizado en poblaciones pequeñas (por ejemplo, cohortes que comprenden algunos miles de sujetos). Ningún registro, aunque sea informatizado, es mejor que los datos básicos de entrada. Por lo general, los errores que empobrecen la calidad de los datos registrados son de tipo no sistemático, es decir, de carácter aleatorio. Estos errores no conducen a conclusiones falsamente positivas. En otras palabras, no producen la ilusión de un efecto cuando en realidad no hay ninguno. Por el contrario, el efecto de los errores aleatorios, ya sea por la propia crudeza de los datos o por una mala clasificación no diferencial, es negativo y enmascara un efecto verdadero (ver los Capítulos 5 y 8). Estos enmascaradores del efecto dificultan el uso eficaz del enlace de registros en la investigación epidemiológica. El enlace de registros es un método demasiado crudo para la investigación etiológica.
Otro problema que surge del enlace de materiales muy extensos es que incluso diferencias muy pequeñas entre grupos producen valores de p pequeños. Estas diferencias usualmente no tienen significado biológico y la interpretación de la significación estadística debe hacerse realmente con cautela. Otro problema es el llamado fenómeno de la multisignificación, descrito en el Capítulo 9. Cuando se llevan a cabo muchas comparaciones sin una hipótesis previa, se detecta un gran número de diferencias estadísticamente significativas. Por ejemplo, si se define una p = 0,05, una de cada veinte comparaciones es estadísticamente significativa. La interpretación de tales «significaciones sin sentido» es difícil, y tanto el investigador como el lector del artículo deben hacer uso de un atinado juicio. El fenómeno de la multisignificación ha recibido mucha atención; de todas formas, probablemente es más serio el enmascaramiento de los efectos verdaderos en los estudios de enlace de
66
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
registros, que los posibles juicios erróneos causados por pequeños valores de p desprovistos de sentido. Si el efecto no es evidenciable a partir de los datos, pasa totalmente desapercibido, mientras que el significado de los valores de p siempre puede discutirse. También pueden ocurrir errores sistemáticos. Ejemplos de tales errores son las sobre o infradeclaraciones regionales y las preferencias diferenciales de determinados números de la Clasificación Internacional de Enfermedades. Los errores sistemáticos también pueden ocurrir en el registro de los puestos laborales. Debido a que incluso pequeños errores sistemáticos producen valores de p pequeños, se debe ser muy cauteloso a la hora de interpretar significados estadísticos obtenidos del enlace de registros extensos. Debido a que los registros que se guardan con fines administrativos y otros propósitos no científicos son poco adecuados para la investigación epidemiológica, en ocasiones es tentador utilizar la moderna tecnología informática para establecer los llamados «registros científicos». Sin embargo, antes de tomar tal decisión, deben tenerse en cuenta los costes implicados, sobre todo en la recogida de datos y en el proceso de control de calidad. Debe conocerse exactamente con qué propósito van a utilizarse tales datos (no es suficiente decir que «quizás servirán en el futuro»). De forma especial, la falta de datos detallados es lo que obstaculiza el uso científico de los registros administrativos. Para tener una mejor calidad, un registro «científico» debería incluir detalles que no se recogen rutinariamente en los registros administrativos. Y realmente la recogida de tales datos detallados es cara y exige mucho tiempo. Además, el control de calidad de muchos ítems también es caro. Después del control de calidad, los datos deben informatizarse y el registro debe ser actualizado. Todo ello requiere mucho trabajo y estos esfuerzos pueden desperdiciarse si los planes para el futuro uso del registro son difusos. El almacenamiento de los datos básicos en su formato original, de manera no informatizada o bajo control informático, a veces es una alternativa recomendable. Sin embargo, deben recogerse de tal forma que sea fácil un posible futuro proceso de datos. Si se han generado unas buenas ideas de investigación y los datos existen, es tarea del investigador procesarlos de la forma que su proyecto requiera. A veces es difícil precisar qué tipo de datos vale la pena alma-
FUENTES DE LA INFORMACIÓN
67
cenar para el futuro. Esta decisión debe tomarse por separado en cada caso. (Debemos recordar que la legislación sobre confidencialidad puede restringir el almacenamiento de datos personales). Sin embargo, se recomienda siempre la recogida sistemática y el almacenamiento de datos de exposición, porque la falta de los mismos ha dificultado muchas, por otro lado correctas, investigaciones epidemiológicas. Los datos de exposición deberían guardarse para su futuro uso, pero no deben almacenarse necesariamente de forma informatizada.
En resumen, el defecto más importante de los estudios mediante el enlace mecanizado de registros es la tendencia a que los efectos verdaderos queden enmascarados. La fácil disponibilidad de ordenadores y de registros informatizados ha hecho que el uso y el mal uso de los estudios de enlace sean mucho más fáciles que antes. No hay ningún truco mágico que transforme datos malos en buenos sólo por el hecho de que estén informatizados. Así que, en general, debemos considerar los estudios de enlace con cuidado, aunque algunas excepciones han demostrado que dichos estudios pueden aportar información útil si es factible mejorar los datos (por ejemplo, cita 4). Los problemas etiológicos en particular requieren estudios ad hoc bien diseñados y bien planteados. Los estudios crudos de enlace no solucionan el problema. Los epidemiólogos experimentados conocen esto muy bien; los defensores acríticos de los estudios de enlace generalmente representan a otras ramas de investigación. El enlace mecanizado de registros raras veces proporciona datos etiológicos válidos. Los datos registrados son crudos, inexactos y generalmente recogidos para otros fines. CONFIDENCIALIDAD
Los problemas relacionados con la legislación sobre confidencialidad ya se han mencionado varias veces en este capítulo. Es un
68
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
hecho lamentable pero cierto que tal legislación constituye un gran obstáculo para la investigación epidemiológica en muchos países, entre ellos Francia, Alemania, y hasta cierto punto, Italia. Restringe o al menos dificulta en parte la investigación epidemiológica en muchos otros países, como por ejemplo, Suecia, Noruega, Dinamarca, Estados Unidos, Gran Bretaña y también, recientemente, Finlandia. La legislación varía de un país a otro. A veces está totalmente prohibida la facilitación de datos personales identificables y a veces se exige solamente que se suprima la identificación tan pronto se hayan procesado los datos. La legislación también regula el almacenamiento de los datos registrados, en aspectos tales como quién tiene acceso y quién es el responsable. En algunos países los datos obtenidos de un registro, o recogidos por algún otro método para un proyecto de investigación, deben destruirse después de un determinado período de tiempo o tan pronto como hayan sido usados para el propósito (investigación) para el que se obtuvieron. A pesar de que una legislación demasiado rígida es realmente un obstáculo para la investigación epidemiológica, pues indirectamente daña a los que en principio tenían que beneficiarse de la misma, los epidemiólogos han de comprender el interés público hacia la protección de la integridad personal. Hay muchos ejemplos en todo el mundo de un uso incorrecto de los datos registrados y se debe aceptar que la legislación es algo que se ha establecido de forma permanente. Por lo tanto, los epidemiólogos deben aprender a vivir con estas restricciones, aunque compliquen la ejecución de la investigación epidemiológica y creen mucho trabajo burocrático. Aquellos que se inician en un proyecto epidemiológico tienen que familiarizarse con la legislación vigente en su país. Las consecuencias prácticas de la legislación deberían también considerarse en el protocolo de investigación cuando se planifica un proyecto. Primero, se debería considerar en profundidad qué datos son esenciales para el estudio, de manera que se evite una recogida innecesaria. Este punto es especialmente importante en lo que se refiere a los llamados datos sensibles. Tan pronto se ha realizado el análisis de datos, debería eliminarse la identificación personal y convertir así el material en anónimo. A ser posible se deberían utilizar datos anónimos en todos los análisis de datos. El número de personas con acceso al material debería restingirse al mínimo necesario para llevar a cabo el estudio. Siempre que se recojan datos
FUENTES DE LA INFORMACIÓN
69
confidenciales, por ejemplo, mediante cuestionarios, los formularios deberían remitirse a una sola persona, que es la responsable de mantener la confidencialidad, no a una institución. El almacenamiento de datos puede ser importante en el caso de que planifique un estudio de seguimiento, o de que los datos sean necesarios más adelante para examinar la presencia de confusión, que puede haber pasado desapercibida cuando se efectuó el estudio, o incluso al hacer la publicación. En algunos países, para el almacenamiento de datos se necesita el permiso de las autoridades de inspección de registros. En cualquier caso, los datos deben almacenarse de manera que se asegure que no sea posible el acceso al material a las personas no autorizadas. DATOS DE EXPOSICIÓN En epidemiología etiológica, la calidad de la información sobre exposición debe ser al menos tan buena como la información que concierne a las variables de resultados. Desafortunadamente, hasta muy recientemente las mentes entrenadas en medicina de la mayor parte de los epidemiólogos ocupacionales han tenido poco en cuenta este hecho, evidente por sí mismo. En cambio, tradicionalmente han centrado sus esfuerzos en asegurar la exactitud de los datos sobre la enfermedad en estudio, que lógicamente es importante, pero que puede ser un esfuerzo inútil si la calidad de los datos que hacen referencia a la exposición no es igualmente buena. En tiempos en que la Epidemiología Ocupacional se preocupaba de identificar los efectos de riesgos fuertes, eran suficientes los datos crudos de exposición. Hoy en día, al haberse producido un giro hacia el estudio de efectos más sutiles, como los causados por los niveles bajos de exposición o por carcinógenos débiles, la demanda de datos de exposición detallados y precisos ha aumentado sustancialmente. La creciente importancia de la epidemiología cuantitativa, y no menos la de la valoración del riesgo, también destaca la necesidad de una información de alta calidad de la exposición. Muchas investigaciones epidemiológicas sólidas han fallado en aportar datos útiles, por el hecho de que una información errónea sobre la exposición ha producido un enmascaramiento o al menos una subestimación del efecto de interés.
70
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Debe admitirse francamente que a veces no existe una información satisfactoria sobre la exposición. Este problema es especialmente familiar a los epidemiólogos del cáncer, cuyo período de interés se sitúa décadas* atrás en el tiempo. Algunas de las fábricas en las que los individuos trabajaron pueden haber dejado de existir y otras no haber guardado registros sobre las exposiciones pasadas, por lo que en estas circunstancias poco puede hacerse. Sin embargo, en otras situaciones como mínimo puede hallarse algún tipo de datos sobre exposiciones pasadas, o al menos puede construirse alguna aproximación para la exposición. Si la exposición de interés no se sitúa muy atrás en el tiempo, o siempre que la exposición presente o incluso futura sea relevante, es posible conseguir datos útiles sobre la exposición. Este proceso generalmente requiere la inclusión de un higienista entrenado o, alternativamente, de algún otro experto si la exposición no es química ni física. Afortunadamente, esta práctica se realiza con más frecuencia hoy en día. Medidas de exposición química Los datos de exposición tienen varias dimensiones. Todas ellas son importantes para ser consideradas en un estudio epidemiológico. Desde el punto de vista de aportar información sobre la exposición individual, se pueden disponer distintos tipos de información de exposición según el siguiente rango jerárquico: 1. Muestras biológicas* (sangre, orina, aire alveolar, etc.) 2. Muestras de aire recogidas de la zona de respiración (recogidas mediante muestreadores portátiles) 3. Muestreo de la zona mediante muestreadores fijos 4. Categorización de la exposición del sujeto después de una evaluación por un higienista, considerando el lugar de trabajo, el tipo de trabajo y la categoría laboral 5. Dicotomización entre «expuestos» y «no expuestos» La clase 4 y especialmente la clase 5 son demasiado crudas para * Las muestras biológicas sólo son válidas si son representativas. Pueden usarse también como aproximación de otras exposiciones, por ejemplo, en el caso de que existan exposiciones mixtas y solamente se dispone de pruebas de monitorización para un sólo componente (no necesariamente el más tóxico).
FUENTES DE LA INFORMACIÓN
71
ser usadas en estudios cuantitativos, aunque pueden usarse en estudios cualitativos. Las muestras biológicas, cuando son representativas y se han medido correctamente, son las más adecuadas para evaluar la exposición total (ocupacional más no ocupacional) de individuos o grupos de personas. Recogida de datos de exposición Las encuestas sobre exposición pueden ser regulares u ocasionales. Pueden cubrir un lugar de trabajo, una fábrica o la industria de una área geográfica completa. Generalmente el epidemiólogo utiliza datos existentes, es decir, datos que ya han sido recogidos anteriormente con otro propósito que un determinado estudio; sin embargo, a veces puede realizarse una encuesta de exposición para servir a los objetivos de un estudio particular. Si éste es el caso, puede planearse de forma adecuada la estrategia para la adquisición de los datos. Idealmente la información sobre la exposición debería recogerse para aportar al menos los siguientes datos: • Tipo de exposición(es). ¿Hay uno o más agentes de exposición; hay impurezas relevantes? • Duración de la(s) exposición(es), que abarque de forma preferente toda la historia laboral de cada sujeto. • El tiempo de calendario de la(s) exposición(es) y la relación con la edad de cada sujeto y con el inicio de la enfermedad. • Intensidad y tipo de la(s) exposición(es). La calidad de las exposiciones debería registrarse con detalle, porque pueden producirse efectos sinérgicos, aditivos o incluso, a veces, antagónicos. Los productos técnicos contienen a menudo impurezas que toxicológicamente son relevantes. Evidentemente, debería conocerse la intensidad de la exposición. En estudios cualitativos este conocimiento se halla relacionado con la potencia del estudio para detectar un efecto existente, y en estudios cuantitativos es importante a efectos de las consideraciones exposición-respuesta. La duración de la exposición es relevante por las mismas razones. El tipo de exposición puede ser importante cuando se sospecha que unos picos o puntos máximos son los causantes del efecto, como ocurre con algunos efectos neurotóxicos de los disol-
72
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
ventes. En otros casos, una exposición estacionaria y de larga duración puede ser más importante biológicamente, como por ejemplo en ciertas exposiciones al polvo. Es importante registrar la exposición a picos si el objetivo del estudio es aportar datos científicos para establecer estándares de higiene. Por ejemplo, los valores límites umbral americanos y otros muchos estándares nacionales, pueden tener límites distintos para las exposiciones en pico y para las exposiciones promedio de 8 horas. También, y por las mismas razones, la exposición cutánea debería anotarse para aquellos agentes que traspasan la barrera cutánea. El tiempo de calendario de la(s) exposición(es) es importante cuando se estudian las enfermedades que poseen un largo período de latencia. Además, el nivel de higiene ocupacional ha mejorado en muchos países y los métodos de trabajo han cambiado sustancialmente a lo largo de los años. Las exposiciones de hoy en día pueden ser bastante diferentes de las del mismo tipo hace, por ejemplo, 20 años. Por último, la naturaleza de los datos de exposición (es decir, en qué tipo de información se basan) es importante para juzgar su representatividad y validez. Siempre que existan suficientes datos detallados se pueden construir índices de exposición basados en la duración e intensidad de la misma. Incluso si los datos son inexactos se pueden formar del mismo modo categorías de exposición más burdas. De todas formas, unos índices detallados derivados de datos crudos de exposición carecen de sentido y no deberían desarrollarse. Unos datos de exposición detallados y precisos son importantes, sobre todo en los estudios cuantitativos.
Aproximaciones a los datos de exposición
Por desgracia, las medidas retrospectivas de exposición, si es que existen, generalmente son deficientes. Las medidas que faltan, naturalmente, no pueden compensarse. Sin embargo, como sustituto de una exposición anterior, pueden medirse los niveles actuales y hacer una aproximación de los niveles pasados en base a estos datos y suplementándolos con estimaciones obtenidas mediante en-
FUENTES DE LA INFORMACIÓN
73
trevistas a los empleados, capataces y trabajadores más antiguos. Además, pueden usarse como aproximación medidas anteriores realizadas en industrias de tipo similar. Un higienista experto entonces puede valorar las exposiciones pasadas y combinar todas estas fuentes de información. Puede obtenerse, por otro lado, información adicional del uso acumulado de sustancias químicas en la fábrica en cuestión. Además, el momento en que se han producido la mayoría de cambios en el proceso o las mejoras higiénicas notables, como por ejemplo la instalación de sistemas de extracción de aire, generalmente ha sido recogido convenientemente. Sin embargo, aunque este tipo de información puede ser muy útil en estudios cualitativos, rara vez aporta estimaciones suficientemente válidas para propósitos cuantitativos. A veces se pueden simular condiciones pasadas, como por ejemplo, cerrar el sistema de ventilación. Sin embargo, por lo general se han hecho tantos cambios a lo largo de los años, que simplemente cerrando la ventilación no se obtiene una simulación exacta de las condiciones anteriores. Matrices de exposición laboral En los años 80 se desarrolló un nuevo enfoque para la valoración de la exposición, llamado matriz de exposición laboral (MEL). Una MEL es una tabulación cruzada de las categorías ocupacionales y las exposiciones relacionadas. Con este enfoque, la historia laboral puede «traducirse» de forma mecanizada en una historia de exposición, generalmente con la ayuda del ordenador (ver el ejemplo 11, Capítulo 4). Aunque es un método rápido, la calidad de los datos de exposición es bastante grosera porque las exposiciones varían mucho en una ocupación. Una MEL clasifica a todas las personas pertenecientes a una misma categoría ocupacional como expuestas o no expuestas, y este proceso inevitablemente provoca errores de clasificación en relación con la verdadera situación de exposición. El uso de matrices generales de exposición (por ejemplo, nacionales) se recomienda sólo en los análisis preliminares de grandes materiales, e incluso entonces, únicamente pueden identificarse los riesgos fuertes. En estudios más pequeños, es mejor construir matrices ad hoc para cada fábrica y cada período de tiempo.
74
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
La historia ocupacional puede traducirse en una historia de exposición con la ayuda de matrices de exposición laboral (MEL). Este método es adecuado para el análisis preliminar de grandes bases de datos.
Ahora, una vez han cedido los entusiasmos iniciales, se puede decir que el enfoque MEL es un instrumento útil, aunque solamente sea uno más entre los múltiples métodos utilizados para valorar la exposición de forma indirecta. Su principal uso radica en el cribaje de materiales extensos, principalmente con fines cualitativos. Para fines cuantitativos se necesitan métodos más específicos. La construcción de una buena MEL no sólo requiere competencia en higiene ocupacional, sino también considerables recursos humanos. Si el método MEL revela riesgos elevados, los hallazgos deberían examinarse con atención posteriormente mediante valoraciones de exposición más perfeccionadas. Exposiciones múltiples
Uno de los problemas más difíciles de la valoración de la exposición es la extremada frecuencia de exposiciones múltiples. La mayoría de los trabajadores se hallan expuestos simultáneamente a una gran variedad de agentes químicos; además, también puede producirse exposición a ruido, vibraciones y otros factores físicos. Las exposiciones que se producen durante el tiempo de ocio son factores que también se imbrican, pero aquí no acaba el problema. La gente tiene generalmente más de un trabajo a lo largo de su vida laboral, cada uno con su propio patrón de exposiciones que, además, cambia con el tiempo a medida que los procesos industriales avanzan. Obtener un historial de exposiciones de una experiencia tan compleja es a menudo una tarea formidable. Además, dar sentido a este patrón tan complejo es igualmente una tarea difícil. Por ejemplo, un estudio reciente analizó los patrones de trabajo y los perfiles de exposición de 774 trabajadores de dos grandes plantas químicas. Los resultados mostraron que los traslados internos de los trabajadores no seguían ningún patrón predecible, que más del 41%
FUENTES DE LA INFORMACIÓN
75
de los agentes químicos identificados se hallaban en múltiples áreas, y que los trabajadores expuestos a un compuesto químico era probable que también estuvieran expuestos a otros materiales tóxicos5. ¡Este análisis afectaba a una sola empresa!. Los autores recomendaron el uso de medidas de exposición específicas del área de trabajo y de la sustancia química, o algún perfeccionamiento del enfoque MEL, a pesar de ello los estudios etiológicos a menudo fallan en la identificación del agente específico causante de la enfermedad en estudio. Estos problemas son un obstáculo, especialmente cuando la asociación temporal entre exposición y efecto es prolongada, como es el caso del cáncer relacionado con el trabajo. Exposiciones no químicas En Epidemiología Ocupacional el término «exposiciones» se considera, a menudo, que equivale a exposiciones químicas, pero hay muchas otras condiciones en el entorno laboral que pueden ser relevantes en la etiología de las enfermedades relacionadas con el trabajo. Los factores físicos como el ruido, las vibraciones, el calor, el frío o las radiaciones, forman una importante categoría de exposiciones con potenciales efectos deletéreos para la salud. Sin embargo, los problemas relacionados con la medición de tales factores son similares a los relacionados con los factores químicos, y por ello no es necesario hacer comentarios específicos. Unos problemas de medición muy diferentes se hallan el terreno de las cargas físicas y mentales, que se tratarán en el Capítulo 6, y por ello no se comentan aquí. Enmascaramiento de los efectos verdaderos por los datos crudos de exposición Deberíamos resaltar una vez más que la baja calidad y la inexactitud de los datos de exposición tienen como resultado errores aleatorios, los cuales en un estudio cualitativo tienden a enmascarar o al menos a reducir las verdaderas diferencias entre grupos (es decir, conducen a resultados falsamente negativos). En un estudio cuantitativo producen un aplanamiento de la pendiente de las asociaciones exposición-efecto y exposición-respuesta. Cuando se va-
76
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Figura 3.2. La inexactitud de los datos de exposición aumenta la dispersión en el eje horizontal y conlleva un aplanamiento de la pendiente de la curva de exposición-efecto, de tal forma que los efectos de las dosis elevadas son subestimados y los de las bajas dosis sobreestimados.
loran las diferencias dentro de un grupo, este aplanamiento del efecto conduce a la sobreestimación de las acciones de las bajas dosis de exposición y a la infraestimación de las debidas a las altas dosis (Figura 3.2). La Figura 3.2, así como las consideraciones que se presentan en este capítulo, ilustran lo desastrosos que pueden ser unos datos erróneos de exposición para la sensibilidad de un estudio. Por lo tanto, no deberían ahorrarse esfuerzos para conseguir unos datos de exposición buenos. También es importante una correcta clasificación de los sujetos en unas apropiadas categorías de exposición. Si algunos sujetos no pueden ser clasificados debido a la ausencia de datos o a su insuficiencia, es mejor dejarlos fuera del estudio, porque su inclusión no hará más que comportar una proporción más
FUENTES DE LA INFORMACIÓN
77
elevada de lo necesario de individuos mal clasificados y ello empobrecerá los resultados del estudio. INDICADORES DE MORBILIDAD Mediciones Existen dos tipos de escalas de medición: la categórica y la continua. En una variable categórica, la entidad medida se coloca en dos o más categorías discretas, tales como muerto/vivo o alto/medio/bajo. Si hay dos categorías se dice que la variable es dicotómica; si hay más se llamará policotómica. La escala policotómica puede ser nominal u ordinal. En una escala nominal, las categorías no están relacionadas, por ejemplo, el distrito de nacimiento, la ocupación y el estado civil, mientras que las categorías de una escala ordinal están relacionadas, por ejemplo, no fumadores, fumadores leves, fumadores moderados, grandes fumadores y ex-fumadores. Las variables continuas se expresan mediante números que tienen intervalos sucesivos iguales. La presión arterial, el nivel de colesterol, la capacidad vital y el peso corporal, son algunos ejemplos de variables continuas. Sin embargo, una variable continua puede categorizarse; por ejemplo, el peso: 50 a 59, 60 a 69, y 70 a 79 kg. Las medidas pueden variar debido a la variación biológica real y a errores en las propias mediciones. La variación biológica significa la variabilidad normal que ocurre entre y dentro los individuos. Por ejemplo, las personas de la misma edad tienen diferente presión arterial, recuentos hematológicos y niveles de colesterol sérico. Otro tipo de variación biológica tiene lugar en el propio individuo en función del tiempo, por ejemplo, las variaciones en la presión arterial según la hora del día, la actividad física o el estrés mental. La variación biológica puede controlarse si uno se asegura de que los grupos de estudio son suficientemente grandes y que las mediciones se han estandarizado (por ejemplo, se requerirán 8 h en ayunas y en posición supina antes de la medición, o se realizará la medición siempre a la misma hora del día, dependiendo del tipo de variación que se desee controlar).
78
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Los errores de medición pueden ser debidos al azar o sistemáticos. Se describen en el Capítulo 5. «Dureza» del indicador Las medidas varían en relación a la fiabilidad. Determinados eventos, como la muerte, no están sujetos a ninguna ambigüedad, y muchas mediciones realizadas con equipos altamente sofisticados y modernos tienen un elevado nivel de exactitud. Tales mediciones suelen ser llamadas «duras». Las medidas menos fiables, como la notificación de síntomas subjetivos y otras informaciones anamnésicas, análogamente, son llamadas «blandas». Muchas mediciones que superficialmente parecen duras, de hecho más bien pueden ser blandas. Por ejemplo, las causas de muerte pueden haberse diagnosticado erróneamente y las radiografías pueden haberse leído incorrectamente. Del mismo modo, los datos anamnésicos no tienen por qué ser poco fiables; algunos tipos pueden ser válidos, como por ejemplo, el número de hijos propios o los informes de largos períodos de empleo. Nos podemos equivocar al pensar que los parámetros duros son siempre preferibles por su superior fiabilidad. Esto no es cierto. La dureza óptima de un parámetro depende de la naturaleza del problema. La muerte es una medida tan cruda que un estudio sobre mortalidad sólo puede revelar los riesgos más graves para la salud. Muchas enfermedades, tales como los trastornos musculoesqueléticos, las enfermedades mentales y los eczemas, no se registran en los certificados de defunción. Incluso los procesos esencialmente fatales, como la enfermedad coronaria, tienen fases previas y/o más leves, cuyo estudio puede contribuir a profundizar el conocimiento de la relación entre una determinada exposición y la enfermedad. Puede decirse que, mientras los indicadores duros de morbilidad son en general más fiables, los indicadores blandos son más sensibles. En muchos casos la sensibilidad puede ser más conveniente que la fiabilidad, especialmente si el precio que pagar por esta última es una pérdida de potencia para detectar las deletéreas propiedades de la exposición en cuestión.
FUENTES DE LA INFORMACIÓN
79
Los indicadores duros generalmente son más fiables y los indicadores blandos más sensibles. La naturaleza del problema determina la dureza óptima. Ejemplo 3. El estudio finlandés sobre el disulfuro de carbono1-7 que se comenta en varios ejemplos de este libro, utilizó una gran variedad de indicadores de morbilidad, como la muerte por enfermedad coronaria, infartos no fatales, síntomas de angina, cambios electrocardiográficos «coronarios» en reposo y después de ejercicio, la presión arterial y los lípidos sanguíneos. El efecto más notable fue que la mortalidad coronaria aumentó 4,7 veces. (Ver el ejemplo 6, Capítulo 4.) Otros indicadores mostraron también un efecto de la exposición al disulfuro de carbono, tales como síntomas de angina (RR = 2,2) y cambios electrocardiográficos «coronarios» (RR = 1,4). Sin embargo, se observó que los indicadores blandos no añadían más información a la aportada por los indicadores duros (muerte por enfermedad coronaria). El programa de prevención que se inició posteriormente fue influido en mucha mayor medida por los datos de mortalidad que por las leves manifestaciones de morbilidad. Los costes de anotar la mortalidad sólo fueron una parte menor de los costes totales del proyecto. Después del análisis de los resultados de los primeros 5 años, en los siguientes 10 años solamente se estudió la mortalidad. Cuestionarios y entrevistas
Muchos efectos leves sobre la salud o síntomas, como la fatiga, las náuseas, el vértigo, el dolor, la irritación de mucosas y parestesias, sólo pueden estudiarse a través de cuestionarios autoadministrados o de entrevistas estructuradas. Estos métodos también se usan con frecuencia para recoger datos sobre exposiciones anteriores y variables relacionadas con el estilo de vida; son métodos blandos y su uso comporta los problemas típicos de las medidas blandas. Los cuestionarios autoadministrados por lo general se estructuran y diseñan específicamente para un determinado estudio. La calidad de la información obtenida depende fuertemente de lo bien
80
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
formuladas que estén las preguntas. Se recomienda probar los cuestionarios con una muestra de respondentes antes de usarlos a gran escala, para que se pueda apreciar su funcionamiento y mejorar las preguntas deficientes. También se aconseja prever un contacto posterior, por teléfono o correo, con los entrevistados, para que los temas menos claros o los contestados deficientemente puedan resolverse. En los estudios por cuestionario la no respuesta siempre es un problema. Debería repetirse el envío por correo al menos dos veces, pero incluso así la tasa de respuestas puede ser baja, del 70 al 75%. (La repetición del envío no es posible si las respuestas se devuelven sin identificar; es algo que tener en cuenta al planificar la encuesta.) La no respuesta es un problema porque los que no devuelven el cuestionario pueden diferir sistemáticamente, en aspectos relevantes, de aquellos que sí lo devuelven. Si es posible, al menos las diferencias más destacadas entre los que responden y los que no lo hacen (por ejemplo, estructura social, hábito tabáquico) deberían comprobarse por algún otro método, por ejemplo, una entrevista por teléfono a una muestra de los que no responden. Sin embargo, la no respuesta no necesariamente es sistemática, al menos en todos los aspectos, y por lo tanto, no inevitablemente es causa de sesgo. Por ejemplo, en los estudios de casos y controles en los que se interroga sobre la historia de exposiciones, rara vez existe motivo para pensar que los casos y los controles responden de manera sistemáticamente distinta, pero el problema de antes persiste porque uno nunca está seguro de las razones de la no respuesta. Las entrevistas mejoran algunos de los problemas mencionados, pero exigen más tiempo y por ello son más caras. Pueden llevarse a cabo en hospitales, en visitas personales o por teléfono. Generalmente la tasa de no respuesta es menor en los estudios por entrevista que en los que se usan cuestionarios autoadministrados, pero si el entrevistador no está convenientemente entrenado y no es cuidadoso puede introducir otro tipo de problema, el llamado sesgo del observador, que se describe en el Capítulo 5. Sensibilidad y especificidad Toda población está compuesta por individuos que o bien tienen determinada enfermedad o bien se hallan libres de la misma.
FUENTES DE LA INFORMACIÓN
81
Al medir ciertos indicadores de esta enfermedad, se intenta clasificar correctamente a los individuos, es decir, definir a las personas enfermas como enfermas y a las sanas como sanas (en relación con la enfermedad específica). Este es un tema importante en los estudios epidemiológicos científicos, y también en la práctica sanitaria en la que se realizan programas de cribaje para detectar enfermedades relacionadas con el trabajo y otras. Si el indicador de la enfermedad es bueno para identificar a las personas enfermas, se dice que es sensible. La sensibilidad es la propiedad de producir un resultado positivo cuando la enfermedad se halla presente (es decir, la probabilidad de detectar esta enfermedad). Así,
Si, por otro lado, el indicador de la enfermedad es bueno para identificar a las personas sanas, se dice que es específico. La especificidad es la propiedad de producir un resultado negativo cuando la enfermedad se halla ausente, es decir, la probabilidad de que la prueba clasifique correctamente a las personas sanas (en relación con la enfermedad específica). Así,
Sin embargo, ninguna prueba es perfecta, y por ello, personas sanas pueden ser clasificadas como enfermas. Estos errores de clasificación se llaman falsos positivos. Asimismo, algunas personas enfermas pueden ser clasificadas como si no tuvieran la enfermedad. Tales errores de clasificación se llaman falsos negativos. Un indicador sensible identifica fácilmente a los verdaderos positivos (es decir, a las personas enfermas), pero también tiende a originar resultados falsamente positivos. De igual forma, una prueba específica identifica correctamente a los que no tienen la enfermedad, pero también tiende a originar resultados falsamente negativos. Un indicador sensible puede originar resultados falsos positivos y un indicador específico resultados falsos negativos.
82
FUENTES DE LA INFORMACIÓN
La sensibilidad y la especificidad generalmente se hallan interrelacionadas (es decir, cuanto más elevada sea la sensibilidad, más baja será la especificidad y viceversa). Dependiendo de la naturaleza del problema, se debería escoger entre una elevada sensibilidad o una elevada especificidad, pero ambas propiedades a la vez por lo general no pueden alcanzarse. Los programas de cribaje se basan generalmente en el uso de pruebas relativamente simples, cuya sensibilidad y especificidad se conocen. Si la enfermedad que se estudia es grave, como en el caso del cáncer, es preferible usar pruebas sensibles. Esta selección desafortunadamente tiende a producir una elevada proporción de falsos positivos, que pueden comportar la posterior utilización de procedimientos diagnósticos caros y molestos. Además, en los individuos clasificados falsamente como positivos se genera un alto grado de ansiedad. Sin embargo, infradiagnosticar enfermedades graves sería aun peor, y por ello, por lo general, se prefiere la sensibilidad por encima de la especifidad si la enfermedad es potencialmente grave. La situación es diferente en el caso de pruebas para el diagnóstico de enfermedades leves, tales como la diabetes inicial. En estos casos, el límite de la «positividad» se sitúa a niveles bastante altos en una escala continua de los valores de glucosa sanguínea, por lo que no se producen demasiados falsos positivos. Muchos resultados falsos positivos sobrecargarían la capacidad diagnóstica del centro sanitario u hospital. El precio de una elevada especificidad es que algún caso incipiente de diabetes puede ser clasificado erróneamente como sano, y por ello escapar a la detección precoz. Sin embargo, un retraso diagnóstico de 1 ó 2 años probablemente no afecta a la evolución de la diabetes en los adultos.
Cuanto más alta sea la sensibilidad, más baja será la especificidad; cuanto más alta sea la especificidad, más baja será la sensibilidad.
En los programas de cribaje, la sensibilidad y la especificidad de una prueba dependen también de la prevalencia de la enfermedad
FUENTES DE LA INFORMACIÓN
83
(P). El valor predictivo positivo (Pred) de una prueba puede expresarse de la siguiente manera:
Ejemplo 4. Supongamos que la P = 20% y que tanto la sensibilidad como la especificidad son del 99% (que es inusual). Entonces,
Sin embargo, si la P = 1%, el valor predictivo positivo se reduce al 50%. Si la sensibilidad y la especificidad son del 80% (que todavía se halla lejos de ser mala) y la P = 20%, el valor predictivo positivo es de nuevo del 50%, pero si la P = 1%, entonces sólo es el 3%.
El ejemplo 4 muestra que el cribaje de enfermedades raras es ineficiente, y que las pruebas con una sensibilidad y especificidad bajas tienen poco valor en los programas de cribaje. Este razonamiento se aplica también a la investigación epidemiológica, en el sentido de que los parámetros empíricos usados como indicadores de morbilidad deberían seleccionarse teniendo en cuenta tanto la sensibilidad como la especificidad. Si ambas propiedades no pueden combinarse, la naturaleza del problema es la que decidirá si debe preferirse la sensibilidad o la especificidad. Sin embargo, la especificidad tiene otra dimensión. Una prueba puede ser específica para una determinada exposición o para un determinado sistema orgánico. Por ejemplo, la exposición al plomo causa (aparte de elevados niveles de plomo en la sangre) ciertas deficiencias concretas en la síntesis del hem, por ejemplo, un aumento de la excreción de ácido 8-aminolevulínico en la orina. Por otro lado, los efectos de las exposiciones no específicas pertenecen al carácter propio de muchas enfermedades ocupacionales. Un ejemplo lo constituye el infarto de miocardio y la exposición a disulfuro de carbono. Otro ejemplo es la bronquitis crónica y la exposición al polvo, y un tercero, la polineuropatía y la exposición a ciertos solventes. Aunque son exposiciones no específicas, todas es-
84
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
tas manifestaciones son organoespecíficas: el infarto de miocardio afecta al corazón, la bronquitis a las vías aéreas y la polineuropatía al sistema nervioso periférico. También hay síntomas organoinespecíficos, como la fatiga, los dolores lumbares (músculos, discos intervertebrales, ligamentos, estructuras óseas, vísceras) y la disnea (corazón, pulmones, anemia). Tanto los efectos específicos como los no específicos pueden usarse en la investigación epidemológica, pero cuanto menos específica sea la manifestación, más necesario será un grupo de referencia válido. BIBLIOGRAFÍA 1. Hernberg, S., T. Partanen, C.H. Nordman y P. Sumari. «Coronary heart disease among workers exposed to carbón disulphide». Br. Ind. Med. 27:313 (1970). 2. Herva, A. «The Finnish register of employees occupationally exposed to carcinogens». Proceedings ofthe International Symposium of Prevention of Ocupational Cancer, Helsinki, 1981. Ginebra: International Labour Office, 1982. (Ocupational and Health Series No. 46), 569. 3. Lehtonen, M. y E. Saxen. «Syöpäkuolintodistusten luotettavuus Suomessa (Fiabilidad de los certificados de defunción por cáncer en Finlandia)», Duodecim, 88:1100 (1972). 4. Malker, H.S.R., J.K. McLaughin, B.K. Malker, B.J. Stone, J.A. Weiner, J.L.E. Erickson y W.J. Blot. «Ocupational risk for pleural mesothelioma in Sweden, 1961-79», J. Nati. Cancer Inst. 74:61 (1985). 5. Ott, M.G., M.J. Teta y H.L. Greenberg. «Assessment of exposure to chemicals in a complex work environment». Am. J. Ind. Med. 16:617 (1989). 6. Teppo, L. «Suomen syöpärekisteri (El Registro Finlandés de Cáncer)». Sosiaalivakuutus 7-8:218 (1980). 7. Tolonen, M., S. Hernberg, M. Nurminen y K. Tiitola. «A follow-up study of coronary heart disease in viseóse rayón workers exposed to carbón disulphide». Br. J. Ind. Med. 32:1 (1975).
4 Diseños de estudios epidemiológicos y sus aplicaciones en Medicina Ocupacional INTRODUCCIÓN El primer paso en el planteamiento de un estudio epidemiológico es la definición del problema. Antes de hacer nada, los investigadores deben asegurarse de que tienen una visión clara del problema a nivel abstracto-general, es decir, deben conceptualizarlo. A nivel conceptual, un problema cualitativo se expresa de la siguiente forma: «¿X causa Y?», que más adelante se perfecciona con las especificaciones de las circunstancias por las cuales este proceso puede o no ocurrir. El problema es cuantitativo cuando cuestionamos: «¿Cuánto afectará una determinada cantidad de exposición X al riesgo de Y?». Tan pronto como los investigadores conozcan exactamente el problema científico al que va dirigido el estudio, pueden definirse las variables empíricas referentes a la exposición y al efecto que va a medirse. Por ejemplo, a nivel conceptual, el problema podría resumirse en: «¿El disulfuro de carbono provoca enfermedad coronaria?». Esta pregunta implica que el disulfuro de carbono es un factor de riesgo causal de la enfermedad coronaria, una de sus muchas causas y, si verdaderamente lo es, implica que el efecto cardiotóxico es «general». Entonces, el efecto hallado en un estudio concreto no se limitaría a ese grupo de población, sino que se extendería también a otras poblaciones con exposiciones similares. Sin embargo, no se puede hacer una generalización científica hasta que se ha estudiado empíricamente una situación particular, esto es, una determinada población, unas determinadas condiciones de exposición y ciertos indicadores de la enfermedad. Se podrían medir, por ejemplo, las concentraciones de disulfuro de carbono en el aire de 85
86
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
una determinada empresa durante A años y seleccionar uno o más indicadores de la enfermedad, tales como infarto de miocardio clínico, para ser medidos en la población expuesta y en una de referencia durante un período de tiempo de B años. Debe tenerse en cuenta y planificarse la medición no sólo de la ocurrencia de la enfermedad en sí misma, es decir de los parámetros de exposición y de aparición de la enfermedad, sino también de los factores de confusión y los modificadores del efecto (ver el Capítulo 5). Las consideraciones en relación con la población cuya experiencia de morbilidad configura la base en estudio deberían incluir el criterio de elegibilidad, el tamaño requerido y cómo se distribuyen la exposición, los potenciales factores de confusión y los factores modificadores del efecto. Con respecto al período de estudio, debe definirse tanto el período de tiempo en que se basará la información sobre la morbilidad, por ejemplo los últimos 30 años, como el período de tiempo en el que se recogerá esta información, por ejemplo, el próximo año. Una buena planificación es conveniente para asegurar la validez de las observaciones. Finalmente, se debe decidir si se recogerá la información de toda la población en estudio (diseño de censo) o de una muestra de ésta (diseño de casos y controles), y cuál debe ser el tamaño de la población necesario para proporcionar suficiente información para obtener conclusiones correctas, a partir de la comparación de las incidencias de enfermedad. Cabe destacar que los investigadores están interesados en hechos científicos y no en la particular experiencia de morbilidad de la población en estudio, la cual sólo sirve de instrumento empírico para el estudio de la «verdad» científica. Como ya se ha mencionado, es importante que los investigadores tengan claros los objetivos del estudio antes de empezar el proyecto. Dichos objetivos deberían detallarse también explícitamente en el protocolo del estudio, así como en el manuscrito final. Si los objetivos están mal definidos, tanto sobre el papel como en la mente del investigador, el estudio probablemente no será de calidad.
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
87
Los objetivos de un estudio deben definirse con claridad. El investigador debe ser capaz de distinguir entre el nivel conceptual del problema y el empírico. Si los objetivos están mal conceptualizados, el estudio tendrá unas perspectivas limitadas.
El marco efectivo en el que se estudia el problema científico se conoce como la base del estudio12. Es lo que describimos como la experiencia de morbilidad (en relación con alguna exposición) de una población seguida en el tiempo. Así que la base del estudio no es sólo una población, un número de personas, sino la experiencia de morbilidad de dicha población durante cierto período de tiempo. La base del estudio es la experiencia de morbilidad de una población en el tiempo.
La incidencia de la enfermedad puede conocerse, dependiendo de diversos factores discutidos más adelante en este capítulo y en el Capítulo 5, mediante el examen de todos los individuos pertenecientes a la población de la base del estudio (un censo = una muestra del 100%) o por la comparación, en relación con la exposición de interés, de los casos de la enfermedad en estudio con una muestra de la población total de la base del estudio o de los individuos que no padecen la enfermedad. El primer enfoque corresponde a lo que tradicionalmente ha sido llamado diseño de cohortes, y el segundo, al diseño de casos-referentes o de casos y controles. El muestreo de la base del estudio (en el diseño de casos y controles) se puede hacer tanto en poblaciones dinámicas como cerradas. Es importante observar que un censo y un muestreo, como por ejemplo, un diseño de censo y un estudio de casos y controles dentro de una base de cohortes, son dos enfoques alternativos para obtener conocimientos científicos de la misma base de estudio, y no diseños completamente opuestos, como se creía anteriormente. Las cuestiones relacionadas con la factibilidad, la eficiencia y la validez, ge-
88
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
neralmente determinan cuál es el mejor enfoque en cada situación concreta. Si la morbilidad de la población en estudio se sigue durante un período de tiempo, se dice que el estudio es longitudinal. Por otro lado, un estudio puede estructurarse como una sección transversal de la base en un punto en el tiempo, en cuyo caso el estudio no tiene prolongación en el tiempo. En este estudio transversal se mide la prevalencia de la enfermedad en relación con sus determinantes. La prevalencia es un parámetro compuesto, que depende de la tasa de incidencia, del porcentaje de curación, de la letalidad y de la duración de la enfermedad (los que aún no tienen la enfermedad, los que se han curado y los que han muerto están excluidos de la población base). Además, los cambios producidos por la selección de los pacientes en función de su estado de salud pueden distorsionar la información de las tasas de prevalencia. Los estudios de prevalencia son más aptos para el estudio de enfermedades estables de larga duración. Generalmente son descriptivos y su objetivo es resolver problemas particulares (específicos de lugar y tiempo). Tienen un uso más administrativo que científico (por ejemplo, estudiar la prevalencia de diabetes en una población con el objetivo de destinar recursos para su control regular, o informar sobre la prevalencia de exposición ocupacional al plomo en una zona geográfica para localizar las condiciones de trabajo perjudiciales). Son diseños útiles en Salud Pública y Medicina Ocupacional, pero en la investigación etiológica su uso es bastante limitado debido a las circunstancias que se discuten más adelante, en este capítulo y en el Capítulo 5. Un estudio transversal es un corte de la base del estudio; un estudio longitudinal tiene una dimensión temporal.
Para resolver problemas etiológicos es mejor realizar un seguimiento de la base en estudio —un estudio de incidencia—, que hacer un corte transversal. La incidencia de una enfermedad generalmente aporta más información que la prevalencia, y los estudios de incidencia deben ser longitudinales. Muchas enfermedades, tanto las relacionadas con el trabajo como las otras, no ocurren de repente,
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
89
sino que se desarrollan durante un período de tiempo. Así que, entre el inicio de la exposición y la aparición de los síntomas de la enfermedad, transcurre un período de tiempo que a veces puede ser largo. Por lo tanto, el estudio etiológico de estas enfermedades requiere un diseño en el que la exposición y el desarrollo de la enfermedad se midan en diferentes momentos en el tiempo. Aunque los estudios transversales de la base del estudio son generalmente estudios de prevalencia descriptivos, a veces pueden aportar información etiológica. Un ejemplo son las enfermedades con un período de latencia corto o inexistente, como los síntomas respiratorios provocados por gases irritantes. Un diseño transversal también puede aportar información sobre la etiología de enfermedades crónicas, siempre y cuando la exposición haya sido estable a lo largo del tiempo. Por ejemplo, los efectos de la exposición crónica al plomo sobre el sistema nervioso periférico pueden estudiarse a partir de una simple determinación de la concentración sanguínea de plomo como aproximación de la exposición anterior, si se sabe que no han cambiado demasiado las condiciones de trabajo durante los últimos 5 años. Sin embargo, un estudio transversal de morbilidad sólo es válido si la enfermedad de interés no provoca una selección de los individuos (basada en la salud) hacia el abandono del trabajo expuesto. Por ejemplo, el deterioro del oído inducido por el ruido seguramente no causaría tal movilidad selectiva, al menos en su estado más leve, mientras que el dolor lumbar tendría ciertamente importantes efectos. En general, un diseño longitudinal es más aconsejable para llevar a cabo el estudio de problemas etiológicos. Los diseños transversales normalmente son estudios de prevalencia descriptivos; los problemas etiológicos requieren un diseño longitudinal.
90
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
ENCUESTAS DESCRIPTIVAS Encuesta sobre la salud de los trabajadores
Un centro de trabajo puede considerarse como una comunidad en miniatura, cuyos problemas de salud pueden estudiarse mediante métodos epidemiológicos. Algunos problemas de salud de los trabajadores pueden estar relacionados con su profesión, pero la mayoría son debidos a enfermedades y trastornos que pueden estar presentes en cualquier población. Sin embargo, como siempre tienen lugar interacciones entre trabajo y salud, incluso las enfermedades sin etiología relacionada con el trabajo generalmente afectan a la capacidad laboral. Así, todas las enfermedades de los trabajadores son de interés para cualquier sistema de asistencia sanitaria ocupacional. Estos sistemas de salud —al menos en los países donde la legislación no restringe los contenidos de la asistencia sanitaria ocupacional— deberían asegurar una vigilancia regular de la salud del personal. Un enfoque epidemiológico puede ayudar a sistematizar la práctica diaria de los programas de salud ocupacional. Los programas sistemáticos de vigilancia van dirigidos generalmente a categorías específicas de trabajadores, elegidas por tener un factor de riesgo común. Los programas de vigilancia pueden, por ejemplo, diseñarse para: 1. Estudiar regularmente a los trabajadores expuestos a riesgos profesionales conocidos. 2. Examinar a los trabajadores que entran en contacto con nuevos riesgos para la salud. 3. Mantener una vigilancia estricta de los trabajadores que tienen una elevada sensibilidad para contraer enfermedades relacionadas con el trabajo (por ejemplo, trabajadores mayores, atópicos, mujeres embarazadas). 4. Identificar, mediante programas de cribaje, a los trabajadores con un riesgo especial para contraer otras enfermedades (por ejemplo, enfermedad coronaria), para poder prevenirlas. 5. Diagnosticar a los trabajadores que padecen enfermedades leves y curables (por ejemplo, ferropenia, trastornos de la refracción). 6. Diagnosticar las enfermedades crónicas que requieren un control regular, como la diabetes y la hipertensión.
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
91
7. Identificar a los trabajadores que no son aptos para determinados trabajos (por ejemplo, los que padecen alergias, bronquitis crónica o trastornos lumbares). 8. Someter a aquellos que tienen un estilo de vida poco saludable a controles minuciosos (por ejemplo, los fumadores importantes, los alcohólicos y los obesos), para ayudarles a vencer el problema. Generalmente los recursos de los servicios de Salud Ocupacional son limitados. Por este motivo, los objetivos de los programas de vigilancia deberían hallarse bien definidos de antemano para asegurar una óptima distribución de los recursos humanos y materiales. La finalidad es iniciar un programa regular de vigilancia, identificar individuos con un elevado riesgo para someterles a programas de control, mejorar la eficacia de los programas de cribaje, ¿o es algo más? Los programas de vigilancia del estado de salud deberían centrarse en grupos de riesgo específico y sus objetivos deberían estar claramente definidos de antemano.
La selección de pruebas lo suficientemente sensibles y específicas es igualmente importante para la evaluación de los programas de cribaje (ver el Capítulo 3). El uso de grandes baterías de pruebas bioquímicas «globales» o de otro tipo no se recomienda en la actualidad, en parte por el elevado coste que implican, en parte debido a que implican numerosas pruebas posteriores, que consumen recursos y que a menudo son del todo innecesarias y, principalmente, por su bajo rendimiento en términos de prevención de enfermedades. Por lo tanto, se debe ser selectivo a la hora de escoger las enfermedades que se estudiarán y qué pruebas se utilizarán. Ejemplo 1. Supongamos que se estudia a los trabajadores de almacenaje de baterías expuestos al plomo, con la finalidad de prevenir los efectos tóxicos del mismo. La relación dosis-efecto de ciertos efectos tóxicos del plomo, como los cambios hematológicos y los trastornos neurológicos, es bien conocida. Si tomamos estos datos como fiables, sería suficiente con medir regular-
92
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
mente la concentración de plomo en la sangre (Pb-S), porque si el Pb-S permanece bajo, inferior a 40 µg/100 ml (2 µmol/1, aproximadamente), se sabe que no se producen manifestaciones tóxicas mayores. Al medir, además, la concentración de ácido 5-aminolevulínico en la orina detectaríamos a los individuos que son más sensibles. Ambas pruebas son específicas. Algunos médicos, por ejemplo, podrían considerar la medición de la velocidad de conducción de los nervios periféricos una vez cada dos años. Sin embargo, esta prueba no es específica para el plomo y requiere unos equipos especiales y sofisticados (al menos desde el punto de vista de los servicios de Salud Ocupacional), además de no ser útil para la vigilancia continuada de los trabajadores. Si tenemos en cuenta la conocida relación dosis-respuesta entre la exposición al plomo y el deterioro de las funciones nerviosas periféricas (ver la Tabla 4, Capítulo 2), no se producen efectos perjudiciales mientras el Pb-S se mantenga en niveles inferiores a 40 µg/100 ml. La frecuente práctica de realizar hemogramas de forma periódica no es útil desde el punto de vista de la prevención de la intoxicación por plomo porque la anemia es una manifestación tardía de esta intoxicación. Además, el recuento de leucocitos no se afecta de ningún modo por el plomo. Mientras se pueda asegurar que el nivel de Pb-S se mantiene por debajo del nivel en el que se produce el efecto tóxico, no tiene sentido buscar dicho efecto. Pero siempre debemos tener en cuenta que estas consideraciones hacen referencia a programas habituales de vigilancia y no a procedimientos diagnósticos realizados a pacientes sospechosos de sufrir una intoxicación por plomo.
Los métodos poco sensibles no detectan a aquellos con la enfermedad de interés, mientras que los métodos poco específicos aportan demasiados resultados falsos positivos (ver el Capítulo 3). Un programa de cribaje sólo tendrá éxito si el servicio de Salud Ocupacional u otros sistemas de asistencia sanitaria pueden realizar los posteriores exámenes necesarios y poner en marcha las medidas correctoras (tratamientos, etc.) que conllevan siempre este tipo de programas. Del mismo modo, si las posibilidades de trasladar a los trabajadores a puestos de trabajo menos exigentes son escasas o inexistentes, es absurdo iniciar actividades para «identificar» a trabajadores con limitaciones, que por sí mismos son perfectamente conscientes de su reducida capacidad de trabajo. Si el objetivo del programa de vigilancia es hacer un diagnóstico precoz para la pre-
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
93
vención de la enfermedad, dicha enfermedad tiene que ser efectivamente prevenible, o al menos que sea posible interferir en su evolución. Si no se cumplen estos requisitos, dicho programa de vigilancia será más perjudicial que beneficioso desde el punto de vista de una prevención exitosa. Finalmente, todas las poblaciones laborales tienen bastante rotación y sus patrones de enfermedad varían con el tiempo. Por esto, los programas de vigilancia tienen que planificarse pensando en su continuidad y en que los exámenes de salud deberían repetirse periódicamente. Se puede reducir el coste si las pruebas se centran en las categorías de trabajadores que parecen estar en un mayor nivel de riesgo, como los expuestos a agentes químicos, los mayores de 40 años, los grandes fumadores y similares. Observación de la morbilidad en relación con la ocupación, el área de trabajo o ciertas exposiciones Las encuestas sistemáticas sobre la salud de los trabajadores expuestos a un «cóctel» de agentes químicos, a un trabajo agotador o a otras condiciones mal definidas, proporcionarán la primera pista de que algo va mal en el lugar de trabajo. A pesar de que la prevención primaria debe basarse en observaciones directas del entorno laboral, también se pueden usar los datos recogidos a partir de los programas de vigilancia, para iniciar mejoras en las condiciones de trabajo. Una actividad de vigilancia de este tipo pocas veces utiliza indicadores 'duros' de enfermedad, sino que tiende a usar parámetros 'blandos' que indican efectos leves. Los métodos más útiles para los servicios de Salud Ocupacional son, por ejemplo, los cuestionarios estructurados, las entrevistas, la información obtenida de registros rutinarios, los datos sobre absentismo y diversas determinaciones clínicas, bioquímicas y funcionales. Como el fundamento del programa de vigilancia es relacionar los hallazgos clínicos con factores laborales, la exposición (en un amplio sentido) debe también definirse. La elección de unos indicadores del efecto es una parte fundamental de este proceso. Si la exposición está mal definida, no existirán pruebas específicas (¿de qué?). Por ello, la sensibilidad es lo más importante. Si alguna prueba indica la presencia de anomalías, el siguiente paso debe ser determinar la causa de ta-
94
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
les anomalías, lo cual significa que debe estudiarse la exposición por sí misma. Si, por otra parte, ya se sospecha que una exposición determinada puede ser perjudicial, la especificidad del indicador del efecto es muy importante. Lamentablemente existen pocos indicadores específicos de exposición (por ejemplo, trastornos de la síntesis del hem para el plomo), pero existe un mayor numero de indicadores organoespecíficos (por ejemplo, la velocidad de conducción nerviosa en neurotoxicología, la disminución del volumen espiratorio forzado para la obstrucción bronquial, la elevación sérica de creatinina para los trastornos renales). Además, pueden usarse pruebas menos específicas a nivel de grupo (por ejemplo, síntomas indicativos de psicoastenia en los trabajadores expuestos a solventes, síntomas de bronquitis crónica en los trabajadores expuestos al polvo). En todos los estudios transversales se debe recordar que la selección (basada en la salud) hacia el abandono de los trabajos expuestos conduce a una subestimación del verdadero riesgo. Este tipo de encuesta no debe confundirse con la investigación científica. Es más bien un acercamiento sistemático a la asistencia de Salud Ocupacional. Como ya se ha dicho anteriormente, un verdadero estudio científico requiere un diseño longitudinal. Del mismo modo, las encuestas médicas tampoco son lo mismo que la prevención primaria y no sustituyen a las medidas preventivas dirigidas a mejorar las condiciones de trabajo. Si el nivel de higiene ocupacional fuera elevado, no serían necesarios los programas de vigilancia médica para detectar los trastornos relacionados con el trabajo. Por desgracia, esta situación ideal es rara. Identificación de riesgos — Alarmas A veces, las observaciones epidemiológicas descriptivas proporcionan el primer aviso de los, hasta este momento, riesgos ocupacionales desconocidos. Por ejemplo, un aumento inesperado en la ocurrencia de eczema puede ser la primera indicación de que se ha introducido un nuevo agente químico alergénico en el lugar de trabajo sin que el médico de empresa tuviera noticia de ello. Un médico de empresa puede, incluso, ser el primero en darse cuenta de un riesgo totalmente nuevo hasta el momento. Este hecho ocurrió
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
95
a principios de los años 70, cuando se observaron dos casos de un nuevo tumor, el angiosarcoma hepático, en la misma empresa química entre los trabajadores expuestos a cloruro de vinilo. La observación clínica pronto se corroboró mediante informes de otros casos similares y por una serie de estudios epidemiológicos. Estas observaciones clínicas son fáciles de relacionar con una exposición específica si la enfermedad es rara, aunque a veces, otras manifestaciones de enfermedades más comunes también se han podido detectar por este método. Por ejemplo, las epidemias de enfermedades respiratorias de tipo inflamatorio han alertado a menudo al personal de Salud Ocupacional sobre la existencia de microorganismos en el aire de los sistemas de ventilación. La morbilidad ocupacional nacional y las estadísticas de mortalidad
Las estadísticas nacionales pueden a veces aportar indicaciones sobre los riesgos ocupacionales para la salud, aunque estas indicaciones sólo son sugestivas porque los datos de los registros usualmente son demasiado generales para permitir obtener conclusiones etiológicas (ver el Capítulo 3). El Registrador General de Gran Bretaña ha estado comparando la mortalidad dentro de distintas categorías ocupacionales, basándose en los datos del censo sobre la ocupación en los 10 años anteriores, para los dos últimos siglos5. Varios grupos ocupacionales han presentado un incremento de la mortalidad, como por ejemplo los mineros, los trabajadores de cerámica, los trabajadores de fundiciones y los trabajadores del algodón, cuya mortalidad fue más elevada que la esperada para enfermedades relacionadas con el polvo. El efecto de la ocupación por si misma sobre otras causas con una elevada mortalidad ha sido menos claro, porque no pueden separarse los efectos de la interrelación entre los factores sociales y los ligados al estilo de vida. A pesar de todo, los registros nacionales son más válidos como puntos de referencia para estudios epidemiológicos específicos, que como proveedores de evidencias claras de riesgos ocupacionales para la salud. Los estudios etiológicos requieren datos más detallados y precisos que los que pueden extraerse directamente de tales registros.
96
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
ESTUDIOS TRANSVERSALES DE LA BASE DEL ESTUDIO
Desde un punto de vista científico, un diseño transversal es un corte transversal de la base del estudio, sin ninguna dimensión temporal. Tanto la exposición como la morbilidad (prevalencia) se miden en el mismo punto en el tiempo. El corte transversal tiene sentido etiológicamente sólo si existe una verdadera relación temporal entre la exposición y el resultado. Por ejemplo, un estudio sobre la prevalencia de silicosis entre trabajadores activos de una fundición no puede dar información sobre los riesgos que condicionan los niveles actuales de polvo de sílice, sino sólo de las condiciones de exposición prevalentes en décadas anteriores. Por el contrario, la concentración actual de Pb-S explica el nivel actual de actividad de la enzima eritrocitaria δ -aminolevulínico deshidratasa. Se ha comprobado repetidamente que estos parámetros tienen una estrecha relación temporal. De la misma manera, siempre que la exposición al plomo haya sido constante a lo largo del tiempo, el nivel actual de Pb-S también puede explicar los resultados de las mediciones de la velocidad de conducción nerviosa, obtenidos en un corte transversal. Sin embargo, si ha habido fluctuaciones en estos niveles, la media ponderada en el tiempo de Pb-S es un mejor parámetro de exposición. Entonces se trata de un estudio híbrido, más que de un estudio transversal puro de la base del estudio, en el sentido de que la exposición se mide longitudinalmente, mientras que el efecto se mide de forma transversal. Un estudio transversal etiológico tiene sentido sólo si existe una relación temporal cercana entre exposición y morbilidad.
Ejemplo 2. Se trata de valorar si una determinada intensidad de exposición al gas cloro en el blanqueo de pasta de papel, es decir los niveles utilizados según los estándares higiénicos habituales, provoca síntomas respiratorios en los trabajadores. Al tratarse de un problema cuantitativo es importante disponer de datos de exposición muy precisos. (Se sabe desde hace más de un siglo que el cloro es un potente tóxico respiratorio, pues su potencia se probó durante la Primera Guerra Mundial. Por lo tanto,
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
97
desde un punto de vista cualitativo, este estudio no tendría sentido). De este modo, debe ponerse gran empeño en encontrar datos de exposición precisos y detallados de un período, por ejemplo de 1 ó 2 meses. Se debería estimar una media mensual para cada trabajador, pero también deberían registrarse las concentraciones máximas para ser utilizadas posteriormente en la clasificación de la exposición. Después se podrían agrupar los trabajadores en tres categorías de exposición, considerando como más relevante la que esté más próxima a los valores higiénicos estándar. También se deberían establecer unos criterios mínimos de duración de la exposición, por ejemplo, un mes. Debe escogerse también un grupo de trabajadores no expuestos, como por ejemplo los trabajadores de máquinas de papel, que actuarían como grupo de referencia. A continuación debería someterse a todos los grupos a las mismas exploraciones, como por ejemplo un cuestionario estándar sobre sintomatología respiratoria y pruebas funcionales respiratorias sencillas. Debería interrogarse, al mismo tiempo, sobre el hábito tabáquico y las posibles exposiciones a otros factores irritantes. Teniendo controlados estos potenciales factores de confusión, se puede proceder a comparar los resultados de los cuestionarios de síntomas respiratorios y de las pruebas de función respiratoria de los distintos grupos. Supongamos que el grupo expuesto a niveles cercanos al estándar refiere más síntomas que el grupo control, y que un grupo expuesto más intensamente muestra unos efectos aún más positivos. Estos resultados sugerirían que la exposición al cloro fue la responsable de estos hallazgos (lo que sugiere una relación causal), y ello podría indicar que el nivel considerado como estándar higiénico es demasiado elevado. El estudio debería repetirse, preferiblemente en otra fábrica de papel, y si los resultados fueran similares, entonces se debería actuar a nivel de la administración para que se redujera el nivel estándar. A pesar de que los diseños transversales a veces pueden proporcionar información etiológica, la tasa de prevalencia no es ideal como medida de morbilidad debido a la naturaleza compuesta de
la prevalencia. La interpretación razonable de los datos de prevalencia presupone tener conocimiento de todos sus distintos componentes.
98
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
DISEÑOS LONGITUDINALES — CONSIDERACIONES INICIALES Los estudios longitudinales tienen una dimensión temporal. Miden la experiencia de morbilidad (incidencia) de la población en estudio durante un determinado período de tiempo. La población en estudio puede ser dinámica o fija. En ambos casos, la medición puede hacerse de varias maneras. Si se estudian todos los miembros de la población de base, se habla de un enfoque censal (censo = 100% de la muestra). Alternativamente, el estudio puede diseñarse para investigar todos los casos de la enfermedad en cuestión, y sólo una muestra de los que no la padecen. Este enfoque se conoce como diseño de casos y controles. El diseño de casos y controles puede aplicarse tanto a poblaciones dinámicas como a cohortes. Contrariamente a lo que se creía, un enfoque censal y uno del tipo de casos y controles, no representan principios fundamentales distintos, sólo son dos métodos diferentes de conseguir la misma información a partir de la base del estudio12. Ejemplo 3. Supongamos de nuevo que la hipótesis es que la exposición al disulfuro de carbono provoca infarto de miocardio. La base del estudio consiste en el seguimiento hasta 1982 de una cohorte de hombres expuestos al disulfuro de carbono durante al menos 5 años en el período de 1942 hasta 1967, así como también una cohorte de similar extensión de hombres no expuestos, enrolados durante el mismo período de tiempo8. Una base como ésta puede investigarse de dos maneras; una sería recoger información sobre la historia de exposición de todos los trabajadores y registrar la incidencia de infarto de miocardio (infartos fatales, infartos no fatales hospitalizados) en toda la base del estudio, comparando después las incidencias entre el grupo expuesto y el no expuesto. Otro enfoque sería juntar los dos grupos, registrar todos los casos de infarto de miocardio, buscar datos de exposición en los casos y obtener una muestra de entre los no casos (por ejemplo, 3 ó 4 por caso), comparar la frecuencia de exposición entre los casos y los controles, y finalmente calcular un estimado indirecto del riesgo mediante la OR (ver el Capítulo 2). El primer enfoque corresponde a un estudio de censo de una base de cohortes y el último corresponde a un estudio de casos y controles (ver más
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
99
adelante en este capítulo). Ambos métodos usan la misma base de cohortes y aportan, en principio, la misma información. Ejemplo 4. El mismo fenómeno podría estudiarse con una base de población dinámica, como la de la pequeña ciudad de Valkeakoski, donde se encuentran ambas fábricas. El seguimiento de la población podría hacerse durante un cierto período de tiempo, por ejemplo 10 años. Un enfoque (realmente laborioso) sería registrar la historia de exposición (especialmente con relación al trabajo en la fábrica de rayón viscosa) de todos los hombres de esa ciudad que estén dentro de una misma categoría de edad (por ejemplo, de 40 a 64 años, para conseguir una mayor eficiencia del estudio). Después podría calcularse la incidencia de infarto de miocardio, obtenida a partir del Registro Nacional de Defunciones y del registro de admisiones del hospital de Valkeakoski, y compararse las tasas entre los expuestos (al disulfuro de carbono) y los no expuestos con el fin de hacer una estimación del RR. Alternativamente, los casos de infarto de miocardio podrían obtenerse de la mismas fuentes y la muestra de los no casos obtenerse a partir del registro de población de Valkeakoski. Se estudiarían las historias de exposición de estos individuos y compararían ambos grupos para obtener la (5R\ De nuevo cabe decir que tanto mediante un método como con el otro se obtendría la misma información.
Una diferencia importante, entre una base de cohortes y una base de población dinámica, es que los miembros de una cohorte que abandonan su trabajo o cambian de empleo deben ser incluidos en el seguimiento, mientras que ello no es necesario en una población dinámica. Del mismo modo, una cohorte no acumula nuevos miembros después de su definición, mientras que en una población dinámica hay un continuo movimiento de individuos que entran y salen. En una población dinámica la rotación puede ser debida a la enfermedad en estudio, en cuyo caso provocará un sesgo de selección si esto no se ha tenido en cuenta antes. Si la población dinámica es suficientemente grande, esta fuente de sesgo no es tan importante, ya que gran parte de la migración tiene lugar dentro de la población. Sin embargo, no es factible utilizar un censo de una población muy grande, por lo que estas poblaciones se estudian mediante muestreo, que significa un enfoque de casos y controles.
100
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Si la población dinámica es pequeña, (es decir, un municipio pequeño o parte de una ciudad), es más fácil estudiarla mediante el enfoque de censo. Una base poblacional dinámica más pequeña no necesariamente introduce sesgos de selección en el estudio de enfermedades generales pero, como se ha mencionado antes, este enfoque es cuestionable cuando la población se define en base al empleo y se estudian enfermedades relacionadas con el trabajo. Es cierto que pueden producirse migraciones entre municipios en relación con la salud (por ejemplo, gente sana puede trasladarse de municipios rurales a urbanos o trasladarse a otro país), pero esta migración no necesariamente distorsiona el estudio de las enfermedades generales. Por ejemplo, el valor predictivo del nivel de lipoproteínas de baja densidad en suero sobre el desarrollo de enfermedad coronaria no depende de si la gente vive en Cincinnati, Louisville o Miami o de si hay emigración entre ellas. Debido a la movilidad selectiva basada en la salud, por lo general se prefieren las bases de cohortes a las bases de población dinámica en el campo de la Salud Ocupacional, aunque muchos estudios de casos y controles sobre, por ejemplo, el cáncer relacionado con el trabajo, se han basado en poblaciones dinámicas. Aunque teóricamente existen varias posibles opciones para el diseño del estudio, las consideraciones en cuanto a factibilidad y validez las reducen a una. De hecho, cuando se comparan las alternativas presentadas en los ejemplos 3 y 4, es evidente que la base de población dinámica hubiera sido mucho menos eficiente que la base de cohortes. ESTUDIOS DE BASE DE COHORTES Estudios de censo
Una cohorte engloba a sujetos que comparten un hecho común. Este hecho podría ser la misma fecha de nacimiento, estar empleado en la misma empresa, la exposición a un mismo agente y otros muchos. En Medicina Ocupacional, el evento de interés generalmente es una exposición ocupacional común. El término «exposición» tiene un sentido muy amplio. Puede tratarse de una ex-
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
101
posición química o física, un trabajo agotador, un trabajo por turnos o cualquier otra condición que se considere que tiene efecto en la morbilidad de la población expuesta. La propia ocupación se considera a menudo como el evento —una aproximación a la exposición— por el que se forman las cohortes. Sin embargo, la ocupación es una aproximación mala para exposiciones específicas, por lo que no es un buen criterio para la formación de cohortes, a menos que el objetivo del estudio sea investigar los efectos de exposiciones conjuntas no bien definidas que tienen lugar en algunas ocupaciones. Un estudio de cohortes clásico es un verdadero censo de la población expuesta porque se examina y se hace un seguimiento a toda la población. Sin embargo, como se tratará más adelante, un estudio también puede concebirse como un muestreo de la base de la cohorte y, en este caso la base será más informativa si se ha diseñado de forma que comprenda individuos con diferentes niveles de exposición, lo cual permite hacer comparaciones. Estos criterios de inclusión difieren del criterio clásico de cohorte, que se centra en los individuos con un mayor nivel de exposición. La eligibilidad para ser admitido en una cohorte de sujetos expuestos, requiere, además del hecho de tener en común una exposición, el cumplimiento de otros criterios. Estos criterios pueden ser la edad, el sexo, una duración mínima y la intensidad de la exposición (criterios de exposición cuantitativa), ausencia de otras exposiciones, y similares. Al entrar en el estudio, todos los miembros de la cohorte deben estar libres de la enfermedad en estudio, de acuerdo con los criterios empíricos utilizados para medir la enfermedad. Ejemplo 5. Supongamos otra vez que el objeto de estudio es el infarto de miocardio provocado por el disulfuro de carbono. El criterio empírico del efecto será la muerte por patología coronaria y las hospitalizaciones por infarto de miocardio. Los que hayan sufrido infartos antes de la formación de la cohorte quedarán excluidos del estudio, pero los que tengan anotaciones en sus historias clínicas sobre cambios electrocardiográficos, angina u otros síntomas no se excluyen, porque en este ejemplo, el criterio empírico que se ha establecido es el infarto clínico fatal o no fatal y no la presencia de ondas Q en el electrocardiograma o una historia de angina. Por otro lado, si el criterio empírico fueran las ondas Q y/o la angina, entonces, los que ya tuvieran estas ma-
102
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Figura 4.1. Diseño de un estudio de censo a partir de una base de cohortes.
nifestaciones no podrían ser aceptados en la cohorte. No podrían escogerse personas con estas manifestaciones, debido a que la presentación de nuevos casos de sujetos con síntomas de angina y cambios electrocardiográficos sería el verdadero objetivo de un estudio formulado de este modo. La morbilidad de una cohorte expuesta debería compararse preferiblemente con la de una cohorte ad hoc de referencia para poder hacer una estimación del RR (cruda o estandarizada). La mortalidad (y raras veces otras formas de morbilidad) también puede compararse con cifras de mortalidad nacionales estandarizadas por edad, sexo y tiempo a efectos de calcular la RME, la cual indica si la mortalidad es más alta o más baja que la «esperada» (Capítulo 2). Si se utiliza una cohorte ad hoc de referencia, ésta debería ser similar a la cohorte expuesta en todos los aspectos relevantes, excepto en la exposición (Figura 4.1). Asumiendo que sea realmente comparable, una cohorte de referencia proporciona una comparación más válida que la población general, pero por el hecho de ser más pequeña, el resultado de la comparación se halla más afectado por la variación aleatoria. Tal variación conduce a que el intervalo de confianza del estimado del RR sea mucho más amplio. Por razones de eficiencia, la cohorte «expuesta» debería diseñarse de tal forma que la distribución de los individuos con la ex-
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
103
posición no reflejase lo que generalmente ocurre en la distribuciones quasi-gausserianas en las que se hace énfasis en la exposición media12. Si el problema es cualitativo, el objetivo está en ver si una determinada exposición puede provocar realmente la enfermedad de interés, en cuyo caso el estimado del RR estará por encima de 1 en el estudio en cuestión. Para este propósito se debería centrar la atención en aquellos con la exposición más alta y no en incluir indiscriminadamente a todos los miembros «expuestos» en la cohorte. Sin embargo, cuando ya se conocen los aspectos cualitativos y el interés se centra en los aspectos cuantitativos de la relación de ocurrencia, también deben incluirse las categorías con un nivel de exposición más bajo. Sin embargo, no es eficiente diseñar la base del estudio indiscriminadamente, de forma que tenga las proporciones «adecuadas» de todas las personas expuestas (contrariamente a lo que piensan muchos investigadores). En lugar de ello se debe tomar ejemplo de los científicos experimentales y centrarse en los extremos; en este caso, en los individuos con exposición fuerte y en aquellos en los que sea leve. Este diseño, llamado de dos puntos, es muy conocido en la práctica experimental debido a su gran eficiencia. Lamentablemente muy pocos epidemiólogos se han aprovechado de su bajo coste. Si se pretende conocer más sobre la relación de ocurrencia, se puede modificar el diseño anterior e incluir un tercer punto, una categoría intermedia. Debemos admitir que el grado de exposición de cada individuo a menudo se hace evidente durante el estudio y la falta de conocimientos sobre este punto en la fase del diseño imposibilita la correcta distribución de los individuos. A pesar de ello, puede realizarse algunas clasificaciones crudas de exposición en una etapa temprana del estudio. En cualquier caso, no se debería hacer un uso indiscriminado de toda la población «expuesta» (por ejemplo, todos los obreros de la industria de fundición o todos los de una industria química) al diseñar un estudio de tipo censo. La distribución de la exposición del grupo en estudio seleccionado por el investigador debería parecerse más a la forma de una U que a la típica campana de Gauss12. La restricción de la base del estudio en relación con algunas otras características de los sujetos es también una forma de reducir costes. Por ejemplo, si el número de individuos en una categoría (mujeres, no blancas, no fumadoras, etc.) es bajo y si existe una razón para pensar que la propiedad que caracteriza esta categoría es un
104
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
modificador del efecto (el efecto de la exposición es distinto que en el resto de las categorías), es prudente no incluir a tales individuos en la base del estudio. Su inclusión podría llevarnos a la falsa impresión de que los resultados del estudio también son aplicables a esta categoría, aunque su número hubiese sido demasiado bajo para extraer cualquier conclusión. Aunque los lectores críticos no caerán en esta trampa, cabe señalar que la investigación de categorías desprovistas de información significa malgastar el dinero y es una pérdida de tiempo para el investigador. Ya que una cohorte «expuesta» se define como aquella que tiene una determinada exposición, sólo los efectos provocados por una exposición, es decir, esa exposición concreta, pueden ser estudiados al mismo tiempo. Por ejemplo, si la exposición que nos interesa es el polvo de sílice, no es factible estudiar en el mismo marco los efectos producidos por algún otro tipo de polvo, como por ejemplo, el asbesto. Sin embargo, a veces se pueden formar subcohortes con distintas combinaciones de exposiciones, siempre que el material sea lo suficientemente grande y que los datos sobre la exposición sean lo suficientemente claros y precisos. Por otro lado, un diseño de cohortes permite el estudio de varias enfermedades al mismo tiempo. Así, en una misma cohorte se puede estudiar tanto la mortalidad global como la específica por causas. Si se dispone de medidas de otros indicadores de morbilidad o en el caso de que estos puedan obtenerse, también se pueden estudiar varias manifestaciones de la misma enfermedad. Si los datos son históricos, es difícil que existan medidas de morbilidad que puedan usarse en la investigación científica, porque los indicadores de morbilidad más débiles que la muerte usualmente no se registran de manera sistemática. A pesar de ello, puede diseñarse perfectamente un estudio de cohortes prospectivo para medir, por ejemplo, tanto la mortalidad coronaria como diferentes grados de morbilidad, tales como los infartos no fatales, la aparición de cambios electrocardiográficos (por ejemplo, depresión del S-T en reposo y después del ejercicio) y síntomas de angina. En un estudio de censo de una base de cohortes puede estudiarse la relación de ocurrencia entre una exposición y varias enfermedades.
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
105
Figura 4.2. Composición de una cohorte durante el seguimiento. Etapas de la cohorte durante este periodo.
Cuando se utiliza un enfoque de censo, lo tradicional en Medicina Ocupacional ha sido estudiar una base de cohortes y no una base de población dinámica. En una cohorte, todos los miembros que la forman permanecen en ella para siempre, incluso después de haber contraído la enfermedad o fallecido. Como consecuencia, todos los que originariamente estuvieron expuestos deben seguirse y también debe registrarse su resultado; el hecho de que haya finalizado la exposición no influye en su pertenencia a la cohorte. En la práctica está claro que un estudio de cohortes finaliza en algún momento, pero conceptualmente sus miembros permanecen allí para siempre (Figura 4.2). Las cohortes son de dos tipos, dependiendo de cómo hayan sido diseñadas. El primer tipo lo componen todos aquellos que han estado expuestos en un cierto punto en el tiempo (base de cohortes de punto de partida transversal). El segundo lo forman aquellos in-
106
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
dividuos que han estado en contacto con la exposición durante un cierto período de tiempo (base de cohortes de inicio). Hay diferencias importantes entre estos dos enfoques. En el diseño de base de cohortes de punto de partida transversal, se puede haber producido una autoselección de forma previa a la formación de la cohorte; los que todavía estaban expuestos en el momento en que se definió la cohorte estarán más sanos que los que dejaron su empleo después de un corto período de exposición. En el diseño de cohortes de inicio, se aceptan nuevos trabajadores durante un cierto período de tiempo. Esta inclusión de nuevos trabajadores conduce a que una elevada proporción de miembros de la cohorte estén destinados a permanecer en la categoría de expuestos sólo durante un corto período de tiempo. Como la movilidad siempre es más elevada al inicio del empleo, el resultado son tiempos de exposición cortos para una gran proporción de los miembros de la cohorte. Además, los que tienden a dejar el empleo tempranamente pueden ser socialmente distintos de los que son más estables. Si la población es lo bastante grande, se puede centrar el estudio en los que han permanecido expuestos durante cierto período de tiempo, estableciendo como criterio de selección una duración mínima de la exposición. Especialmente, cuando se estudian ocupaciones especializadas, muchos trabajadores que entran en la cohorte al haber estado empleados en otra compañía de la misma rama industrial pueden haber sufrido exposiciones anteriores similares. Es importante tener en cuenta dicha exposición, aunque requiere trabajo adicional, porque el estudio resulta más eficiente al aumentar la proporción de individuos con tiempos de exposición más largos. A pesar de todo, en la práctica, muchos estudios de cohortes son híbridos de estos dos tipos. Por ejemplo, la cohorte puede definirse inicialmente como una cohorte de punto de partida transversal, compuesta por todos los empleados en un determinado momento en el tiempo, en la que después se admiten nuevas entradas durante un cierto período de tiempo. Un diseño híbrido, como éste, dificulta la interpretación de los resultados, pero en muchas ocasiones debe utilizarse para conseguir suficiente material para estudio. Un estudio de cohortes puede ser retrospectivo (histórico) o prospectivo. En ambos casos la estructura científica es la misma. En
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
107
algún momento o período de tiempo se define un censo de individuos expuestos, que es seguido a continuación; posteriormente se mide en todos los individuos la ocurrencia de la enfermedad. La diferencia sólo está en el tiempo. Si el diseño es retrospectivo, la enfermedad ya ha aparecido y si es prospectivo, tenemos que esperar a que aparezca. Una cohorte retrospectiva se define en un determinado punto en el tiempo o durante algún período en el pasado, por ejemplo hace 20 ó 30 años. Se hace un seguimiento de la morbilidad hasta el momento actual o, por razones prácticas, hasta seis meses o un año antes para dar tiempo a que los datos de morbilidad hayan sido registrados. (El retraso en los registros es normalmente de 2 a 4 meses; puede variar de un país a otro.) Es importante seguir a aquellos individuos que han dejado el empleo; debería localizarse a todos, pero en la práctica esto no se consigue. En los países nórdicos se puede seguir normalmente del 97 al 99% de los individuos, pero el porcentaje suele ser menor en los países con unos registros de población no tan eficaces. El fallo en la localización de las personas depende tanto del hecho de que los datos personales como el número de identificación personal son erróneos, como del hecho de que el individuo en cuestión se ha vuelto asocial, sin domicilio. El objetivo de los estudios de cohortes debería ser el correcto seguimiento de todos los individuos.
Cuando la proporción de miembros de la cohorte de seguimiento imposible es elevada, es decir, más del 5%, el problema estriba en saber si las personas perdidas tienen o no el mismo estado vital que las halladas a través del proceso de búsqueda. Podrían existir diferencias marcadas que distorsionarían cualquier conclusión basada en la evolución de aquellos que han podido seguirse, debido a que los individuos perdidos generalmente difieren de aquellos que han permanecido bajo seguimiento. Hay diversas formas de manejar los datos perdidos en la fase de análisis. Una de ellas es rechazar a las personas perdidas clasificándolas como «desconocidas». Este procedimiento puede llevar a una pérdida de información, porque, después de todo, estos individuos
108
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Tabla 4.1. Esquema de una tabla que muestra los resultados de un estudio de cohortes con denominadores calculados.
acumularon algunas personas-año de seguimiento antes de que desaparecieran. Si asumimos una misma mortalidad para éstos que para los que sí se conoce su estado vital, ello implica que las personas desaparecidas no difieren de las seguidas, lo cual es una suposición altamente arriesgada. Otra opción sería considerarlos a todos vivos, pero esto conduciría a una subestimación del verdadero efecto de la exposición. Si consideramos que todos han fallecido, por la misma razón sobreestimaremos el efecto. El método más apropiado es seguir cuantificando la relación personas-año hasta la última fecha en que se supo que el sujeto estaba vivo y no hacer suposiciones sobre su estado vital con posterioridad. A veces se sabe que un miembro de la cohorte ha fallecido pero no se conoce la causa de su muerte, ya sea por falta de información o por datos inadecuados del certificado de defunción. Podemos clasificar las causas de la muerte de estos individuos como «desconocidas» o si no, asumir la misma distribución de muertes para estos miembros que para los conocidos. De nuevo, la última alternativa asume que no existen diferencias entre estas categorías, por lo que es mejor la anterior opción y clasificar las causas de muerte como «desconocidas». Los estudios de cohortes retrospectivos generalmente son estudios de mortalidad porque es muy difícil encontrar otros indicadores de morbilidad disponibles en registros. Sin embargo, en algunos países el registro de cáncer recoge datos de casos incidentes, por lo que es posible entonces efectuar estudios retrospectivos sobre la incidencia de cáncer. En algunos países también se pueden encontrar datos sobre incapacidades permanentes y morbilidad crónica (por ejemplo, en Finlandia, de forma informatizada desde
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
109
1969). De todas formas, con el paso del tiempo, los cambios en la legislación sobre bienestar social pueden hacer más difícil la interpretación de estos datos. Una cohorte prospectiva es aquella que se define en el presente y se sigue en el futuro. Mediante diseños prospectivos se pueden estudiar otros indicadores de morbilidad además de la muerte. Se pueden realizar mediciones de exposición de forma regular y sistemática, lo cual es una gran ventaja frente a los diseños retrospectivos. El seguimiento de los que han dejado su empleo también puede planearse de manera más efectiva. Si no fuera por estos motivos, el diseño de una cohorte prospectiva no diferiría mucho de un estudio retrospectivo. La Tabla 4.1 muestra los principios de la tabulación de los datos de un estudio de cohortes empleando una cohorte ad hoc de referencia. En este ejemplo, la cohorte expuesta y la de control se comparan en relación con una sola enfermedad. La proporción de enfermos en la cohorte de expuestos es R1 = C1/N1 y en la cohorte de referencia es R1 = C0/N0. Entonces RR = R1/R1. Ejemplo 6. Supongamos que se hace un seguimiento durante 5 años de 343 trabajadores de rayón viscosa y de 343 trabajadores de una fábrica de papel y se observa que 14 trabajadores de la primera han muerto por infarto de miocardio y en la fábrica de papel sólo 3 trabajadores han fallecido por dicha causa. Si sustituimos las letras de la Tabla 1 por estas cifras se obtendría el siguiente resultado:
Como ya se ha comentado en el Capítulo 2, cuando el RR es mayor que 1, la morbilidad de la cohorte expuesta es más alta que
110
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Tabla 4.2. Información complementaria del RR y de la DTa.
a
Los valores observados (O) y los esperados (E) son los numeradores de las tasas de incidencia/10.000 personas-año.
la de la cohorte de referencia. En este ejemplo, realmente había una cohorte de referencia, pero a menudo la mortalidad total y la específica de la cohorte expuesta se comparan con las cifras esperadas procedentes de la población general y estandarizadas por edad, sexo y período de tiempo, lo que permite obtener la RME en lugar del RR estandarizado. Una RME superior a 100 sugiere una mortalidad elevada entre los expuestos, pero si es menor que 100, la interpretación no es tan fácil debido al llamado efecto del trabajador sano, que a menudo puede actuar como factor de confusión en la comparación (ver el Capítulo 5). El RR y la RME se calculan como estimaciones puntuales («las mejores estimaciones»). Como cualquier estimación puntual varía de forma aleatoria, siempre debe calcularse su correspondiente intervalo de confianza (ver el Capítulo 2). El RR y la RME describen la magnitud del riesgo o la fuerza del efecto de la exposición. La importancia del problema desde el punto de vista de la salud pública, es decir, cuántos casos adicionales de la enfermedad en cuestión están provocados por la exposición, se describe mejor mediante la diferencia de tasas (DT), que se calcula de la siguiente manera:
En la Tabla 4.2 se compara la información obtenida por el RR y la DT en un ejemplo hipotético de dos estudios, uno de una enfermedad rara y otro en que la enfermedad es frecuente. Cuando se trata de una enfermedad rara, es posible obtener un RR muy alto con una DT muy baja (sólo hay una pequeña diferencia entre los
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
111
valores observados y los esperados). Por el contrario, si la enfermedad es frecuente, un RR bajo no excluye la posibilidad de una DT relativamente elevada (la diferencia es grande). Por lo tanto, se deben tener en cuenta ambas medidas al analizar los resultados de un estudio de cohortes. Como ya se ha comentado, los estudios de cohortes retrospectivos generalmente son estudios de mortalidad en los que se usa la experiencia de mortalidad de la población general como referencia. En el ejemplo 7 se ilustra un estudio de cohortes retrospectivo. Ejemplo 7. Coggon et al.3 estudiaron la mortalidad de los trabajadores expuestos al estireno en la producción de plásticos reforzados con vidrio. Los individuos fueron identificados a partir de los registros del personal y de las nóminas de ocho compañías británicas. Para cada sujeto se recogieron el nombre, el sexo, el domicilio, la fecha de nacimiento, el número de la seguridad social y un historial de los empleos a lo largo de toda su vida laboral, incluidas las fechas del primer y último empleo. A partir de los registros, en total se identificaron 8.354 individuos, de los cuales 405 tenían datos incompletos. Otros 205 individuos no pudieron ser localizados en los ficheros de los registros disponibles y 175 emigraron durante el período de estudio; para ambos grupos se calcularon las personas-año de empleo en alguna de las empresas; como estos individuos permanecieron en estudio durante al menos cierto período de tiempo, no fueron excluidos completamente y, por ello, la población cualificada para el análisis incluía a todos los que tenían registros completos al inicio, es decir 7.949 individuos, de los cuales 6.638 eran hombres y 1.311 mujeres. Con la ayuda de la dirección y el personal de las compañías, cada empleo se clasificó en relación con la exposición potencial al estireno. Esta identificación se hizo antes de que los investigadores tuvieran conocimiento alguno del estado vital de los sujetos, una precaución importante para evitar el sesgo del observador (ver el Capítulo 5). La exposición se clasificó en cuatro categorías, según su intensidad. No pudo disponerse de ningún dato sobre higiene laboral hasta 1975, pero a partir de entonces se efectuaron mediciones de la concentración de estireno en cuatro de las empresas. Esta situación es muy frecuente en estudios retrospectivos, y en tales casos debe realizarse una estimación de la exposición real en base a los datos disponibles de cualquier tipo.
112
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Los autores estimaron, a partir de las mediciones disponibles, que la categoría con una exposición más elevada correspondía a una media ponderada de 8 horas de exposición de 40 a 100 ppm. Las máscaras antigás no parecían haber modificado de manera significativa el nivel de exposición. En relación con otras exposiciones que tener en cuenta, fueron consideradas como las más importantes: la fibra de vidrio, la acetona, la metiletilacetona, los peróxidos orgánicos y, en dos fábricas, el asbesto. Mediante el registro central del Servicio de Salud Nacional Británico y el índice Nacional de Seguros, los miembros de la cohorte fueron seguidos y se determinó su estado vital hasta el 31 de Diciembre de 1984. Se obtuvieron los certificados de defunción de los que habían muerto y las causas de la muerte se codificaron de acuerdo con la novena revisión de la Clasificación Internacional de Enfermedades. La mortalidad de la cohorte se comparó con la de la población general de Inglaterra y Gales mediante el método de personas-año. El análisis incluía subgrupos, en relación con la duración del empleo y el grado de exposición potencial al estireno. Inicialmente, la cohorte se analizó como una población homogénea, con la excepción de una empresa que se caracterizaba por disponer de unos registros peores que la media. El análisis de la mortalidad específica por causas de la cohorte completa no reveló ningún dato importante. Ninguna de las RME superiores a 100 calculadas para cada grupo de enfermedades o para distintas localizaciones de cáncer fueron estadísticamente significativas (es decir, todos los límites inferiores de los intervalos de confianza del 95% estaban por debajo del 100). No habría sido correcto dejar el análisis en este punto porque sólo 2.458 trabajadores habían estado trabajando expuestos al estireno durante más de un año. Además, 1.376 trabajadores habían estado expuestos sólo a niveles bajos (se solapaban parcialmente con la categoría anterior) y aproximadamente una cuarta parte de los trabajadores había entrado en contacto con la exposición tan recientemente que el período de latencia para las neoplasias relacionados con el trabajo seguramente no era lo suficientemente largo. Todas estas consideraciones tienden a diluir el efecto en el análisis de una cohorte si ésta se trata como una población homogénea. Por ello, los autores hicieron subanálisis de la mortalidad por cáncer según el grado de exposición, la duración, el tiempo transcurrido desde la primera exposición y la fecha de la primera exposición al estireno. Ninguno de estos análisis poste-
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
113
ñores reveló un exceso de cáncer de cualquier localización, pero la formación de estos subgrupos hizo que en cada comparación las cifras esperadas fuesen menores. Por lo tanto, un material que superficialmente era grande demostró ser sustancialmente más pequeño cuando el análisis se centró en las subcategorías que aportaban información. El hecho está en que el número de individuos que aportaban información, es decir, los expuestos a elevadas concentraciones desde hacía tiempo y durante un largo período, era realmente más bien pequeño. Este problema ocurre muchas veces en los estudios epidemiológicos sobre el cáncer. En el análisis los autores no ajustaron por otras exposiciones concurrentes (factores de confusión). Dado que los resultados del estudio fueron negativos, no había ninguna razón para analizar los datos sobre los efectos de varias exposiciones por separado, pero si los resultados hubiesen sido positivos en cualquiera de los subanálisis, o para cualquier tipo de tumor, hubieran sido necesarios análisis posteriores de otras causas potenciales, aparte el estireno. El estudio resumido en el ejemplo 7 es un ejemplo típico de un
diseño de cohortes retrospectivo. Sólo se podía estudiar la mortalidad, había problemas para la obtención de datos de exposición precisos y, a pesar de que el número de individuos de la cohorte era elevado, el número de individuos que verdaderamente aportaron información resultó ser comparativamente pequeño. Un estudio de cohortes prospectivo es una buena alternativa a uno retrospectivo cuando la ocurrencia de la enfermedad se sitúa en el tiempo cerca de la exposición (período de latencia corto) y cuando se desean estudiar indicadores de morbilidad distintos de la muerte. El ejemplo 8 ilustra estos puntos. Ejemplo 8. Tola et al.16 investigaron la secuencia de aparición de manifestaciones hematológicas en la intoxicación por plomo. Con este objetivo, seleccionaron a 33 trabajadores expuestos al plomo por primera vez en su vida. Mediante su historial ocupacional y pruebas bioquímicas, se comprobó que no hubiesen sufrido ninguna exposición al plomo con anterioridad. Posteriormente se inició un seguimiento de estos trabajadores; fueron los indicadores de exposición la concentración de plomo en sangre (Pb-S) y en orina (Pb-O), mientras que el valor de hemoglobina, hematócrito, actividad del ácido δ -aminolevulínico
114
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
deshidratasa eritrocitario (AAL-D) en sangre y las concentraciones de ácido δ -aminolevulínico (AAL) y coproporfirina (CP) en orina, se utilizaron como parámetros indicativos de enfermedad. Los métodos analíticos se estandarizaron y comprobaron regularmente mediante programas de control de calidad. De acuerdo con el protocolo del estudio, se realizaron determinaciones analíticas antes del comienzo de la exposición y al segundo, cuarto y sexto día después de la misma; posteriormente las determinaciones se hacían a intervalos semanales hasta el final del tercer mes. Durante el cuarto mes, se tomaron dos muestras más con intervalos de dos semanas. Las ventajas del diseño prospectivo fueron obvias en este estudio. Existía la posibilidad de efectuar mediciones repetidas de los indicadores de morbilidad, de monitorizar regularmente la exposición y de usar a la vez ciertos indicadores «blandos» de ocurrencia de enfermedad. Además, un programa analítico de control de calidad incrementó la fiabilidad de las mediciones. Sin embargo, también hubo problemas. El protocolo de muestreo se interrumpió durante los fines de semana, cuando hubo bajas por enfermedad y por otros motivos de absentismo laboral (por ejemplo, después de turnos de noche). Varios miembros de la cohorte dejaron el trabajo al cabo de poco tiempo, y en dos trabajadores la concentración de Pb-S sobrepasó los niveles considerados como estándar en higiene (70 µg/100 ml) por lo que debieron ser trasladados a un puesto laboral sin exposición. Sólo 18 de los 33 trabajadores iniciales permanecieron en seguimiento durante los 4 meses planificados en el protocolo de estudio. Los resultados mostraron que la actividad del AAL-D se inhibía cuando aumentaban las concentraciones de Pb-S, sin mediar ningún lapso de tiempo, mientras que la excreción de CP y AAL aumentó sólo a partir de la segunda o tercera semana. Las relaciones entre las concentraciones de AAL y CP urinarias, por un lado, y de Pb-S por otro, fueron las mismas que las demostradas previamente por estudios transversales. Aunque los valores de hemoglobina en sangre se mantuvieron en límites normales, se pudo observar un ligero descenso durante los 4 meses de seguimiento. La ventaja del diseño prospectivo frente al transversal convencional fue el poder demostrar la secuencia temporal de los diversos efectos tóxicos del plomo. Una rotación rápida de individuos al comienzo del empleo significa una pérdida de material cuando se sigue de forma prospec-
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
115
tiva una cohorte de inicio. Especialmente cuando se requieren datos básales (es decir, cuando se examina a todos los sujetos antes del comienzo del empleo), dicha rotación causa pérdidas en términos de trabajo innecesario (desde el punto de vista del estudio) porque los que dejan el trabajo no contribuyen con ninguna información al estudio. Por el contrario, una rotación tardía no es un problema tan grave para el estudio porque, a pesar de todo, dichos individuos han estado sometidos a la exposición durante cierto tiempo y sus resultados aportan al menos alguna información. Sin embargo, su seguimiento es laborioso y a menudo han perdido la motivación para seguir contribuyendo al estudio, con lo cual pueden rechazar las evaluaciones posteriores. En el estudio resumido en el ejemplo 8 surgió también un problema ético. El investigador nunca debe permitir que el nivel de exposición alcance límites peligrosos. Si se ha producido tal situación, el investigador debe informar al trabajador y proponerle un traslado a un puesto de menor exposición. En la práctica, el trabajador desaparece entonces del estudio, sobre todo si la exposición alcanza niveles peligrosos precozmente en el curso del seguimiento. Cuando la estimación puntual del RR es mayor que 1, la parte del exceso de riesgo provocado por la exposición en cuestión, conocida como proporción atribuible15 o fracción etológica (FE) entre los expuestos12, se puede calcular de la siguiente manera:
donde: O = el número de casos observados en la cohorte expuesta E = el número de casos esperados o, alternativamente, el número observado en el grupo de referencia de igual tamaño. Ejemplo 9. Supongamos que se observan 30 casos de cáncer de pulmón en una cohorte de trabajadores de la industria del cromo. El número esperado era 11. Entonces, O/E = 30/11 = 2,8 y la FE = (2,8 - l)/2,08 = 0,64. En otras palabras, el 64% de los casos de cáncer de pulmón (estimación puntual) pueden atribuirse a la exposición al cromo, siempre y cuando el estudio sea válido.
116
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
La fracción etiológica hallada en un estudio determinado no puede generalizarse porque depende de la fuerza y duración de la exposición y de otras características de la población específica expuesta. Además, su interpretación es compleja. Por tratarse de una proporción, se ve también influida por el efecto de otros factores de riesgo concomitantes. Si disminuye el efecto de los otros factores de riesgo, la fracción etiológica de la exposición en cuestión se incrementa automáticamente, incluso si el nivel de exposición y el número de casos permanecen constantes4. Finalmente, como los conceptos de etiología multifactorial son complejos, la interpretación del significado de la fracción etiológica es aún más difícil (ver el Capítulo 1). El efecto de dos fracciones etiológicas puede ser aditivo o sinérgico. Si es sinérgico o multiplicativo, el efecto conjunto de los factores individuales sobrepasa su suma. Ejemplo 10. El efecto combinado del tabaquismo y la exposición al asbesto sobre la incidencia de cáncer de pulmón es un ejemplo típico de sinergismo. Por ejemplo, en el estudio de Hammond et al.7, el RR de cáncer de pulmón para los trabajadores no fumadores y no expuestos al asbesto se consideró de 1. La estimación puntual del RR para los no fumadores expuestos a asbesto fue de 5,2 y para los fumadores no expuestos a asbesto de 10,9. Sin embargo, la estimación del RR para los fumadores expuestos al asbesto resultó ser de 53,2, que se aproxima a: 5,2 x 10,9. Las cifras hacen referencia a los casos de cáncer de pulmón que aparecieron 20 años o más después del inicio de la exposición. Los autores estimaron que un 92% de los casos se podrían haber prevenido con sólo eliminar el simple hecho de fumar, y un 81% con sólo eliminar la exposición al asbesto en los trabajadores fumadores y expuestos. La «eliminación» se refiere a la situación teórica en que los trabajadores nunca hubiesen fumado o nunca hubiesen estado expuestos al asbesto. El efecto de dejar de fumar o de cesar la exposición al asbesto en un estadio tardío no se contempla en este ejercicio. Sin embargo, las cifras muestran la fuerza del efecto preventivo si se «elimina» uno de los dos factores multiplicativos.
Muestreo de casos y controles en una base de cohortes Cada vez es más común obtener información de un estudio de tipo base de cohortes mediante muestreo. Una variante de este di-
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
117
seño es el anteriormente denominado «diseño de casos y controles anidado». Para que este tipo de diseño sea eficiente, la base de cohortes utilizada debería diferir de la diseñada para un estudio de tipo censo, el cual se centra en sujetos con una exposición elevada y/o de larga duración. Si se planifica un muestreo —muestreo de casos y controles en una base de cohortes—, la base debería incluir individuos muy expuestos, individuos con un nivel menor de exposición (en términos de intensidad, duración o ambos) e individuos no expuestos, para asegurar diferentes niveles de exposición. En el diseño de la base de cohortes se deberían aplicar principios experimentales para la distribución de la exposición, del mismo modo que se describió anteriormente en los estudios de tipo censo. Los estudios de casos y controles basados en poblaciones dinámicas son aún más conocidos que los diseños de casos y controles de una base de cohortes. En muchos aspectos son similares; por ello en la sección «Estudios de base de población dinámica» se da una descripción más detallada de los aspectos comunes, mientras que este apartado se centra en aspectos típicos de los estudios de casos y controles extraídos de una base de cohortes. Todos los casos que aparecen en una base de cohortes pasan a formar la serie de casos, pero sólo una muestra aleatoria de la misma pasa a constituir el grupo control. A continuación, los investigadores recogen información sobre la exposición mediante entrevistas dirigidas a los casos y a los controles o a sus familiares más próximos, o averiguando las funciones personales de cada empleado, o mediante la construcción de una matriz de exposición laboral (MEL) (ver el Capítulo 3). Si la exposición en cuestión aumenta la morbilidad, se clasificarán más casos que controles en la categoría de «expuestos», siempre que el gradiente de exposición en la base de cohortes sea suficientemente amplio. Es realmente importante asegurar, en la fase de diseño del estudio, que la base de cohortes comprenda una proporción suficiente de individuos ligeramente expuestos y de no expuestos, del mismo modo que se compara una cohorte expuesta con una no expuesta en un estudio de tipo censo. Si se planificó desde un principio tener una cohorte «expuesta» y una cohorte «control», solamente es natural su combinación. Un enfoque de casos y controles en una cohorte formada sólo por individuos «expuestos» no será útil, ya que las diferencias serán
118
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
demasiado débiles. Es necesario hacer énfasis en este aspecto, porque hoy en día muchos estudios se inician como estudios convencionales de cohortes (estudios RME) basados en exposiciones fuertes de larga duración y tomando a la población general como categoría de control. Posteriormente, como medio para eliminar los problemas surgidos por el efecto del trabajador sano (ver el Capítulo 5), se efectúa un análisis de casos y controles procedentes de la cohorte expuesta original, lo que permite al investigador profundizar mejor en los historiales de exposición (de una muestra de la cohorte). En cualquier caso, tal constelación es ineficiente (enmascaramiento de efectos) porque en realidad, debido al diseño, no existen individuos no expuestos en la cohorte. Por este motivo, el análisis de dicha base de cohortes mediante un diseño de casos y controles no proporciona la información deseada. La solución está en formar una base de cohortes de manera distinta desde el comienzo. Los individuos no expuestos pueden encontrarse en otros centros de trabajo con patrones de exposición diferentes de aquellos que presenta la población expuesta. También es posible incluir en la base de cohortes a diferentes tipos de personal empleado por la misma empresa. Los casos pueden parearse a uno o más controles procedentes de la misma base del estudio o, simplemente puede dejarse a los casos y a los controles sin parear. En la actualidad, el pareamiento es cada vez menos popular porque puede introducir factores de confusión negativos (ver el Capítulo 5). Las tablas 4.3 y 4.4 (en la próxima sección) muestran la forma de presentar los resultados de una comparación de casos y controles. La OR es una estimación indirecta del riesgo de la enfermedad en los expuestos en relación al de los no expuestos. Procede de la comparación de las frecuencias de exposición de los casos con las de una muestra de la base de cohortes (de no casos). Este tipo de estudio de casos y controles es eficiente, como todos los demás estudios, sólo si han ocurrido un número suficiente de casos de la enfermedad de interés en la población que compone la base del estudio. El término «suficiente» es, por supuesto, un concepto vago; puede interpretarse como que deben ocurrir por lo menos de 40 a 50 casos. Para disponer de muchos casos se requiere tener una gran base de cohortes, sobre todo si la enfermedad es poco frecuente en la población general. Sin embargo, como sólo se pro-
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
119
fundizará en la historia de exposición de una parte relativamente pequeña de la población en estudio, es decir, en los casos y en los controles, el requisito de una gran base de estudio no es necesariamente prohibitivo desde un punto de vista económico. Un muestreo de la base de cohortes generalmente es más eficiente en relación con el coste que un diseño convencional de cohortes de tipo censo.
En un estudio convencional de cohortes (de tipo censo), los que no contraen la enfermedad estudiada sólo contribuyen aportando información al denominador (personas-año), y el esfuerzo dirigido a la obtención de datos de exposición (antes de que se conozca la ocurrencia de enfermedad) podría ser inútil. Si se hace un muestreo de la base de cohortes, se puede obtener la información relevante mediante la comparación de los casos con una muestra de controles de la misma base. No es necesario buscar datos del resto de la población, lo cual representa generalmente entre un 80 y un 90% de todo el material. Como ya se ha mencionado, la base de cohortes puede estar diseñada para «enriquecer» la exposición si el material en estudio se selecciona de manera que la proporción de casos y controles expuestos sea más elevada. Debemos destacar que cuanto más común sea la enfermedad en la base en estudio, la OR sobreestimará más el verdadero valor del RR si los controles son los no casos. Un muestreo aleatorio de la base para obtener los controles, en el que los casos puedan ser escogidos como controles además de ser casos, salva este problema. Ejemplo 11. Partanen et al.14 diseñaron una base de cohortes para investigar la posible asociación entre el cáncer de pulmón y la exposición a algunos agentes químicos usados en la industria de la madera (formaldehído, clorofenoles, algunos fungicidas, etc.). En este ejemplo sólo se va a tener en consideración el formaldehído. El material de estudio se obtuvo de 19 fábricas de madera conglomerada, contrachapada, de cola de formaldehído y serrerías.
120
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
La base de cohortes se definió como el seguimiento de los hombres empleados por estas fábricas entre 1944 y 1966, y que hubieran estado trabajando durante al menos un año. Un total de 7.307 hombres cumplían estos criterios. Antes del comienzo del estudio, los investigadores estimaron que el 28% de los individuos habían estado expuestos al formaldehído, por lo que la base del estudio contaba ya con suficientes diferencias en la variable exposición. Ocurrieron un total de 136 casos de cáncer de pulmón en la base del estudio. Un patólogo experto valoró todos los casos mediante la revisión de las historias clínicas de los hospitales, los registros de las autopsias y las preparaciones anatomopatológicas, en caso de estar disponibles. En tres enfermos el diagnóstico fue incorrecto y se excluyeron del grupo de casos, que pasó entonces a estar formado por 133 individuos. Para cada caso se escogieron tres controles de la misma base de cohortes (en total 408), que se parearon según el año de nacimiento. Además, el control no debía padecer cáncer de pulmón y debía estar vivo en el momento del diagnóstico del caso. Por otra parte, los controles se seleccionaron aleatoriamente. Se recogió la historia de exposición de los casos y de los controles desde el inicio del empleo y un experto higienista construyó una matriz de exposición laboral (MEL) en base a las visitas efectuadas a cada fábrica y a la utilización de todas las mediciones higiénicas disponibles. Al visitar una fábrica medía en pocos minutos la concentración de formaldehído en aquel momento. Se construyó una MEL separadamente para cada tarea en cada fábrica y para los distintos períodos del año. El higienista no conocía si los individuos eran caso o control. Los datos se recogieron a partir de las historias laborales y se complementaron mediante entrevistas efectuadas a los capataces. Además, se entregó un cuestionario a cada caso y a cada control o a su familiar más cercano. Después, las historias ocupacionales se codificaron en categorías ocupacionales de acuerdo con la MEL. Las historias ocupacionales y la MEL se combinaron usando un ordenador y se calcularon los índices de exposición al formaldehído (y otras exposiciones) asumiendo períodos de latencia de distinta duración. El siguiente paso fue calcular el valor de la OR para distintos tipos de comparaciones (sin latencia, con distintos períodos de latencia, estandarizada según exposiciones que pudieran actuar como factor de confusión). Los estimados puntuales de los valores de la OR oscilaron entre 0,82 y 1,95, pero como
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
121
ninguno de ellos difería estadísticamente de la unidad, el estudio no permitió obtener conclusiones claras con respecto a la relación entre exposición al formaldehído y cáncer de pulmón. No se pudo verificar dicha relación porque el estudio tenía una potencia estadística baja debido al pequeño número de casos expuestos y un período de seguimiento comparativamente corto para muchos de los trabajadores.
Como se ha podido ver en este ejemplo, el objetivo del estudio era el seguimiento de una cohorte que había sido diseñada para incluir tanto a individuos expuestos como no expuestos, con el fin de asegurar diferencias en la exposición. La frecuencia de exposición al formaldehído era lo suficientemente alta (28%) para que, en ese sentido, el estudio fuese eficiente. Dicha frecuencia era mucho más elevada de la que se hubiese hallado un estudio de casos y controles basado en la población general. Se registró la exposición, para todos los casos pero sólo para una muestra de los controles, tal como se hace en este tipo de estudios. El propósito del muestreo de los controles era medir la frecuencia de exposición en la base del estudio y así aportar una estimación de la razón de tasas de incidencia. Otra posibilidad es que, en lugar de una muestra de los no casos, podía utilizarse una muestra de toda la base del estudio. En el ejemplo, la pequeña diferencia existente entre las tasas de incidencia de los expuestos y los no expuestos podría ser debida al azar, y por esto el estudio no aportó datos concluyentes sobre la carcinogenicidad del formaldehído. Algunas cifras pueden mostrar la gran ventaja económica que supone el hecho de estudiar sólo una muestra de los controles. En lugar de tener que evaluar los historiales laborales de los 7.307 miembros de la cohorte, sólo se seleccionaron 408 controles y 133 casos, lo cual realmente ahorró un gran esfuerzo. También debemos destacar que los diagnósticos de los casos fueron confirmados por un patólogo. En un estudio de cohortes en el que se tomara a la población general como grupo control para calcular la RME, la comprobación de los diagnósticos de los casos expuestos sería incorrecta, ya que las comprobaciones de los diagnósticos en la población control no son posibles. Sin embargo, en este ejemplo, no se han calculado los valores de la RME (o no podían calcularse) de la cohorte. Por el contrario, el objetivo era cal-
122
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
cular la OR para el riesgo de cáncer entre los expuestos, sólo en base a la experiencia de la cohorte, comparando el número de casos expuestos con el de controles también expuestos. En tal situación, es importante verificar que los casos sean realmente casos, ya que, si no, podría producirse una dilución del verdadero efecto. En este ejemplo, la proporción de diagnósticos erróneos resultó ser sólo de 3 casos de los 60, es decir, un 5%, lo cual constituye un margen de error pequeño. Sin embargo, el margen de diagnósticos erróneos es a menudo más elevado. El hecho de escoger controles de entre los que aún estaban vivos cuando se diagnosticaron los casos produjo una asimetría del estado vital entre casos y controles. Dado que el pronóstico del cáncer de pulmón es malo, comparativamente había más controles que casos vivos cuando se recogió la información de los historiales de exposición. Los propios individuos aportan generalmente un historial de exposición más detallado que el aportado por un familiar cercano, por lo que se corría el riesgo de introducir sesgos de información (ver el Capítulo 5). En este estudio, la sobrerrepresentación de controles vivos podría haber producido un sesgo de información negativo (enmascaramiento del efecto). Un escrutinio de las historias de exposición mostró que esta suposición era correcta, y el sesgo se controló analizando los datos obtenidos de los casos y controles vivos, separadamente de los obtenidos de familiares próximos. ESTUDIOS DE BASE DE POBLACIÓN DINÁMICA Una población dinámica (Figura 4.3) difiere de una cohorte en el sentido de que tiene una rotación de individuos. Durante el período de seguimiento, se incorporan nuevos individuos a la población, mientras que otros se marchan. Ya que es difícil el seguimiento de los miembros de una cohorte que han dejado el empleo, una base de población dinámica, considerada superficialmente, parece ser más coste-efectiva que un estudio de base de cohortes de tipo censo. De hecho, en el terreno de la Salud Pública se prefieren las bases de población dinámica a las bases de cohortes. Sin embargo, como se ha dicho antes, este enfoque también presenta problemas cuando se estudian enfermedades
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
123
Figura 4.3. Estructura de una población dinámica. Existe una rotación de individuos, y si ésta se equilibra, la población dinámica no envejece durante el seguimiento.
ocupacionales. Para superar las distorsiones provocadas por la movilidad selectiva a consecuencia de la enfermedad (por ejemplo, las personas enfermas dejan el trabajo «expuesto»), una población dinámica tiene que ser tan grande que aquellos que cambian de empleo todavía estén incluidos en ella. Un censo de una población tan grande sería poco factible. Otra opción sería un diseño basado en el muestreo. Principios del diseño de casos y controles Un diseño en el que se muestrea una base de población dinámica es idéntico al diseño clásico de casos y controles. Todos los casos que se han producido se han obtenido de la base del estudio
124
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Tabla 4.3. Muestra de una tabla que presenta los resultados de un estudio de casos y controles no pareados.
y se comparan con una muestra de controles tomados de la misma base. Esta muestra ha sido tradicionalmente una muestra de no casos, pero recientemente Miettinen12 y otros autores se han mostrado partidarios de tomar la muestra de la base completa. Esta práctica puede condicionar que un caso sea incluido entre los controles además de ser caso. En teoría no hay diferencias entre un diseño de casos y controles y uno de tipo censo. En ambos casos, el objetivo es estudiar si una determinada exposición causa una determinada enfermedad. La diferencia está en el método por el cual se obtiene la información. En un enfoque de censo se estudian todos los miembros de la base, mientras en un enfoque de casos y controles se estudian igualmente todos los casos, pero solamente una muestra de controles. A pesar de que estos dos tipos de estudio son diferentes desde un punto de vista empírico, conceptualmente no lo son. Cuando se han identificado los casos, se selecciona una muestra de la base de estudio (o de los no casos) para formar el grupo control y para el análisis se recogen los historiales de exposición de los casos y de los controles. A partir de las diferencias en las frecuencias de exposición puede obtenerse una medida indirecta del riesgo de los individuos expuestos a contraer la enfermedad en cuestión (en relación con el riesgo de los no expuestos). Los casos expuestos y no expuestos constituyen los numeradores de las tasas de incidencia estimadas. La información sobre los denominadores deriva de los controles expuestos y no expuestos (ver la Tabla 4.3). La Figura 4.4 muestra el diseño de un estudio de casos y controles. Es importante que el diagnóstico del caso sea correcto porque los diagnósticos erróneos no diferenciales enmascaran el ver-
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
125
Figura 4.4. Esquema de un estudio de casos y controles.
dadero efecto de la exposición. Para verificar el diagnóstico, se deberían comprobar todas las fuentes de información disponibles, tales como las historias clínicas de los hospitales y los informes de las autopsias. Los casos pueden seleccionarse de los registros nacionales o locales de las causas de defunción, de los registros de cáncer, de los hospitales y de muchas otras fuentes, siempre que la exactitud del diagnóstico sea buena. Muchos registros no cumplen los criterios para ser fuentes válidas de casos. En los estudios sobre cáncer, es importante especificar incluso el tipo histológico del tumor, porque distintos tipos pueden tener distintas etiologías. La inclusión de un patólogo experto como miembro del equipo de investigación puede ayudar mucho a mejorar la exactitud diagnóstica. Si la exactitud es pobre y no puede mejorarse, lo mejor es abandonar el proyecto.
126
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
En un estudio de casos y controles se comparan los historiales de exposición de los casos y de los controles. Los casos forman los numeradores de las tasas de incidencia estimadas. La información de los denominadores deriva de los controles.
Los controles pueden seleccionarse de muchas maneras, pero deben pertenecer a la misma base en estudio que los casos. Como un estudio de casos y controles se basa a menudo en cuestionarios y entrevistas, es decir, en datos anamnésicos, es importante asegurar una cooperación total por parte de los controles. Mientras una persona enferma (el caso) generalmente ve la entrevista como algo razonable, las personas sanas dudan antes de contestar a un cuestionario largo o responder a una entrevista que para ellos no tiene tanta importancia. Incluso los que cooperan puede que faciliten un historial no tan detallado y exacto como el de los casos (ver el Capítulo 5). Por esta razón muchos investigadores prefieren usar pacientes que tengan otra enfermedad distinta como controles. Estos controles también deberían pertenecer a la misma base del estudio que los casos; por lo tanto, deberían seleccionarse del mismo hospital. Este hospital debería ser el mismo que les atendiera si fuesen casos. La misma norma se aplica a las demás fuentes de información, por ejemplo, los registros. Deberíamos tener en cuenta muchos aspectos éticos cuando se entrevista a personas enfermas o a familiares cercanos de la persona difunta. El entrevistador deberá ser considerado y amable, y la entrevista sólo podrá llevarse a cabo con el pleno consentimiento del sujeto (ver el Capítulo 8). Como el diseño de casos y controles se centra en la información sobre la exposición obtenida a partir de entrevistas con pacientes de una determinada enfermedad —la enfermedad que se estudia—, junto con una muestra de la base del estudio, los controles, la asociación de la enfermedad con exposiciones perjudiciales sólo puede investigarse para una sola enfermedad a la vez. Por el contrario, este diseño permite estudiar de forma concomitante el efecto de diversas exposiciones. Este enfoque se usa a veces en los llamados estudios exploratorios, que no tienen ninguna hipótesis previa.
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
127
Sin embargo, es factible usar la misma base en estudio para realizar varios estudios de casos y controles concomitantes para distintas enfermedades. Por ejemplo, es práctico seleccionar de un registro de cáncer varias series de casos de tipos diferentes de tumores, junto con un grupo similar de controles, y remitirles los cuestionarios simultáneamente. En este caso, se trata de varios estudios de casos y controles con una misma base de estudio (por ejemplo, la experiencia de la población dinámica de todo el país durante 3 años). Debido a la naturaleza anamnésica de los datos de exposición, se debe ser muy cauteloso para asegurar que la calidad de la información sea simétrica. Estos problemas se discutirán en el Capítulo 5. Un estudio de casos y controles puede investigar la relación de ocurrencia entre una enfermedad y varias exposiciones simultáneamente.
Los casos y los controles pueden obtenerse y analizarse como series independientes o como grupos pareados. Cada caso puede ir unido a un control; el diseño se llamará entonces un diseño de pares ligados. Si se unen dos controles a cada caso, se habla de tripletes. A veces se pueden unir tres o incluso más controles a cada caso. Siempre que los costes para el estudio de más controles, pareados o no pareados, no sean prohibitivos, un número elevado de controles mejora la estabilidad de la estimación de la OR y, por ello, el estudio resulta más eficiente. Sin embargo, en general, las ventajas de tener más de cuatro controles son marginales. Estudios de casos y controles no pareados
La Tabla 4.3 muestra los principios para la comparación de los datos en un estudio de casos y controles no pareados. Se compara la frecuencia de una exposición cada vez y se pueden formar tablas similares para cada exposición en estudio. De esta forma, pueden calcularse las odds de exposición de los casos y las de los controles
128
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
y dividirse entre sí para obtener la odds ratio de exposición, OR. La OR estimada será:
La OR es una medida indirecta del riesgo de los expuestos a contraer la enfermedad, comparado con el riesgo correspondiente de los controles. Si hay más casos expuestos que controles, la OR es mayor que 1; por el contrario, si hay más controles expuestos, la OR será menor que 1. La OR no es exactamente la misma medida que el RR de un estudio de cohortes, pero cuando se cumplen determinadas condiciones, el RR puede ser aproximado mediante la OR. En primer lugar, no debe haber sesgos de selección (ver el Capítulo 5), es decir, tanto los casos como los controles deben ser representativos de la población de base. En segundo lugar, la enfermedad debe ser rara en la base del estudio (rara es un concepto vago; si está por debajo del 5% se considera «rara»). Sin embargo, bajo ciertas premisas, el RR se corresponde con la OR incluso sin la asunción de enfermedad rara1,6,11. Ejemplo 12. Supongamos que estamos interesados en estudiar la relación entre la bronquitis crónica y la exposición ocupacional al polvo en un grupo de pacientes atendidos en el centro de salud de una gran compañía, con una amplia gama de diferentes exposiciones. Todos ellos cumplen criterios de bronquitis crónica. El paciente atendido a continuación en dicho centro podía ser considerado el control. El estudio comprende 100 casos de bronquitis crónica y 100 controles. Estuvieron expuestos al polvo 40 casos y 15 controles (de acuerdo con unos criterios definidos). Así, C1 = 40, c0 = 60, n1 = 15 y n0 = 85. En consecuencia,
Estudios de casos y controles pareados A menudo los controles se parean a los casos en relación con potenciales factores de confusión, tales como la edad, el sexo y la
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
129
zona de residencia (ver el Capítulo 5). El procedimiento consiste en seleccionar uno o más controles para cada caso basándose en los criterios de pareamiento (por ejemplo, la edad con un intervalo de tres años, el mismo sexo, el mismo municipio o el mismo distrito, ya sea urbano o rural, y la misma categoría con respecto al tabaco). Cuantas más variables se utilicen para el pareamiento, más difícil será encontrar controles. El número de controles seleccionados para cada caso depende en gran parte de la disponibilidad de casos y controles. Si hay pocos casos disponibles, por ejemplo cuando la enfermedad es rara en la base del estudio, se puede aumentar la potencia estadística del estudio utilizando múltiples controles para cada caso10. Sin embargo, si el factor limitador es el económico o si el problema reside en encontrar suficientes entrevistadores, lo cual no sólo puede ser debido a un problema económico, no siempre es rentable utilizar los escasos fondos para entrevistar a un gran número de controles. En esta situación, un diseño uno a uno puede ser óptimo. También ocurre lo mismo si la disponibilidad de controles es menor que la de casos. El análisis de un diseño pareado se basa en los pares discordantes, es decir, en aquellos en que o el caso o el control han estado expuestos, pero no el otro miembro del par. Los pares concordantes (tanto el caso como el control han estado expuestos o no lo han estado ninguno de los dos) no se incluyen en el análisis. La Tabla 4.3 muestra la presentación de los resultados de una serie de pares (pareamiento uno a uno). El análisis no utiliza los números en f++ y f--; la razón f+-/f-+ es la que aporta toda la información. Según se indica en la Tabla 4, las letras hacen referencia a pares, y no a individuos como en la Tabla 4.3. Ejemplo 13. En un estudio nórdico conjunto de casos y controles se investigó la relación entre adenocarcinoma nasal y sinonasal y la exposición anterior al polvo de madera dura y blanda9. En total, se entrevistaron telefónicamente 167 casos vivos. Se seleccionó un control para cada caso y se parearon por edad, sexo y país de residencia. En el estudio real sólo dos casos y un control habían estado expuestos al polvo de madera dura, pero se han eliminado de este ejemplo para simplificar el problema. Por lo tanto, el número de pares se ha reducido de 167 a
130
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Tabla 4.4. Tabla que muestra los resultados de un estudio de casos y controles pareados (pareamiento uno a uno).
164. Los individuos que habían estado expuestos sólo a madera blanda se han clasificado como no expuestos en el ejemplo. En uno de los 164 pares, tanto el caso como el control se habían expuesto al polvo de madera dura, f++ según la Tabla 4. En 150 pares de los 164, ni el caso ni el control estuvieron expuestos al polvo, L según la Tabla 4.4. Las cifras que interesan son f+-y f-+. El caso, pero no el control, estuvo expuesto en 12 pares, de ahí que f+- = 12/164. El control estuvo expuesto en un solo par, por lo que f-+ = 1/164 . Si sustituimos las letras de la Tabla 4.4 por estos valores, se obtiene la distribución que se muestra en la Tabla 4.5. Toda la información de este estudio se halla en la razón f+-/ f-+ que es 12/1 =12. Los valores de f++ y de f-- no se usan para el cálculo de la OR. La OR de 12 es una estimación puntual; el IC95 es 2,4 - 59,2. Como el límite inferior del IC es mayor que 1, la OR = 12 es estadísticamente significativa al 5%. En otras palabras, el estudio confirmó la carcinogenicidad del polvo de madera dura. En ese mismo estudio se investigaron otras exposicioTabla 4.5. Estudio nórdico sobre cáncer nasal y sinonasala.
a
Cifras sobre la exposición al polvo de madera. Los números denotan pares, no individuos.
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
131
nes, pero este ejemplo es ya suficiente para ilustrar el diseño de pares ligados. Si los pares se hubiesen separado y el material se hubiese tratado como una serie independiente, el resultado hubiese sido el siguiente (nótese que los símbolos son los usados en la Tabla 4.3):
Recordemos que los dos casos y el control que habían estado expuestos sólo al polvo de madera dura fueron eliminados del estudio. En este caso los pares concordantes están también incluidos en el análisis y se han sumado a los casos y a los controles, respectivamente.
En este ejemplo, el análisis pareado fue más potente, aunque ambos enfoques dieron unos resultados similares.
ESTUDIOS DE MORTALIDAD PROPORCIONAL Los estudios de mortalidad proporcional ya han sido descritos en el Capítulo 2. En este apartado sólo se presentará una variante, la odds ratio de morbilidad (ORM), para ilustrar la semejanza conceptual entre los estudios de casos y controles y este tipo de estudios de mortalidad proporcional. Si un estudio de mortalidad proporcional se diseña de tal forma que las historias de exposición de los pacientes que han muerto debido a la enfermedad estudiada se comparan con las de los pacientes que han muerto por otras enfermedades (ver el Capítulo 2), el estudio puede considerarse como un tipo especial de estudio de casos y controles. La causa de muerte en estudio, por ejemplo la enfermedad coronaria, forma la serie de los casos. Las causas de mortalidad de los controles pueden ser todas las otras causas de muerte, o una causa de muerte determinada que no esté provocada ni prevenida por la exposición en estudio. Si en lugar de utilizar la razón de las proporciones de la causa de muerte [la razón de las proporciones de la causa de los «casos» con res-
132
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
pecto a todas las causas de muerte en las dos poblaciones, o Ci/(ci + n1) respecto a Co/(co + n0), lo que nos da la RMP (razón de mortalidad proporcional), usando los mismos símbolos que en el Capítulo 2], se calcula la razón de las odds de los casos y de los controles que han estado expuestos (la razón de casos expuestos/no expuestos con respecto a los diagnósticos de controles expuestos/no expuestos), la ORM resultante es:
La razón C1n0/c0n1 es la misma que la de la estimación cruda de la OR, lo cual indica la semejanza de un estudio de ORM con un verdadero estudio de casos y controles (ver el Capítulo 2). Sin embargo, siempre que la categoría de referencia sea la población general, como ocurre generalmente en los estudios de RMP, la validez del estudio no alcanza el nivel de la de un estudio convencional de casos y controles bien diseñado. ESTUDIOS DE INTERVENCIÓN Un estudio de intervención difiere de otros tipos de estudios epidemiológicos en el sentido en que el investigador modifica activamente las condiciones de exposición. Alternativamente, se pueden estudiar los efectos de las modificaciones de las condiciones de exposición, provocadas por otras causas. En este sentido, un estudio de intervención se asemeja a un experimento. De hecho, a la epidemiología de intervención frecuentemente se le llama también epidemiología experimental. Los estudios epidemiológicos experimentales pueden subdividirse en ensayos de campo, ensayos de intervención comunitaria y ensayos clínicos randomizados (ver, por ejemplo, la cita 15). Se han publicado muy pocos estudios de intervención en el terreno de la Epidemiología Ocupacional. En un ensayo de campo, la población está formada inicialmente por individuos que están sanos con respecto a la(s) enfermedad(es) en estudio. En general, la incidencia de muchas enfermedades es baja. Por ello, en este tipo de ensayos se necesitan grandes poblaciones y como consecuencia resultan caros. En el ámbito ocupacio-
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
133
nal, un ejemplo de este tipo de ensayos podría ser el estudio de los efectos preventivos derivados de la introducción de máscaras antigás sobre la incidencia de algunas manifestaciones tóxicas de un determinado agente químico entre los trabajadores expuestos. Otro podría ser el estudio de los efectos preventivos de un programa de mejora de las condiciones físicas individuales sobre la incidencia de trastornos lumbares en trabajadores industriales. En todos los ensayos de campo debe establecerse un sistema para la recogida continua de datos como, por ejemplo, evaluaciones periódicas de los sujetos, registro regular de los casos de enfermedad, un sistema para registrar las razones para dejar el trabajo, y que los individuos perdidos puedan seguirse con facilidad. Los grandes centros de trabajo con unos buenos servicios de salud ocupacional generalmente ofrecen mejores oportunidades para asegurar tales datos que el marco de los servicios públicos de salud. El proceso de intervención en los ensayos de campo debe asegurar una buena comparabilidad de los grupos en estudio. También se debe ser cuidadoso para minimizar el sesgo de información que podría aparecer a partir de las observaciones de los investigadores sobre la morbilidad. En Epidemiología Ocupacional es poco factible realizar estudios de manera que los investigadores se hallen «a ciegas». Podemos decir lo mismo respecto a la asignación randomizada. Por dicho motivo, la validez de estos estudios debe asegurarse mediante otros métodos (ver el Capítulo 5). En un ensayo de intervención comunitaria, la intervención tiene lugar en la comunidad, y no en el individuo. En Epidemiología Ocupacional, un ejemplo de esta intervención sería la modificación de un método de producción por otro en una fábrica, con lo que cesa el uso de un agente tóxico, o, alternativamente, se introduce el uso de un nuevo agente químico. Un ensayo clínico randomizado es un experimento con pacientes como sujetos y generalmente se pone en marcha para probar un nuevo tratamiento. Este es el único tipo de epidemiología de intervención que cumple los criterios de un verdadero experimento. Un ensayo clínico puede definirse como un estudio experimental en el que los pacientes se asignan de forma randomizada a un grupo que recibe el nuevo tratamiento o a uno que recibe un placebo o algún otro tratamiento. Los resultados de los distintos tratamientos se comparan. No es éticamente aceptable el uso de un placebo si se
134
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIÓN AL
dispone de un tratamiento eficaz. En tales circunstancias, los pacientes control generalmente reciben el tratamiento convencional y la eficacia del nuevo tratamiento se compara a la de éste. En un ensayo clínico, el investigador generalmente está a ciegas, lo cual quiere decir que los tratamientos están codificados y el investigador no sabe qué pacientes reciben el tratamiento antiguo o el nuevo. Realizar el procedimiento a ciegas es uno de los métodos para controlar el sesgo de información (ver el Capítulo 5). Generalmente los pacientes también están a ciegas por las mismas razones; en tal caso el ensayo se denomina doble ciego. Por tener un diseño puramente experimental, un ensayo clínico randomizado podría tal vez describirse como no perteneciente al ámbito de la Epidemiología. Los ensayos clínicos randomizados no se realizan en Epidemiología Ocupacional, pero proporcionan un paradigma para los estudios no experimentales en general (ver el Capítulo 5). Con excepción de los ensayos clínicos randomizados, los estudios de intervención difieren de los verdaderos experimentos porque en ellos la randomización no suele ser posible. Además, el control de otras exposiciones concomitantes generalmente no es factible, por lo que muchos estudios ocupacionales de intervención pueden considerarse como extensiones de los estudios de cohortes, en los que las comparaciones antes-después se llevan a cabo con métodos quasi-experimentales. Por razones éticas, de forma intencionada los niveles de exposición solamente pueden reducirse, pero nunca incrementarse. Sin embargo, a veces, circunstancias «naturales», como la introducción de nuevos procesos de producción, pueden hacer que el nivel de exposición aumente. Con buena suerte y estando muy alerta, el epidemiólogo puede utilizar esta circunstancia para efectuar un estudio de «intervención». Especialmente los médicos de empresa tienen buenas oportunidades para realizar este tipo de estudios, ya que es menos probable que alguien ajeno a dicho medio laboral tenga acceso a esta situación. Aunque los estudios de intervención tienen alguna semejanza con los experimentos, la imposibilidad de randomizar el material del estudio es una diferencia fundamental, al menos en el marco de la Salud Ocupacional.
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
135
Si un estudio de intervención se diseña como la continuación de un estudio de cohortes, los datos de base deben ya haberse recogido durante la primera etapa. Después de la intervención, el seguimiento continúa y los datos se recogen de forma similar. Como la comparación antes-después se puede complicar debido a muchos hechos incontrolables, aparte de la intervención, se recomienda introducir en el estudio una cohorte control. Esta cohorte control puede no estar expuesta, como la cohorte original de control usada en la primera etapa del estudio, o puede ser una parte de la cohorte expuesta en la que no se haya hecho ninguna intervención, o pueden utilizarse ambas. En un estudio de intervención, las comparaciones antes-después se realizan dentro de la cohorte expuesta; adicionalmente, pueden efectuarse comparaciones con un grupo de referencia o control.
En los estudios de intervención unos resultados positivos se consideran generalmente fuertes argumentos a favor de la causalidad de la asociación observada, incluso a pesar del hecho de que dichos estudios pocas veces alcanzan el mismo grado de validez que los experimentos (ver el Capítulo 9). Como ya se ha mencionado, los estudios de intervención son poco frecuentes en el marco de la Salud Ocupacional. Algunos estudios de intervención que pertenecen al campo de la Salud Pública, pero llevados a cabo en grandes centros de trabajo (por ejemplo, ensayos antitabaco y otros ensayos para la reducción del riesgo coronario), son quizás las únicas excepciones a esta regla. El problema está en que el epidemiólogo raramente puede influir sobre las condiciones de trabajo de manera tan sistemática como para que pueda diseñarse un estudio válido. La estrecha colaboración con unos médicos de empresa expertos y activos es la mejor manera de que los investigadores obtengan buenos resultados en los intentos de intervención en la industria. Aunque exista una buena planificación, un estudio de intervención debe enfrentarse a innumerables problemas logísticos. Por ejemplo, se puede carecer de datos básales sobre la morbilidad, y la
136
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
intervención, esto es, el cambio en las condiciones de trabajo, puede generar una movilidad selectiva hacia otros trabajos (por ejemplo, si el proceso antiguo se sustituye por tecnología muy avanzada). El mero hecho de cambiar algo se notará en cambios de comportamiento en relación con la salud o en la predisposición a quejarse de síntomas (el llamado efecto Hawthorne), por lo que las observaciones antes-después pueden no ser comparables, o puede no encontrarse ningún grupo de control válido. Las enfermedades con un período de latencia largo (por ejemplo, cáncer) y que han sido inducidas mucho antes de la intervención, a menudo se manifiestan después de la intervención, así que puede ser imposible definir cuándo son realmente detectables los efectos de la intervención. En cualquier caso, se necesitan décadas. Este largo período de espera puede convertir el estudio en poco práctico o incluso irrelevante a efectos prácticos, como la prevención. Como ya se ha comentado, si una reducción de la exposición reduce la ocurrencia de la enfermedad en estudio, esto apoya la causalidad de la asociación (ver el Capítulo 9). Además, este resultado tiene un particular significado (en relación con el tiempo y espacio) si la morbilidad de la población diana ha sufrido realmente una reducción. La proporción de la reducción de morbilidad que puede ser adscrita a la reducción de la exposición, llamada fracción prevenida (FP) entre los expuestos, puede calcularse del siguiente modo:
donde O = número de casos observados después de la intervención E = número de casos esperados si no hubiese habido intervención Ejemplo 14. La tercera etapa del estudio finlandés sobre el disulfuro de carbono (CS2) puede considerarse como una especie de intervención13. El objetivo del estudio era investigar si la exposición al CS2 era un verdadero factor de riesgo de enfermedad coronaria. El estudio se inició en 1967 como un estudio transversal de la base del estudio; también se estudió la mortalidad proporcional de forma retrospectiva. El siguiente paso fue la formación de dos cohortes, una constituida por los trabajadores expuestos y otra por los no expuestos, y el seguimiento de su mor-
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
137
bilidad con respecto a la enfermedad coronaria. La cohorte expuesta la formaban 343 trabajadores varones que habían estado expuestos al CS2 durante 5 años o más entre 1942 y 1967 y que estaban vivos en 1967. La concentración de CS2 en el aire se había medido de forma ocasional desde los años 40 y regularmente desde los años 50. Los niveles de exposición habían sido muy elevados en la década de los 40, entre 60 y 120 mg/m3 en la década de los 50, y entre 30 y 90 mg/m3 en la de los 60. El estándar higiénico hasta 1975 fue de 60 mg/m3, luego se redujo a 30 mg/m3. La cohorte control estaba compuesta por 343 trabajadores de una fábrica de papel cercana. En el Capítulo 5 se explica cómo se consiguió la comparabilidad. Durante los primeros 5 años de seguimiento, 14 hombres expuestos y 3 no expuestos murieron por enfermedad coronaria. La estimación puntual del RR fue de 4,67 con un IC95 de 1,35 a 16,1. Ya que el límite inferior del intervalo de confianza fue mayor que 1, el resultado fue estadísticamente significativo. La significación del resultado también se comprobó mediante la prueba de la %2; el valor de la χ 2 fue 7,12, que correspondía a una p bilateral de 0,0076. Estos resultados alarmantes hicieron que la compañía de viscosa pronto adoptara fuertes medidas de prevención. Las medidas pueden considerarse como una intervención epidemiológica. La intervención comprendía una ventilación más efectiva, la encapsulación posterior del proceso y una adhesión más estricta a los principios de higiene (por ejemplo, ampliar el uso de máscaras protectoras). Como resultado, la concentración media de CS2 se redujo a la mitad de los niveles existentes antes de la intervención. Todos los trabajadores que estaban considerados como de alto riesgo de enfermedad coronaria, independientemente del motivo (nivel alto de colesterol, presión arterial elevada, síntomas de angina y hallazgos electrocardiográficos sugestivos de enfermedad coronaria), fueron retirados del contacto con la exposición y se colocaron en trabajos sin exposición. Después de esto, sólo el 17% de los trabajadores inicialmente expuestos continuaron expuestos. El año 1975 fue considerado como el momento en el que se completó la intervención y, desde entonces, el seguimiento continuó como un estudio de quasi-intervención. Durante el período de 1975 a 1982, la mortalidad coronaria bajó al mismo nivel que la de la cohorte control (RR = 1,0). La comparación antes-después y la comparación con la cohorte control mostraron que la intervención había tenido realmente
138
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIÓN AL
un efecto preventivo. Los resultados de la intervención dieron más credibilidad a la conclusión de que la exposición al CS2 es un factor de riesgo para el desarrollo de enfermedad coronaria. El efecto preventivo de la intervención puede calcularse de la siguiente manera: entre julio de 1967 y finales de 1975, murieron 19 sujetos expuestos y 6 controles debido a enfermedad coronaria (RR = 3,2). Durante los siguientes 7 años, murieron 19 hombres en cada cohorte (RR = 1). Si suponemos que la mortalidad por enfermedad coronaria entre los expuestos hubiera persistido inalterada en relación con la de los no expuestos, habrían muerto 59 hombres (E = 59). Dado que sólo ocurrieron 19 muertes por enfermedad coronaria, la FP = 1 - 19/59 = 68%.
Este ejemplo ilustra algunos de los problemas prácticos de los estudios de intervención en el terreno de la Epidemiología Ocupacional. Primero, la intervención no se realizó de forma momentánea, fue un proceso gradual que abarcó de 2 a 3 años, por lo que es difícil saber exactamente cuándo cambió la investigación de un estudio de cohortes a un estudio de intervención. Segundo, la intervención fue más fuerte para aquellos en los que cesó totalmente la exposición, porque pasaron a trabajos sin exposición. Sin embargo, el riesgo coronario de estos hombres era inicialmente más alto que la media y la razón de su traslado fue la presencia de un elevado nivel de factores de riesgo. Así que los que permanecieron expuestos no eran comparables con aquellos en los que cesó la exposición por completo. A pesar de que este estudio no cumplía los criterios para una intervención científicamente correcta, ayudó a determinar la causalidad de la asociación entre la exposición al CS2 y la enfermedad coronaria. Desde un punto de vista práctico, diremos que ha demostrado lo fructífera que es la colaboración entre los epidemiólogos ocupacionales, por un lado, y los trabajadores y empleados por el otro. Los investigadores tuvieron un buen apoyo por ambas partes durante todo el período del estudio y este apoyo fue decisivo para alcanzar el éxito.
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
139
ELECCIÓN DEL DISEÑO DEL ESTUDIO
En principio no hay ningún tipo de estudio que sea superior a los demás. La elección del tipo de estudio depende de un número de factores relacionados con la factibilidad, la eficiencia y la validez. Las consideraciones prácticas son más importantes de lo que los investigadores, especialmente los que no son epidemiólogos, generalmente creen. El mismo resultado científicamente «verdadero» puede, en principio, conseguirse de más de una manera pero, frecuentemente, cuestiones prácticas como la disponibilidad del material de estudio, los fondos y los recursos humanos, deciden qué diseño es el óptimo bajo las circunstancias que prevalecen. Sin embargo, como norma general, un diseño longitudinal es preferible a uno transversal cuando se trata de recoger datos etiológicos. Los diseños transversales sólo pueden estudiar la prevalencia de una enfermedad; además, son propensos a errores sistemáticos. Como los estudios longitudinales son los principales instrumentos en epidemiología etiológica, la siguiente discusión se limita a comentar las ventajas y desventajas relativas de los distintos diseños longitudinales. Temporalidad prospectiva o retrospectiva
Si la temporalidad del estudio es retrospectiva, tanto la exposición como la enfermedad ya han tenido lugar. Tanto los estudios de cohortes retrospectivos como los de casos y controles, sin tener en cuenta el tipo de base del estudio, comparten esta característica. El único tiempo que se necesita para obtener los resultados es el período que se tarda en planear el estudio, buscar y analizar los datos y preparar el informe. Aunque los estudios de censo de una base de cohortes pueden durar años, sobre todo si la cohorte es extensa y el seguimiento de los individuos perdidos es difícil, todo el proceso generalmente no dura más de 2 a 5 años. Un muestreo de casos y controles a partir de una base de cohortes, usando casos que ya han ocurrido, normalmente tarda menos en completarse. Aunque un par de años pueda parecer demasiado tiempo para unos administradores de sanidad impacientes, es poco tiempo en comparación
140
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
con el tiempo que se requiere en la mayoría de estudios prospectivos de seguimiento de una cohorte. Cuando se trata de saber la «verdad» científica de manera urgente, por ejemplo, con fines de regulación normativa, son múltiples los argumentos a favor de un diseño retrospectivo. Sin embargo, los diseños retrospectivos también tienen sus desventajas. Un problema difícil de resolver es que los datos de exposiciones pasadas son deficientes o incluso inexistentes, como se ha dicho muchas veces. Por lo tanto, es raro encontrar datos del pasado fiables con respecto a manifestaciones leves de morbilidad, tales como parámetros bioquímicos séricos o pruebas funcionales y el diagnóstico de enfermedades menores. Por ello, un estudio de cohortes retrospectivo generalmente debe restringirse al estudio de la mortalidad. Un estudio de casos y controles puede planificarse de tal forma que las manifestaciones no fatales de la enfermedad en cuestión, tanto prevalentes como incidentes, se registren en un determinado punto en el tiempo o durante un período de tiempo, por ejemplo 2 años, y los historiales de exposición de los casos y una muestra de los controles sean revisados retrospectivamente. Sin embargo, en este ámbito, así como en el de otros estudios sobre manifestaciones no fatales, los diagnósticos deben ser precisos y fiables. Las ventajas de un diseño prospectivo son: 1. El estudio puede planificarse mejor que un estudio retrospectivo para dar cumplimiento a las necesidades del investigador. 2. Se pueden recoger los datos de exposición sistemáticamente. 3. Se pueden medir distintas manifestaciones de la enfermedad. 4. Se pueden repetir las mediciones y exámenes médicos. 5. Los métodos de medición pueden estandarizarse y puede comprobarse su validez.
La gran desventaja de un diseño prospectivo es el tiempo requerido para obtener los resultados. Las enfermedades crónicas a menudo tienen un período de latencia largo, que puede abarcar de 20 a 40 años, aunque a veces el período es más corto, dependiendo del tipo de problema (ver el ejemplo 8). Una queja muy común es que los costes de los estudios prospectivos de tipo censo son elevados. El problema no es tan sencillo. Un diseño prospectivo de censo
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
141
permite registrar muchos indicadores de morbilidad distintos, y no solamente la mortalidad, y es cierto que los costes totales aumentan considerablemente y exceden en gran cantidad los de un diseño retrospectivo similar. Sin embargo, si los estudios prospectivos utilizan la posibilidad de recoger distintos tipos de datos de morbilidad, aportan más información que los estudios retrospectivos, los cuales se limitan a la mortalidad. Por ello diremos que los costes por unidad de información no exceden necesariamente a los de un estudio retrospectivo, sobre todo cuando se considera la alta calidad de la información (por ejemplo, datos de exposición). Si el estudio prospectivo sólo concierne a la mortalidad, los costes no son muy distintos de los de un estudio retrospectivo. Para reducir los costes de un seguimiento prospectivo basado en el tipo censo de una base de cohortes, es importante restringir las mediciones a los indicadores de morbilidad más relevantes y evitar medir la misma entidad conceptual a través del uso de demasiados parámetros empíricos. Sin embargo, esta recomendación de parquedad no debe aplicarse a las medidas de exposición, a las cuales, por desgracia, se les ha dado muy poca importancia en Epidemiología Ocupacional hasta hace pocos años. Censo o muestreo La hipótesis específica «A causa B», en principio, puede probarse mediante un diseño de censo, en el que la presencia de la exposición se toma como criterio de inclusión en la base del estudio, o mediante el estudio de los casos de B y una muestra de no casos en relación con una exposición anterior. Los sujetos pueden provenir de una base de cohortes o de una base de población dinámica. En principio, ambos enfoques son correctos para probar la hipótesis; sin embargo, cuestiones prácticas y de validez por lo general deciden el enfoque más apto. El hecho de que distintos enfoques conduzcan a las mismas conclusiones se ilustra en el caso de las investigaciones sobre la relación entre el tabaco y el cáncer de pulmón. La primera referencia sobre esta relación vino dada por un estudio de casos y controles. Se observó que un número relativamente mayor de pacientes con cáncer de pulmón habían sido fumadores comparativamente con los controles, hallazgo que indi-
142
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
rectamente indicó que el hecho de fumar incrementaba el riesgo de contraer un cáncer de pulmón. Posteriormente se obtuvieron resultados similares a partir de estudios de cohortes. Se dedujo que los fumadores desarrollaban cáncer de pulmón con mucha más frecuencia que los no fumadores. Finalmente, los estudios de intervención demostraron que, después de haber dejado de fumar, el riesgo de padecer cáncer de pulmón descendía casi al nivel de los no fumadores en un plazo de tiempo de unos 10 años. En otras palabras, se obtuvo el mismo resultado independientemente del tipo de estudio. En la práctica, un diseño de casos y controles de una gran base de estudio es la única opción si la enfermedad que se estudia es rara. Generalmente la base del estudio más factible es el seguimiento de una gran población dinámica, aunque en principio, no hay inconveniente en usar una base de cohortes. Sin embargo, por razones económicas y de posibilidades de ejecución es difícil crear una base de cohortes lo bastante grande como para aportar el suficiente número de casos expuestos. Por el mismo motivo, cuando se trata de una exposición rara en la población general, la base de estudio más eficiente es un seguimiento de una base de cohortes, definida en base a la exposición en cuestión. Una vez seleccionada la base de cohortes, se puede escoger entre un estudio de censo o uno de cohortes clásico o, alternativamente, muestrear la base del estudio o estudio de casos y controles en la base de cohortes. De todas formas, la última elección requiere contrastes de la exposición en la base del estudio. Es crucial incluir a todos los sujetos posibles que hayan estado o estén sometidos a una exposición rara concreta. Con frecuencia esto requiere la inclusión de varias empresas en el estudio y pueden plantearse problemas de tipo práctico. Las enfermedades frecuentes también pueden estudiarse correctamente con un diseño de casos y controles basado en una población dinámica. Igualmente, las exposiciones frecuentes pueden estudiarse mediante un diseño de base de cohortes. Un diseño de casos y controles basado en una población dinámica es el más eficiente si la enfermedad es rara. Un censo de una base de cohortes es el diseño de elección si la exposición es rara en la población general.
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
143
Las ventajas más destacadas de un diseño de casos y controles frente a uno de censo estriban en que los costes son menores y se requiere menos personal. Muchos de los miembros de una población en estudio no contraen la enfermedad de interés, pero de todas formas debe investigarse su exposición y hacer un seguimiento de los individuos perdidos. Este esfuerzo no aporta ninguna información real, pues sólo los sujetos que contraen la enfermedad aportan información relevante. Un muestreo de casos y controles no requiere estos esfuerzos. Si se combinan varias hipótesis, o si no existe una hipótesis previa, no hay opciones de diseño del estudio. Si la hipótesis es «la exposición A causa las enfermedades B1 B2,... B i », o si la pregunta es «¿qué enfermedades provoca A?», el único diseño epidemiológico factible es el de un estudio de censo de una base de cohortes formada en base a la exposición a A. Un censo de una base de población dinámica (por ejemplo, una fábrica) no es un diseño muy utilizado en Epidemiología Ocupacional por temor a los sesgos causados por la rotación selectiva de la plantilla laboral. Si la hipótesis se formula de la siguiente manera: «la enfermedad B está provocada por las exposiciones Ai, A2,... Ai », o si la pregunta es «¿cuáles son las causas de la enfermedad B?», la única opción epidemiológica es el diseño de un muestreo de casos y controles. Los grupos de estudio, representados mediante una muestra que luego se investiga, se forman en base a la presencia o la ausencia de la enfermedad B y a factores que distingan a los casos del resto de la base. Este estudio se lleva a cabo usualmente en una población dinámica, pero de forma alternativa también puede diseñarse como un estudio de casos y controles en una base de cohortes, diseñado de forma que sus miembros hayan tenido la oportunidad de estar expuestos a varios agentes distintos. Ejemplo 15. Axelson et al.2 diseñaron un estudio de casos y controles múltiple con el objetivo de determinar si la exposición a compuestos del arsénico tenía relación con el cáncer de pulmón, otros tipos de cáncer o la enfermedad coronaria, aunque en este ejemplo sólo se considerará el cáncer de pulmón. La base del estudio fue el seguimiento de la población dinámica que vivía en una área cercana a una gran fundición de cobre en Suecia. Los
144
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
casos eran pacientes que habían muerto de cáncer de pulmón y los controles eran personas fallecidas por otras causas distintas a las neoplasias y a la enfermedad coronaria. Tanto los casos como los controles se seleccionaron de los registros parroquiales locales. Uno de los problemas de este estudio fue que, de acuerdo con la hipótesis anterior, el arsénico no sólo podía causar cáncer de pulmón, sino también otras enfermedades. Por lo tanto, si las personas que hubieran fallecido por estas causas tuvieran que incluirse en el grupo control, se enmascararía el verdadero efecto de la exposición al arsénico sobre la mortalidad por cáncer de pulmón. Por este motivo, los investigadores formaron una serie independiente de casos para cada causa de muerte en estudio (es decir, cáncer de pulmón, otros tipos de cáncer y enfermedad coronaria) y escogieron a los controles de entre los que fallecieron por otras causas. Se podría considerar este estudio como un conglomerado de estudios de casos y controles que utilizan la experiencia de morbilidad de la misma base del estudio. Como ocurre siempre en los estudios retrospectivos, la obtención de datos de exposición buenos y suficientes fue una tarea difícil. Los investigadores requirieron la colaboración de un ingeniero experto para clasificar la intensidad de la exposición estimada para cada caso y cada control en tres categorías: (1) exposición claramente por debajo de la media estándar en higiene laboral, 0,5 mg/m3, (2) exposición cercana a dicho nivel y (3), exposición claramente en exceso sobre el nivel (ver el Capítulo 3). Axelson et al., en los datos del análisis, tuvieron en cuenta un período de latencia. En base a la literatura existente, estimaron que la media del período de latencia era de 34 a 36 años para el cáncer de pulmón inducido por el arsénico. Por este motivo no tuvieron en cuenta las exposiciones que se produjeron 17 años antes del diagnóstico (la mitad del período medio de latencia). Se trataba, claro está, de una decisión arbitraria. Los resultados mostraron que el riesgo de contraer cáncer de pulmón era de 4,6 (IC90 2,2-9,6) para los expuestos al arsénico y que existía una relación dosis-respuesta (no significativa) entre las categorías de la exposición. Además, la estimación puntual del RR de fallecer por infarto de miocardio fue de 2,2 (IC90 1,2-3,5), lo cual demuestra que los investigadores tenían razón al no incluir este diagnóstico en el grupo de controles. Como ya se ha comentado, un diseño de casos y controles de base poblacional es ineficiente si la exposición es rara entre la po-
DISEÑOS DE ESTUDIOS EPIDEMIOLÓGICOS Y SUS APLICACIONES
145
blación. La exposición al arsénico en la población general de Suecia es rara. Sin embargo, los investigadores restringieron la base de población dinámica y se centraron sólo en unos pocos municipios de alrededor de la fundición. Como consecuencia, la exposición resultó ser frecuente en la base del estudio. Debido a este «enriquecimiento», el diseño de casos y controles pudo aplicarse de forma efectiva. La elección del diseño del estudio depende también de muchas otras circunstancias, además de las expuestas en este capítulo. En el Capítulo 5 se comentarán de nuevo estos factores porque se hallan relacionados con aspectos de la validez del estudio. La factibilidad y la validez deciden qué tipo de enfoque es el mejor para estudiar un problema científico en una determinada situación. Desafortunadamente, estos aspectos a veces entran en conflicto y, entonces, será el investigador el que decidirá cuál de las opciones resulta más ventajosa y cuál menos. BIBLIOGRAFÍA 1. Axelson, O. «Elucidation of some epidemiologic principies». Scand. J. Work Environ. Health 9:231 (1983). 2. Axelson, O., E. Dahlgren, C. D. Jansson y S. O. Renlund. «Arsenic exposure and mortality. A case referent study from a Swedish copper smelter». Br. J. Ind. Med. 35:8 (1978). 3. Coggon, D., C. Osmond, B. Pannett, S. Simmonds, P. Winter y E. D. Acheson. «Mortality of workers exposed to styrene in the manufacture of glass-reinforced plastics». Sean. J. Work Environ. Health 13:94 (1987). 4. Colé, P. y F. Merletti. «Chemical agents and oceupational cáncer». Environ. Pathol. Toxicol. 3:399 (1980). 5. Fox, A. J. y A. M. Adelstein. «Oceupational mortality: work or way of Ufe?». J. Epidemiol. Community Health 32:73 (1978). 6. Greenland, S. y D. Thomas. «On the need for the rare disease assumption in case-control studies». Am. J. Epidemiol. 116:547 (1982). 7. Hammond, E. C, I. J. Selikoffy J. Seidman. «Asbestos exposure, cigarette smoking and death rates». Ann. N. Y. Acad. Sci. 330:473 (1979). 8. Hernberg, S. T. Partanen, C. H. Nordman y P. Suman. «Coronary heart disease among workers exposed to carbón disulphide». Br. J. Ind. Med. 27:313(1970). 9. Hernberg, S., P. Westerholm y K. Schultz-Larsen et al. «Nasal and sino-
146
10. 11. 12. 13. 14. 15. 16.
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIÓN AL
nasal cáncer: connection with occupational exposure in Denmark, Finland and Sweden». Scand. J. Work Environ. Health 9:315 (1983). Miettinen, O. S. «Individual matching with múltiple controls in the case of an all-or-none response». Biometrics 25:339 (1969). Miettinen, O. S. «Estimability and estimation in case-referent studies». Am. J. Epidemiol. 103:226 (1976). Miettinen, O. S. Theoretical epidemiology: principies of Occcurence Research in Medicine. (New York: John Wiley & Sons, 1985). Nurminen, M. y S. Hernberg. «Effects of intervention on cardiovascular mortality and among workers exposed to carbón disulphide: a 15-year follow-up». Br. J. Ind. Med. 42:32 (1985). Partanen, T., T. Kauppinen, M. Nurminen et al. «Formaldehyde exposure and respiratory and related cancers: a case-referent study among Finnish woodworkers». Scand. J. Work Environ. Health 16:394 (1990). Rothman, K. J. Modern Epidemiology. (Boston, MA: Little Brown, 1986). Existe versión en castellano: Epidemiología moderna (Madrid: Ed. Díaz de Santos, 1987). Tola, S., S. Hernberg y J. Nikkanen. «Parameters indicative of absorption and biological effect in new lead exposure: a prospective study». Br. J. Ind. Med. 30:134(1973).
5 Validez interna, precisión y generalización
INTRODUCCIÓN El resultado de un estudio específico puede ser exacto, «correcto» o puede haber sido causado o modificado por errores sistemáticos, por imprecisión o por ambos. Un error sistemático o sesgo distorsiona el estudio de tal manera que unas hipotéticas repeticiones del mismo producirían idénticos resultados erróneos, y se llegaría a una conclusión falsa. Este tipo de error no tiene nada que ver con el tamaño del estudio. El aumento del tamaño no reduciría ni eliminaría el error. Se deben adoptar otras medidas para conseguir este objetivo. Un error sistemático puede ser positivo o negativo. En el primer caso, se describe una diferencia entre los grupos en estudio cuando en realidad no existe ninguna o, alternativamente, resulta exagerada una diferencia verdadera. Cuando el error es negativo puede enmascarar, parcial o totalmente, una diferencia verdadera. Si un estudio se halla libre de errores sistemáticos, se dice que es válido. Por lo tanto, la «validez» puede definirse como la ausencia de error sistemático. Un error sistemático distorsiona los resultados de un estudio de tal manera que, si se repitiese el estudio, volvería a producirse la misma distorsión media.
Si en un estudio existen errores aleatorios, se produce imprecisión. Este problema se presenta cuando la precisión de las medicio147
148
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
nes es deficiente; no importa demasiado si las mediciones imprecisas afectan al resultado o a la exposición. La imprecisión crea dispersión debido a la variación aleatoria alrededor del verdadero valor. En los estudios extensos, los errores en las mediciones del resultado (como puede ser la presión arterial) se sitúan en un valor medio si son verdaderamente aleatorios, y además no crean una falsa impresión de efecto cuando no lo hay. Sin embargo, incrementan la variación de las mediciones y producen «ruido de fondo». Por lo tanto, los errores aleatorios tienden a enmascarar la diferencia verdadera entre las poblaciones estudiadas y tienden a incrementar los resultados falsos negativos, no los falsos positivos. Esta característica los distingue de los errores sistemáticos, que pueden actuar en cualquier dirección. Los errores aleatorios debidos a la imprecisión se equilibran en un estudio lo suficientemente extenso. Disminuyen la sensibilidad del estudio.
La variación aleatoria de la estimación puntual del resultado global de un estudio (por ejemplo, el RR) también da lugar a imprecisión cuando se considera un conjunto de estudios. En este caso los resultados, por ejemplo, los RR de los estudios aislados, que muestran la misma magnitud de efecto en cada estudio, varían del mismo modo que los resultados de las mediciones individuales en un estudio determinado. Cuanto más pequeño sea el estudio, mayor será la variación aleatoria. Aumentando el tamaño del estudio, los investigadores pueden estrechar el recorrido de la variación aleatoria del resultado. Las pruebas de significación estadística facilitan cierta orientación para valorar la probabilidad de que el resultado obtenido no se halle dentro de la distribución aleatoria que se produciría bajo la hipótesis nula (es decir, sin que existiera ningún efecto real), dados el tamaño del estudio y la magnitud del efecto. Sin embargo, como se discute más adelante en el Capítulo 9, el valor de p se debería interpretar como un resumen parcial de la evidencia a favor o en contra del rechazo de la hipótesis del estudio, y no necesariamente como la probabilidad de que los datos sean debidos al azar (Cita 26). Del mismo modo, el intervalo de
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
149
confianza del RR. proporciona una medida del recorrido de valores del RR que son consistentes con los datos. Debe resaltarse que ni el valor de p ni el intervalo de confianza de la razón de tasas aportan ninguna información sobre los efectos de los errores sistemáticos. La generalización es el potencial para extrapolar los resultados de un estudio concreto, tanto hacia una gran «superpoblación» como al nivel abstracto de las teorías científicas. La representatividad estadística, que significa que la población en estudio es una muestra representativa de una población más grande, es importante para la generalización desde una muestra determinada a la población, mientras que la representatividad científica es el fundamento para la generalización a un nivel abstracto-general. Claro está que un estudio debe tener una elevada validez interna para que tenga sentido cualquier tipo de generalización. VALIDEZ INTERNA
Tradicionalmente los errores sistemáticos han sido divididos en tres categorías: sesgo de selección, sesgo de información y sesgo de comparación5. Un enfoque más moderno es considerar los ensayos clínicos como el paradigma y definir a la validez en términos de comparabilidad de efectos, de poblaciones y de información26. En el presente libro, por ser una obra de texto básico, presentamos el punto de vista tradicional. Validez de la selección
El sesgo de selección surge siempre que la propiedad en estudio, que operativamente sería la exposición en un diseño de casos y controles, y la presencia o ausencia de enfermedad en una cohorte o en un diseño transversal basado en la exposición, influyen sistemáticamente en que los sujetos sean o no escogidos para el estudio. Ejemplo 1. Supongamos que el estudio se refiere a la prevalencia de enfermedad coronaria (EC) entre los trabajadores de rayón viscosa expuestos al disulfuro de carbono. El médico de Salud Ocupacional podría considerar la investigación como una
150
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
oportunidad para realizar una revisión médica a los trabajadores potencialmente afectados. Por dicho motivo, selecciona para el examen en especial a los trabajadores que previamente han referido síntomas sugestivos de EC. Supongamos también que no existe tal tendencia en la selección del grupo control. El resultado es un sesgo de selección positivo, que conlleva una sobreestimación de los efectos del disulfuro de carbono. Este error puede evitarse fácilmente no permitiendo que los servicios de Salud Ocupacional influyan sobre la selección de los sujetos. El sesgo de selección es un problema serio en los estudios transversales. La exposición por sí misma, ya sea carga física, calor,
polvo, estrés o cualquier esfuerzo, generalmente conlleva un movimiento selectivo hacia la salud, en el sentido de que los más afectados tienden a abandonar el trabajo. En consecuencia, los que permanecen en el puesto de trabajo probablemente son más resistentes a los efectos de la exposición y no experimentan demasiada incomodidad con la misma. Cuando el estudio se limita a estos «supervivientes», el resultado contiene sesgo, y los verdaderos efectos de la exposición sobre la salud resultan infraestimados. En otras palabras, los factores estudiados provocan que las personas más afectadas sean excluidas del estudio. Existen algunos resultados empíricos que muestran que este tipo de selección puede ser realmente fuerte (figura 5.1). Ejemplo 2. Supongamos que estamos interesados en saber si los trabajos forestales pesados causan trastornos lumbares. Si el diseño del estudio es transversal, los grupos de estudio se seleccionarán según su trabajo actual. Supongamos que los leñadores se comparan con otro grupo diferente que no tiene un nivel de esfuerzo similar, como por ejemplo, capataces o guardabosques. Este diseño tiene de forma inherente un sesgo de selección negativo. En primer lugar, los que ya sufren patología lumbar procuran no trabajar como leñadores porque saben bien que es un trabajo duro. En segundo lugar, los problemas lumbares que se manifiestan durante la explotación forestal fuerzan a los que tienen estos síntomas a dejar el empleo. Con este diseño de estudio, los efectos de los trabajos de explotación forestal sobre el dolor lumbar pueden quedar parcial o totalmente enmascarados por tal sesgo de selección negativo.
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
151
Figura 5.1. Ejemplo de una selección basada en la salud. Se solicitó a los trabajadores actuales y a los antiguos de una fundición que hicieran una valoración de su capacidad de trabajo, de forma que la puntuación 10 correspondiera a la mejor capacidad de trabajo de toda su vida y la puntuación 0 a una incapacidad laboral total. La figura muestra la distribución de los que consideraron que su capacidad de trabajo actual era baja (niveles de 0 a 4). Se observaron grandes diferencias entre los trabajadores actuales y los antiguos; las diferencias se acentuaban a medida que avanzaba la edad17.
A pesar de que el ejemplo es exagerado, se trata de un caso típico porque la mayor parte de los conocimientos sobre la interac-
1 52
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
ción entre enfermedades lumbares y trabajo deriva de estudios transversales (ejemplo, cita 9). A pesar de este sesgo de selección negativo, la mayoría de estudios publicados indican que el trabajo físico pesado causa o exacerba los trastornos de la espalda. Por lo tanto, el efecto verdadero del trabajo pesado probablemente es incluso mayor que el sugerido por los resultados disponibles de los estudios transversales. El sesgo de selección es un problema en los estudios transversales.
En los estudios de casos y controles, el sesgo de selección tiene lugar cuando el conocimiento a priori de la exposición en cuestión influye en la selección de los casos por parte del investigador. En otras palabras, la validez requiere que los investigadores no tengan conocimiento sobre la historia de exposición de los casos y de los controles a la hora de escoger a los sujetos del estudio. Sin embargo, existen también otros mecanismos que conducen a un sesgo de selección, sobre todo cuando el estudio se basa en pacientes de hospitales. Ejemplo 3. Supongamos que estamos interesados en la hepatotoxicidad de los solventes orgánicos utilizados como disolventes en la pintura con difusor (´spray´). Supongamos además que el estudio se lleva a cabo en una clínica de Medicina Ocupacional. El criterio de toxicidad hepática es un nivel repetidamente elevado de transaminasas y una biopsia hepática patológica. Se definen los casos de acuerdo con estos criterios. El grupo control puede ser una muestra de todos los demás pacientes atendidos en la clínica, pareados por edad y sexo con los casos. Se recoge información sobre la historia de exposiciones mediante una entrevista estructurada a los casos y controles, que se completa con datos obtenidos del empresario. La exposición a disolventes es probable que sea más común entre los pacientes con «enfermedad hepática». Supongamos que la OR es 4 (ver la Tabla 4, Capítulo 4) y que es estadísticamente significativa. Este resultado podría indicar, de forma superficial, que los disolventes utilizados en la pintura con difusor producen daño hepático. Sin embargo, la verdad puede ser bastante diferente. Durante largo
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
153
tiempo se ha sospechado que muchos disolventes provocaban hepatotoxicidad (ciertos disolventes probablemente lo hacen a dosis altas), y por ello, los médicos de Salud Ocupacional seguramente son selectivos a la hora de remitir pacientes a una clínica de Medicina Ocupacional. Los trabajadores que tienen las transaminasas elevadas y están expuestos a disolventes serán remitidos a estas clínicas más fácilmente que otros. Por este motivo, la OR de este ejemplo es un error (sesgo positivo), y no puede extraerse ninguna conclusión del mismo. Como norma, el sesgo de selección aparece cuando el médico remitente sospecha una relación causa-efecto y de forma selectiva remite a los pacientes a un centro especializado. Así, los pacientes atendidos en clínicas para enfermedades ocupacionales se hallan fuertemente seleccionados. Las razones para tal selección son las siguientes: • Existe un centro especializado para las enfermedades ocupacionales. • Se conoce o sospecha la relación entre determinadas exposiciones y determinados síntomas y signos. Varios estudios recientes bien diseñados han mostrado que los disolventes utilizados para diluir la pintura no producen daño hepático en las condiciones habituales de exposición. Los datos aportados por la literatura más antigua pueden ser distintos debido, tanto a estudios de diseño inválido, como a la prevalencia de niveles de exposición extremadamente altos en aquel momento. Una extrapolación errónea de los efectos de una elevada exposición a hidrocarburos clorados tóxicos o a concentraciones bajas de otros disolventes creó entonces la falsa impresión de que todos los disolventes eran hepatotóxicos, incluso a niveles bajos. La idea de que todos los disolventes son hepatotóxicos aún persiste y la situación podría, incluso en la vida real, ser similar a la descrita en los ejemplos ficticios anteriores. El sesgo de selección siempre es una fuente de error potencial en los estudios de casos y controles que utilizan casos a partir de hospitales. Esta fuente de error se conoce generalmente como falacia de Berkson, según el nombre del epidemiólogo que lo describió por primera vez. Hay varias explicaciones sobre el motivo por que
154
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
ciertos pacienies son remitidos o requieren asistencia en determinados hospitales. Los factores que influyen en esta selección son, entre otros, la especialización del hospital (servicios médicos, calidad del centro), factores geográficos (diferentes áreas de influencia según distintas enfermedades) y factores sociales (hospitales privados vs. hospitales públicos). Estos mecanismos varían enormemente de un país a otro. Por ello, la interpretación de un estudio de casos y controles que ha obtenido los sujetos a partir de un hospital puede ser muy delicada, si los autores no comentan los mecanismos de selección. En países con asistencia médica gratuita o muy barata, como ocurre en los países nórdicos, es rara la selección en base a factores sociales, pero la especialización de determinados hospitales puede ocasionar problemas. Por ejemplo, el tratamiento de una enfermedad rara puede llevarse a cabo sólo en unos pocos hospitales cuyos pacientes proceden, por otro lado, de una zona más restringida. En Estados Unidos hay hospitales que poseen mecanismos de selección totalmente distintos, tales como hospitales privados caros, hospitales de judíos, hospitales de veteranos, hospitales públicos, etc. Los lectores que no estén familiarizados con los mecanismos que determinan la selección de los pacientes en cada uno de ellos, no pueden juzgar la posibilidad de un sesgo de selección sin la debida ayuda por parte de los autores. En los estudios de casos y controles el sesgo de selección tiene lugar cuando la exposición sospechosa de producir la enfermedad influye en la selección de los casos.
Un sesgo de selección no es un problema tan serio en los estudios de cohortes. Sin embargo, la Salud Ocupacional por desgracia constituye una excepción, porque la autoselección determina la selección de las ocupaciones o trabajos. Las causas relacionadas con la salud pueden influir en alto grado sobre tales decisiones. Distintas enfermedades dan lugar a distintos tipos de selección basada en la salud, y lo mismo diferentes ocupaciones y trabajos. Las enfermedades con un período de latencia largo y silente son menos decisivas, a la hora de elegir un trabajo, que las enfermedades relacionadas con problemas ocupacionales. Por ejemplo, las personas con
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
155
bronquitis crónica tienden a evitar trabajos asociados al polvo y las personas con trastornos lumbares no pueden buscar trabajos que requieran un esfuerzo físico importante. Los exámenes previos al empleo pueden acentuar este tipo de selección. Este efecto, llamado del «trabajador sano», se discutirá de nuevo con más detalle en este capítulo. Los deterioros posteriores del estado de salud conducen también a la selección en el transcurso de la vida laboral de los individuos. Este tipo de selección es más fácil de evaluar, porque los trabajadores que dejan el trabajo por cuestiones de salud pueden ser seguidos e incluso a veces aceptan el examen médico. De este modo pueden evitarse los efectos de una selección negativa en los estudios cualitativos. En cambio, si el estudio es cuantitativo, este tipo de selección tiende a la infraestimación de los efectos sobre la salud relacionados con la exposición, porque muchos de los que deberían haberse clasificado como «enfermos» pueden haber recibido exposición solamente durante cortos períodos de tiempo antes de dejar el trabajo de forma permanente. Así, los individuos más afectados pueden ser los que han recibido exposiciones más cortas, y los menos afectados los de exposiciones más largas. El sesgo de selección debe minimizarse en la etapa de planificación del estudio, porque es difícil, si no imposible, controlarlo formalmente en el análisis. Si no se puede eliminar el sesgo de selección por completo, se puede evaluar su dirección y fuerza y también debe considerarse, informalmente, su efecto relativo sobre los resultados a la hora de elaborar las conclusiones. Un pequeño sesgo de selección no invalida por completo un estudio, siempre que sus efectos hayan sido examinados y evaluados. Evitar este sesgo requiere un profundo conocimiento de los factores que influyen en la selección de una ocupación, las razones de la movilidad del personal y los mecanismos que determinan la hospitalización de los pacientes. Es esencial un profundo conocimiento de todo lo que atañe a los sujetos del estudio. Se debe tener cuidado en evitar sesgos de selección cuando se planifica un estudio. Los sesgos de selección no pueden controlarse en el análisis de resultados.
156
NTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Validez de la información
El sesgo de información tiene lugar cuando existe asimetría entre la calidad de la información del grupo en estudio y la del grupo de referencia. En un estudio de casos y controles, los historiales de exposición de los casos y de los controles deben ser igualmente precisos (o imprecisos) e igualmente detallados. De igual manera, en los estudios transversales y en los de cohortes, la morbilidad de los grupos expuestos y de los no expuestos debe medirse con la misma exactitud. La inexactitud como tal no causa necesariamente sesgo, siempre que sea simétrica. Lo que causa sesgo es la asimetría en la inexactitud; cabe destacar que la sensibilidad del estudio, es decir, la potencia para detectar una verdadera relación entre exposición y enfermedad, disminuye si la información es simétricamente inexacta o cruda. Una baja sensibilidad puede producir un enmascaramiento total o parcial del verdadero riesgo. El sesgo de información puede ocurrir en cualquier tipo de estudio. Se dice que el problema es peor en los estudios de casos y controles, porque dependen en gran medida de la información recogida a partir de datos anamnésicos procedentes de cuestionarios y entrevistas, y no de mediciones. La inexactitud asimétrica en la información causa sesgo de información positivo o negativo. La inexactitud simétrica enmascara las verdaderas diferencias.
El sesgo de información que puede darse en un estudio de casos y controles tiene muchos componentes, tres de los cuales se comentan a continuación. El primer componente se halla relacionado con el proceso del recuerdo y por eso se llama sesgo de recuerdo. En general, la gente se olvida incluso de hechos muy importantes (por ejemplo, hospitalizaciones, operaciones), por no hablar de hechos menores. El olvido como tal no provoca el sesgo, pero el sesgo ce información aparece si los casos recuerdan mejor sus exposiciones que los controles. La enfermedad puede haberles hecho reflexionar sobre sus posibles causas.
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
157
El segundo componente está relacionado con la técnica de la entrevista. El entrevistador puede interrogar a los casos y a los controles de distinta manera, lo que puede provocar un recuerdo asimétrico. Por poner un ejemplo exagerado, el entrevistador puede preguntarle al caso: «Usted ha estado expuesto/a a disolventes, ¿verdad?», y al control: «Usted no ha estado expuesto/a a disolventes en su trabajo, ¿verdad?». Este tipo de asimetría se llama con frecuencia sesgo del observador. El tercer tipo de sesgo de información tiene relación con la exageración y la información errónea, que se facilita a propósito. Los problemas de salud ocupacional pueden avivarse (por cuestiones de interés, por peticiones de compensación), y en tales situaciones algunos casos pueden sucumbir a dar información falsa. A veces el tema en estudio puede ocultarse bajo otras cuestiones, pero a veces, el conocimiento general es tan amplio que este método de control falla y entonces debe abandonarse todo el proyecto de investigación. Ejemplo 4. Supongamos que estamos interesados en saber si los factores ocupacionales pueden causar malformaciones congénitas. Los casos son madres de niños con malformaciones y los controles madres de niños sanos. La información se recoge a partir de entrevistas enfocadas a averiguar las exposiciones específicas durante el primer trimestre del embarazo, tales como la ingesta de medicamentos, infecciones, exposiciones ocupacionales, exámenes radiológicos, consumo de café, tabaco, alcohol y similares. Las madres «caso», que han estado pensando repetidamente sobre las causas de su tragedia, generalmente recuerdan mejor sus exposiciones a lo largo del embarazo que las madres «control», las cuales no tienen motivos para pensar en ello. Como mínimo, las exposiciones menores son olvidadas por las controles. El entrevistador, consciente o inconscientemente, incluso puede investigar con mayor profundidad en las historias de las madres «caso», con lo que el resultado puede ser una sobreinformación, con valores de la OR exagerados para muchas exposiciones, sobre todo en aquellas que ya se conoce que son teratógenos (por ejemplo, exámenes radiológicos, algunas medicaciones). Si no existe ninguna hipótesis previa, es imposible interpretar tales resultados. Por el contrario, si existe una hipótesis previa específica y bien fundamentada y si sólo la exposición sospechosa muestra una OR elevada, el resultado puede
158
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
interpretarse desde el punto de vista de que esta exposición es realmente teratógena.
A pesar de que este ejemplo ilustra cómo puede originarse un sesgo de información en un estudio de casos y controles, por lo general hay pocos datos empíricos que lo apoyen. La gente recuerda algunos hechos mejor que otros. Los hechos sin importancia se olvidan más fácilmente que los importantes, y estos hechos probablemente se hallan influidos por un recuerdo asimétrico. De acuerdo con ello, los casos son más propensos que los controles a referir el uso de medicamentos, antecedentes de infecciones menores y otros datos banales. En general, la gente recuerda bien determinados hechos importantes, tales como los distintos empleos que ha tenido o circunstancias regulares, tales como el fumar o el consumo de alcohol. Por ello, se asume que el historial es más simétrico cuando se interroga a los individuos sobre estas cuestiones. (A pesar de que es bien conocido que el consumo de alcohol referido en las entrevistas es menor que el consumo real, no existe ninguna razón a priori para asumir diferencias sistemáticas entre casos y controles). Ejemplo 5. Pershagen y Axelson31 mostraron que los familiares de los pacientes que habían muerto de cáncer de pulmón referían con gran exactitud el historial ocupacional de los fallecidos (cuando la pregunta era el empleo anterior en una gran fundición: respuestas verdaderas positivas 98%, respuestas verdaderas negativas 99%). Cuando la pregunta era la exposición específica al arsénico, las respuestas verdaderas positivas bajaron al 40%, pero las respuestas verdaderas negativas permanecieron al 90%. El hábito de fumar referido por los familiares concordaba con la información registrada en las historias del servicio de Salud Ocupacional. Un estudio no debería generalizarse demasiado; sin embargo, los anteriores resultados no apoyan la idea general de que un sesgo de información positivo sea siempre un problema serio en los estudios
de casos y controles. El área ocupacional tiene una ventaja sobre otras porque los casos y los controles no son las únicas fuentes potenciales de información. Algunas veces puede obtenerse del empresario información adicional o información confirmatoria de la historia
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
159
ocupacional o incluso sobre exposiciones específicas. Esta posibilidad se ha utilizado en algunos estudios realizados por el Instituto Finlandés de Salud Ocupacional10,11,13,18. En estos estudios, higienistas ocupacionales expertos evaluaron primero a ciegas el historial ocupacional obtenido mediante una entrevista y luego codificaron las exposiciones según criterios preestablecidos (es decir, una MEL construida especialmente). Cuando el historial de exposición indicaba la posibilidad de exposición química, completaron y verificaron la historia laboral contactando con el empresario, sin conocer si la persona en cuestión era caso o control. Los códigos de identificación no se rompieron hasta que se completaron todos los historiales de exposición. Como la mayoría de la gente tiene un historial ocupacional sin ninguna exposición química, los contactos con el empresario sólo fueron necesarios en menos del 20% del total de sujetos. La verificación de los datos de exposición con entrevistas al empresario mejora la calidad de la información, por ejemplo, aportando más detalles sobre el tipo específico de exposición química. Sin embargo, a veces ni siquiera el empresario puede recordar exposiciones o condiciones pasadas, especialmente en pequeñas empresas. Si la empresa ya no existe, lógicamente, no se pueden comprobar los datos de los historiales de exposición. Tales situaciones entorpecen los estudios, en especial los que se extienden sobre un largo período de tiempo. La utilización del método MEL también mejora la validez de las historias de exposición. Sin embargo, este método objetivo no puede usarse para recoger información sobre potenciales factores de confusión, como el consumo de tabaco y de alcohol. Un sesgo potencial de recuerdo puede reducirse mediante la comprobación del historial ocupacional con el empresario.
Los estudios de cohortes retrospectivos también son vulnerables a los sesgos de información, porque los grupos «expuestos» habitualmente son estudiados con más intensidad que los no expuestos, por ejemplo, organizando más exámenes médicos periódicos para los primeros. Así, los historiales de salud individuales que poseen las empresas pueden contener una información más detallada
160
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
de los trabajadores expuestos a agentes potencialmente perjudiciales que de los trabajadores no expuestos. Una estrecha vigilancia, si se lleva a cabo correctamente, facilita el diagnóstico precoz de las enfermedades. En los estudios de mortalidad, esta situación generalmente genera escaso error, pero por lo que se refiere a otros indicadores de morbilidad, como por ejemplo, la baja por enfermedad, el sesgo de información es notable. Ejemplo 6. Supongamos que se lleva a cabo un estudio de cohortes retrospectivo para examinar la morbilidad por cáncer en una gran empresa, conocida por su tradición en Salud Ocupacional. Supongamos que los únicos datos de referencia disponibles son los del registro nacional de cáncer. Por lo que concierne a la mortalidad, el sesgo ocasionado por una atención de salud mejor de lo normal conduce a una detección temprana, y tal vez a un mejor pronóstico de algunos tipos de cáncer, lo que causaría un sesgo negativo. Sin embargo, si se estudia la incidencia de cáncer como complemento de la mortalidad, las mismas circunstancias podrían conducir a una detección temprana, especialmente de las formas de cáncer más lentas y menos malignas, y entonces el sesgo sería positivo.
Debe destacarse que, siempre que se usa la población general como grupo de referencia en un estudio de mortalidad, no deben corregirse las causas de la muerte en la cohorte expuesta, incluso en el caso de haber encontrado diagnósticos incorrectos. De este modo, se asegura el requisito de simetría en la información. No hay ningún método para comprobar las estadísticas nacionales de defunciones en cuanto a la exactitud del diagnóstico, ni hay manera de corregir los diagnósticos incorrectos en el grupo de referencia. La corrección de las causas de la muerte en el grupo expuesto, o la exclusión de los casos de diagnóstico incorrecto, sería asimétrica necesariamente e introduciría sesgo. El procedimiento más habitual (equivocado) ha sido la realización de un escrutinio a fondo de los casos de la enfermedad de interés sin considerar otros diagnósticos; este tipo de revisión sólo puede tener una dirección, a saber, negativa, lo que significa una disminución aparente del «verdadero» RR. El uso de la población general como categoría de referencia inevitablemente conduce hacia cierta inexactitud en la información, que debe ser aceptada si las ventajas ofrecidas por esta práctica son lo
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
161
bastante buenas como para compensar las desventajas (además de todos los otros problemas de validez inherentes en este tipo de estudio). Pero si la población de referencia es una cohorte ad hoc, entonces los diagnósticos de los dos grupos deben ser comprobados de forma simétrica, lo que requiere que el patólogo desconozca el estado de exposición del sujeto. De todas formas, en los estudios de casos y controles el diagnóstico siempre debe verificarse de la manera más precisa posible para evitar al máximo los errores de clasificación. Este proceso no crea información asimétrica siempre que se comprueben los diagnósticos y se haga la definición de «caso» antes de iniciar la recogida de información. Por el contrario, el diagnóstico de referencia no necesita ser comprobado con tanta precisión si se presume que el hospital posee una razonable exactitud diagnóstica. El motivo por el que se usa a personas enfermas como controles, en lugar de una muestra de la población de base, es asegurar la simetría en la calidad de la información, pero no estudiar la enfermedad de referencia. Si no perdemos de vista este hecho, es irrelevante conocer si todos los diagnósticos son correctos o no. Los sesgos de información aparecen en los estudios transversales y en los estudios de cohortes prospectivas (enfocados a formas de morbilidad más leves que la muerte), si los datos de morbilidad de los grupos expuestos y no expuestos se recogen de maneras diferentes. El grupo de referencia debe examinarse con tanta frecuencia y cuidado como el grupo expuesto. Ya que el investigador puede influir en la recogida de información en ambos tipos de diseños, sería posible controlar el sesgo de información siempre que se tuviera suficiente cuidado. Control del sesgo de información
La siguiente lista ilustra algunos de los métodos para controlar o evitar el sesgo de información: 1. Las mediciones deberían calibrarse de manera cuidadosa y regular. Los equipos sensibles pueden fallar; los reactivos pueden contaminarse, caducar o precipitar, etc. 2. Las mediciones deberían estandarizarse. Se deberían usar criterios preestablecidos, por ejemplo, para leer radiografías, co-
162
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
3.
4.
5.
6.
dificar electrocardiogramas y clasificar los datos de exposición. Las condiciones experimentales deben estandarizarse; por ejemplo, la temperatura del laboratorio durante la medición de la velocidad de conducción de los nervios periféricos o durante las pruebas de capacidad física de trabajo. Cuando se clasifican los resultados como normales o patológicos, se debe usar siempre el mismo criterio preestablecido (por ejemplo, depresión del intervalo S-T ≥ 1 mm). Cuando se practican análisis seriados, la proporción de muestras de los grupos expuestos y no expuestos debe ser la misma. Así, las pequeñas variaciones en la exactitud de las mediciones, por ejemplo, de día en día, se distribuirán simétricamente entre los grupos. Siempre que sea posible, los que practican las mediciones y los que las interpretan deberían actuar «a ciegas». Es posible usar esta «ceguera» en las pruebas de laboratorio, en la lectura de electrocardiogramas o en exámenes radiológicos. Sin embargo, tan pronto el estudio comporte comunicación oral con el sujeto, (por ejemplo, tests psicológicos, entrevistas en estudios de casos y controles), no es posible practicar dicha «ceguera». Siempre que en el estudio tome parte más de un observador, todos deben ser entrenados para conseguir la misma exactitud y precisión en las mediciones. Además, el investigador debe evaluar la validez de dicha formación mediante la medición del error interobservador. La magnitud del tal error puede valorarse si diferentes observadores realizan mediciones en la misma muestra de sujetos y se comparan los resultados. Rara vez se consigue eliminar este error por completo. Por lo tanto, los distintos observadores deberían realizar la misma proporción de mediciones para cada uno de los diferentes grupos en estudio (es decir, los expuestos y los controles, diferentes categorías de expuestos). Siempre que las mediciones repetidas impliquen un aprendizaje por parte de los sujetos, las primeras y las segundas mediciones deberían distribuirse por igual entre los observadores. El error interobservador siempre debe figurar en el informe del estudio (pero desafortunadamente lo habitual es que no se mida o que no se informe sobre su medición). Las mediciones hechas por el mismo observador también varían durante el curso del estudio. Cuanto más inespecífico sea el parámetro que medir (por ejemplo, fibrosis pulmonar pre-
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
163
coz), más importante será el error intraobservador, porque el observador se vuelve más experto con el tiempo e inconscientemente empieza a aplicar criterios nuevos o modificados. El error intraobservador también puede medirse. Su efecto distorsionador puede prevenirse si la proporción diaria de sujetos expuestos y no expuestos a los que se efectúan las ediciones se mantiene constante a lo largo de todo el estudio. Sin embargo, en la práctica esta norma que parece simple puede resultar complicada. Por ejemplo, en un estudio de campo en el que los sujetos expuestos y los no expuestos han sido empleados por distintas compañías, a menudo no hay posibilidad práctica de pasar con frecuencia de un centro de trabajo a otro. 7. Cuando se trata de un estudio con entrevistas, los entrevistadores tienen que estar bien entrenados. No todo el mundo es, o puede convertirse, en un buen entrevistador, por lo que es importante escoger buenos entrevistadores. Si es posible, es preferible mantener oculta la hipótesis del estudio, tanto para el entrevistador como para el entrevistado. Los entrevistadores deben usar una técnica neutral y entrevistar a casos y controles de la misma manera. El tiempo empleado en la entrevista es una medida cruda de lo completa que ha sido. Debería anotarse el tiempo que se ha empleado en cada entrevista para que pueda compararse el tiempo empleado en las distintas categorías de los sujetos. Las preguntas abiertas generalmente aportan la mejor información; por lo que puede ser útil empezar la entrevista instando a los sujetos a que describan la cuestión de interés con sus propias palabras, (tal como: «Describa una jornada de trabajo típica»). De todas formas, este tipo de preguntas no son válidas cuando el investigador está interesado en largos períodos de tiempo. La habilidad del entrevistador también mejora a lo largo del estudio y, por este motivo los casos y los controles deberían ser entrevistados en la misma proporción durante todas las etapas del estudio. El uso de cuestionarios elimina muchos de estos potenciales errores. Sin embargo, en general, la calidad de la información obtenida de cuestionarios es más pobre que la de las entrevistas. De todas formas, la ganancia en cuanto a la obtención de información más simétrica puede ser insignificante comparada con la pérdida de calidad. Si el grupo en estudio es grande, la cuestión del coste no permite otra opción que la técnica del cuestionario, que es más barata.
164
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
8. Como ya se ha dicho, una forma de asegurar la simetría de la información es usar pacientes con otra enfermedad como controles. Sin embargo, el lograr superar el sesgo de información por este método puede llevar a un sesgo de comparación o de selección. Es difícil encontrar la solución óptima. 9. Una información cruda es mejor incluso que ninguna. De todas maneras, debería por lo menos investigarse el estado vital de todos los miembros de una cohorte; la información que falta puede ser asimétrica. La migración entre países es un motivo que dificulta este objetivo, sobre todo en los países que contratan a muchos trabajadores extranjeros con gran movilidad. Cuando vuelven a su país nativo, como suelen fallar los registros, se pierde fácilmente su seguimiento. De todas formas, en ocasiones se puede obtener sin problemas información sobre el estado vital de ciudadanos extranjeros en su país de origen. En los países nórdicos, esta información puede obtenerse, pero en muchos países como en el norte de África, Oriente Medio y Latinoamérica no se puede disponer de tales datos. Si la cohorte estudiada contiene muchos trabajadores extranjeros, el estudio está predestinado a fallar desde el principio y sería preferible no iniciarlo.
Validez de la comparación Una comparación válida requiere que todos los grupos comparados sean similares en todos los aspectos relevantes, excepto en las propiedades que caracterizan a la asociación que se estudia. En los estudios de cohortes, los grupos se definen en base a la exposición, y en los estudios de casos y controles es la presencia o la ausencia de enfermedad lo que distingue a ambos grupos. Podríamos decir que el grupo control debería reflejar lo que le hubiese sucedido al grupo expuesto si no hubiese existido la exposición. En los experimentos, la comparabilidad entre las poblaciones en estudio en cuanto a sus características propias (como herencia, enfermedades concomitantes, propiedades psicológicas), se consigue mejor si los sujetos (o animales) se distribuyen aleatoriamente (randomización) entre expuestos y no expuestos. La comparabilidad de las poblaciones en estudio significa que estas poblaciones deben ser similares en cuanto a sus características propias; los sujetos índice y los controles tienen que ser «parecidos», por ejemplo, respecto a
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
165
las características que determinan su entrada y salida de determinados empleos, la estructura social y también todos los otros aspectos relevantes. En los estudios epidemiológicos la randomización casi nunca es posible. Por lo tanto, la comparabilidad entre las poblaciones en estudio debe conseguirse mediante la selección de un grupo control que asegure una comparabilidad aceptable26. En los ensayos clínicos, la comparabilidad de los efectos que se estudian (verbigracia, la eficacia de un tratamiento) se consigue mediante la utilización de un placebo u otro tratamiento (generalmente el tratamiento «convencional») en el grupo control. En la investigación epidemiológica, el grupo expuesto debe compararse a un grupo de referencia sin la exposición de interés, pero por otro lado con un patrón de exposiciones similar al del grupo de estudio. En consecuencia, la «no exposición» no significa simplemente la ausencia de exposición, sino también la comparabilidad respecto a las otras exposiciones26. Es importante también conceptualizar y definir el objetivo exacto del estudio. ¿Se trata de una exposición determinada, de una combinación de exposiciones o de algo más? Por ejemplo, si el objetivo son los efectos del disulfuro de carbono sobre la morbilidad coronaria, la categoría de referencia debería ser similar en todos los demás aspectos (tales como otras exposiciones químicas, la existencia de turnos de trabajo, el esfuerzo físico y exposiciones no ocupacionales). Si, por el contrario, el objetivo son los efectos combinados del trabajo en una fábrica de viscosa, el grupo de referencia no debe tener ninguna de las características de este trabajo, pero debe ser similar respecto a las exposiciones no ocupacionales, tales como el consumo de tabaco. Este requisito significa que la mayoría de las personas «no expuestas» no están cualificadas para ser controles válidos. Muy pocas cumplen con los requisitos de la comparabilidad de los efectos26. El grupo de referencia debería describir lo que le hubiese ocurrido al grupo expuesto si no se hubiese producido la exposición.
Los grupos de control ideales son difíciles de hallar, por lo que uno debe llegar a un compromiso. Para ello, debemos centrarnos
166
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
en las características de la población y de la exposición que más probabilidad tienen de distorsionar los resultados del estudio. En el ámbito de la Salud Ocupacional, por lo que se refiere a las características de la población, al menos la edad debería hallarse distribuida de forma equitativa entre los grupos. También conviene ser estricto respecto a la distribución por sexos. Si el número de hombres o mujeres es demasiado pequeño, es mejor restringir el estudio al sexo con mayor representación. La clase social es un determinante importante de la mortalidad, y a menos de que este efecto vaya a ser estudiado, los grupos deberían tener una estructura social similar. En general, las características de las poblaciones que considerar dependen de la naturaleza del problema. El control de determinantes externos de la enfermedad en estudio, es decir, otras exposiciones, también depende de la naturaleza del problema. Por ejemplo, en un estudio sobre la relación entre la exposición ambiental en una fundición y la incidencia de cáncer de pulmón, es preferible usar un grupo control que posea hábitos tabáquicos parecidos a los del grupo expuesto o efectuar comparaciones entre subgrupos con niveles de tabaquismo similares. Por otro lado, si el objetivo es la relación entre la exposición a disolventes clorados y cáncer hepático primario, no se conoce que el consumo de tabaco sea un factor de riesgo mayor para esta enfermedad, mientras que el consumo de alcohol probablemente sí lo es. Por lo tanto, en esta situación no es tan importante controlar por consumo de tabaco y, en cambio, el control por consumo de alcohol merece una seria atención. Sin embargo, como el conocimiento científico aumenta, factores que en el momento actual parecen no estar relacionados con una enfermedad, más tarde pueden estarlo. Por ello, puede ser prudente (si el presupuesto lo permite) medir también, para una posible revisión futura, algunas características de los grupos en estudio que en este momento no se consideren factores de riesgo de la enfermedad. Ejemplo 7- El objetivo del estudio finlandés sobre el disulfuro de carbono (ver el ejemplo 16 en el Capítulo 2, y el ejemplo 14 en el Capítulo 4) era investigar si la morbilidad por enfermedad coronaria (EC) se incrementaba con la exposición a dicha sustancia. El grupo expuesto lo formaron los trabajadores que habían trabajado en una fábrica de rayón viscosa durante al menos 5
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
167
Tabla 5.1. Realización de la comparabilidad entre el grupo expuesto y el de referencia.
Fuente: Hernberg et al.12.
años, y el grupo control los trabajadores que ocupaban un puesto similar en una fábrica de papel cercana. Se asumió que el medio ambiente laboral de ambas fábricas (sin tener en cuenta la exposición al disulfuro de carbono) tenía el mismo efecto, si es que lo tenía, sobre el riesgo de desarrollar EC. Ambas fábricas tenían niveles de ruido muy elevados, con temperaturas muy altas en algunos puestos de trabajo, con los típicos turnos de trabajo y con una distribución similar de tareas tanto para los trabajadores como para los oficinistas. Se produjeron otras exposiciones químicas, diferentes en cada una de las fábricas, pero ninguna tenía un efecto cardiotóxico conocido o sospechado. Por lo tanto, el medio ambiente laboral de ambas empresas era comparable. Era igualmente importante asegurar la comparabilidad de las poblaciones respecto a los factores de riesgo coronario mayores (conocidos en 1967). Estos factores eran la edad, el sexo, el distrito de nacimiento, la actividad física durante el tiempo libre, la zona de residencia y la clase social. Al resultar expuestas sólo 20 mujeres, se decidió restringir el estudio exclusivamente a los varones. La Tabla 5.1 resume cómo se midieron y controlaron los factores de riesgo coronario más importantes. Los grupos no fueron pareados por nivel de lípidos plasmáticos, presión arterial o nivel de glucosa en sangre porque (aunque todos se midieron), según la literatura, existía la posibilidad de que los efectos cardiotóxicos del disulfuro de carbono pudieran producirse a través de
168
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
cualquiera de estos mecanismos o de todos ellos. Nunca se debe parear en los pasos intermedios de la cadena causal de causa a efecto, porque este procedimiento podría enmascarar el verdadero efecto ejercido por la exposición26. Ahora, con más de 20 años de experiencia adicional en estudios de cohortes ocupacionales, apenas si se considera el pareamiento («matching») individual debido al gran esfuerzo que exige. Con facilidad, podrían surgir dificultades prácticas para hallar controles, si el «pool» o colectivo de controles no fuese muy grande. Afortunadamente, había un excedente de controles potenciales en la fábrica de papel y se disponía de una asistencia técnica suficiente. Aunque el procedimiento de parear fue muy laborioso (duró 6 semanas), se pudo encontrar un control para cada sujeto expuesto. El resultado del pareamiento fue no tan sólo una mejor comparabilidad entre los grupos, sino que también se mejoró la eficiencia del estudio porque se equilibraron todos los subgrupos de la población. Los que no están familiarizados con la epidemiología de la EC en Finlandia pueden preguntarse porque se pareó por distrito de nacimiento. La EC era (sobre todo en aquellos tiempos) más frecuente en la parte oriental de Finlandia que en la occidental. Se sabía de antemano que cuando la empresa, fundada originalmente en Karelia, fue evacuada a la Finlandia occidental durante la II Guerra Mundial, todos sus trabajadores también emigraron. El resultado fue que el 40% de los trabajadores empleados por la fábrica de rayón viscosa en 1967 habían nacido en Karelia, mientras que sólo el 25% de los trabajadores de la fábrica de papel eran originarios de Karelia.
El pareamiento individual fue, sin duda, la única opción mediante la cual se podía controlar la asimetría del distrito de nacimiento. Podría haberse usado un muestreo pareado y estratificado u otro método, tal como estratificar por distrito de nacimiento en el análisis. (A principios de los 70 no era muy frecuente usar modelos matemáticos.) Independientemente del método elegido, no se podía pasar por alto este hecho, porque la mortalidad coronaria en Finlandia oriental en aquel tiempo era un 50% más elevada que en la occidental. Actualmente, el uso de modelos matemáticos en el análisis de los datos sería el método de elección para controlar este efecto de confusión. Este ejemplo ilustra lo importante que es para los epidemiólogos conocer a fondo a los sujetos en estudio.
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
169
En un estudio de casos y controles en el que se usa como controles a pacientes con enfermedades distintas de la enfermedad índice, puede producirse un sesgo de comparación si la enfermedad no es totalmente independiente de la(s) exposición(es) en estudio. Los controles deberían aportar una estimación de la distribución de la exposición en la base del estudio y dicha estimación podría ser incorrecta si la enfermedad de referencia se halla causada o prevenida por la exposición en estudio. Por lo tanto, es importante escoger una enfermedad «neutra» como enfermedad de referencia. El problema estriba en que los efectos de muchas exposiciones no se conocen. Cuando se estudian varias causas potenciales de una enfermedad, es difícil encontrar una enfermedad de referencia que no esté causada ni prevenida por ninguna de ellas. En los estudios de casos y controles, el grupo control muestra el patrón de exposiciones en el conjunto de la base del estudio o, alternativamente, en los no-casos. Ejemplo 8. En el estudio nórdico de casos y controles sobre cáncer nasal y sinonasal (ver el ejemplo 14, Capítulo 4), fueron seleccionados como controles pacientes con cáncer de colon13. Se suponía que ninguna de las exposiciones estudiadas causaba o prevenía este tipo de cáncer. Si sólo se hubiese estudiado una exposición, habría sido más fácil escoger un determinado tipo de cáncer como referencia. Sin embargo, se trataba de un estudio abierto, en el sentido de que, aparte del polvo de madera, también se estudiaron otras exposiciones. De entre las exposiciones estudiadas, el polvo de la madera, el níquel y los cromados no eran sospechosas de causar cáncer de colon, aunque no podía decirse lo mismo del asbesto, cuya relación con el cáncer nasal hubiera sido interesante investigar. Ya que se había sugerido que el asbesto podía causar cáncer de colon, esta categoría de control no servía para investigar el papel etiológico del asbesto. Por lo tanto, el estudio nórdico sobre el cáncer nasal no aportó ninguna información en este sentido.
1 70
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Figura 5.2. Un factor de confusión se entremezcla con el problema en estudio. Distorsiona la verdadera asociación entre la exposición y el efecto.
Sesgo de confusión («Confounding»)
El sesgo de confusión puede tener lugar cuando el investigador no ha logrado encontrar un grupo control que sea comparable con el grupo índice, en relación con las características relevantes intrínsecas y extrínsecas. La palabra «relevante» significa aquellas características que son predictoras de riesgo en la población en general, tales como la edad, el sexo y ciertas características bioquímicas (intrínsecas), así como factores relacionados con el estilo de vida (dieta y tabaco), otras exposiciones químicas y el trabajo por turnos (extrínsecas). Si los grupos en estudio no son comparables en estos aspectos, es decir, si estos u otros factores de riesgo se distribuyen asimétricamente, entonces habrá confusión. Por lo tanto, un factor de confusión es un determinante extraño de la variable de resultado que se distribuye asimétricamente entre el grupo índice y el de referencia. Un factor de confusión distorsiona la asociación de interés (figura 5.2). De forma simple puede decirse que un factor de confusión se caracteriza por las dos propiedades siguientes: 1. Es un factor de riesgo causal de la enfermedad en estudio. 2. En el estudio en concreto se correlaciona con la exposición (sin ser una consecuencia de la misma). En otras palabras, si un factor causal de la enfermedad (aparte del que se halla en estudio) ocurre más (o menos) frecuentemente entre los expuestos que entre los controles, entonces en el estudio hay confusión. La conexión con la enfermedad siempre debe ser
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
171
causal, lo que quiere decir que un factor de confusión debe ser un factor de riesgo verdadero de la enfermedad, mientras que su relación con la exposición no necesita ser causal. Puede darse en un estudio pero no en otro. Ejemplo 9. Consideremos un estudio que explora si la exposición al polvo causa bronquitis crónica. El tabaquismo (que siempre es un factor de riesgo causal de bronquitis) será un factor de confusión sólo si el grupo expuesto contiene más (o menos) fumadores que el grupo control. Esta situación puede ocurrir en un estudio determinado, mientras que otro puede haber una distribución simétrica de fumadores en ambos grupos. En el primer caso, el tabaquismo es un factor de confusión pero en el segundo no lo es. Ejemplo 10. Consideremos otro estudio que investiga el efecto del tabaquismo en la ocurrencia del cáncer de pulmón. Se ha observado que los fumadores presentan los dedos amarillos más frecuentemente que los no fumadores. Los pacientes con cáncer de pulmón también tienen los dedos amarillos con más frecuencia que otros pacientes. ¿El tener los dedos amarillos es un factor de confusión? Como se ha dicho anteriormente, un factor de confusión debe, a la vez, ser un factor de riesgo causal de la enfermedad y estar asociado estadísticamente con la exposición. En este caso, los dedos amarillos se hallan verdaderamente relacionados con la exposición, porque el hecho de fumar lleva a la pigmentación de los dedos. Así que se cumple uno de los requisitos. Por otro lado, su relación con el cáncer de pulmón no es causal, ya que los dedos amarillos por sí solos no causan cáncer de pulmón. Si hacemos desaparecer el color amarillo usando un detergente potente, o incluso tras la amputación de los dedos, el riesgo de cáncer no se reducirá. Su conexión con el cáncer de pulmón es claramente una relación no causal, por lo que el tener los dedos amarillos no puede ser un verdadero factor de confusión. Esta característica es un indicador no específico del tabaquismo; podría considerarse como la aproximación de un marcador de exposición al tabaco. Clásicamente, un factor de riesgo causal de una enfermedad es un factor de confusión si ocurre con mayor o menor frecuencia entre los expuestos en un determinado estudio.
172
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Figura 5.3. Un factor de confusión no siempre tiene la misma apariencia, la de un monstruo fácilmente identificable.
El texto anterior y los ejemplos 9 y 10 destacan el hecho de que un factor de confusión no es una especie de monstruo que siempre tiene el mismo aspecto y que puede identificarse fácilmente (figura 5.3). Los factores de confusión se entremezclan con el problema en cuestión. El mismo factor puede ser unas veces un factor de confusión y otras no (figura 5.4). Es su entremezcla lo que decide si un factor de riesgo es o no un confundidor. La identificación de un factor de confusión requiere una cuidadosa consideración y un gran conocimiento del tema en estudio. La edad, el consumo de tabaco, el consumo de alcohol y similares no son de forma automática factores de confusión. En unas situaciones pueden provocar confusión y en otras no. Si un factor de confusión distorsiona un estudio, su fuerza es única para este estudio. Depende de lo asimétricamente que se distribuya el factor entre las categorías expuesta y de referencia. En otro estudio el efecto de confusión debido al mismo factor puede ser más fuerte o más débil, e incluso puede cambiar de positivo a negativo. Esta variación no es aleatoria (como el estimado del RR en los estudios pequeños), sino que depende del grado de asimetría de cada estudio en particular. Por lo tanto, no deben aplicarse pruebas estadísticas para ayudar a decidir si hay o no confusión, si se han observado diferencias en la distribución de un factor de confusión (por
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
173
Figura 5.4. Los factores de confusión, aunque puedan ser feos, incluso cuando están aislados, deben entremezclarse con el problema para cumplir con los criterios de confusión.
ejemplo, tabaquismo) entre los grupos en estudio. La fuerza del efecto de confusión depende de lo grande que sea la diferencia en el estudio en cuestión. No tiene nada que ver con el hecho de si el resultado era o no debido al azar. Por ejemplo, si el tabaquismo tiene lugar con una frecuencia un 15% superior entre los expuestos en un estudio sobre la EC relacionada con el trabajo, su efecto de confusión es exactamente lo que el 15% más de fumadores hace aumentar la EC en este estudio en particular. Es totalmente irrelevante si la diferencia del 15% es o no «significativa». En otro estudio la diferencia podría ser muy diferente, dependiendo de los hábitos de fumar de las poblaciones concretas del estudio. Además, una diferencia del 15% puede ser no estadísticamente significativa en un estudio de pequeñas dimensiones, mientras que en un estu-
174
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
dio extenso incluso una diferencia del 5% podría resultar «significativa». Si solamente el hecho de la «significación estadística» fuese lo que decidiera si el tabaquismo es un factor de confusión, la diferencia mayor podría permanecer sin controlar en el análisis de datos, mientras que se ajustaría por la menor. Tal práctica, por supuesto, no tendría ningún sentido. Ejemplo 77. El estudio finlandés sobre disulfuro de carbono, al que ya nos hemos referido, mostró un exceso de infartos de miocardio fatales y no fatales en el grupo expuesto. ¿El tabaquismo podría haber sido un factor de confusión? El tabaquismo es un factor de riesgo causal de EC, por lo que cumple con uno de los requisitos para ser un factor de confusión. Para cumplir con el otro, debería asociarse con la exposición en este estudio en concreto, o bien ser más (o menos) común en los trabajadores expuestos que en los controles. En general, no se conoce el tabaquismo de los individuos cuando se seleccionan los grupos de estudio; esta información se obtiene en relación con los datos del estudio, generalmente mediante un cuestionario autoadministrado o una entrevista. Si el tabaquismo resulta hallarse distribuido asimétricamente entre los grupos, debe controlarse como un factor de confusión en el análisis de datos. En caso contrario, es decir, si no cumple con el segundo requisito de factor de confusión, no requiere control en el análisis, aunque a simple vista puede parecer sorprendente. En este ejemplo, el cuestionario reveló que la asimetría en el hábito de fumar era tan leve que el tabaquismo no podía confundir en un grado destacable la relación entre la exposición al disulfuro de carbono y la incidencia de ataques coronarios. Por ello, el tabaquismo no fue tratado como factor de confusión en el análisis de datos.
Sin embargo, existe otra razón para hacer un escrutinio por separado en las diferentes categorías de fumadores. El tabaquismo podría ser un modificador del efecto de la asociación entre la exposición al disulfuro de carbono y la EC, lo que significa que el efecto podría ser más fuerte para los grandes fumadores (o más leve, aunque esto no es biológicamente plausible en este ejemplo). El examen de esta posible modificación del efecto podría ayudar a esclarecer el mecanismo por el cual el disulfuro de carbono contribuye a causar EC. Por este motivo, se calculó por separado el RR de las distintas categorías de fumadores. No se observaron diferen-
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
175
cias, es decir, el RR se hallaba elevado de forma similar en todos los niveles de exposición al tabaco (hasta donde puedan obtenerse conclusiones a partir de las cifras pequeñas en las subcategorías). Un factor de confusión puede causar distorsiones cualitativas y cuantitativas, de forma similar a otros sesgos. Un factor de confusión positivo puede producir el aumento de una falsa diferencia cuando no hay ninguna o exagerar un efecto real. Un factor de confusión negativo puede enmascarar completamente un efecto verdadero o disminuirlo. Si el efecto verdadero solamente es débil, el factor de confusión puede convertir un efecto positivo en uno negativo, y viceversa. Ejemplo 12. Supongamos que los trabajadores expuestos del ejemplo anterior por algún motivo hubieran infradeclarado sistemáticamente su hábito de fumar. Esta infradeclaración podría haber provocado un sesgo de información que afectaría a un potencial factor de confusión. En consecuencia, la supuesta simetría del hábito de fumar podría ser falsa o el grupo expuesto podría, de hecho, haber fumado más que el grupo control. Entonces el tabaquismo podría haber sido un factor de confusión positivo no detectado, y por lo tanto no tenido en cuenta en el análisis. Al considerar estas posibilidades se debe aplicar el sentido común: ¿existe algún motivo específico que explique por qué solamente los sujetos expuestos infradeclararon el tabaquismo? Si no se puede hallar ninguna explicación coherente, la siguiente pregunta es: ¿por qué a priori se debe asumir una distorsión? E incluso, si se encontrara una explicación válida, ¿qué exceso de riesgo se podría explicar por el factor de confusión? El fenómeno del sesgo de confusión no es blanco o negro. Un factor de confusión debería valorarse también desde un punto de vista cuantitativo. Según ello no sería creíble explicar un RR cuya estimación puntual es 4,7 como debido a confusión. Un factor de confusión puede ser positivo o negativo.
En Epidemiología Ocupacional, el sesgo de confusión debido a factores externos no ocupacionales tal vez no constituye un problema tan serio como generalmente se ha creído. Axelson4 estimó, teóricamente, hasta qué punto los diferentes grados de asimetría en
176
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Tabla 5.2. Razones de tasas crudas estimadas (RR) de cáncer de pulmón, en relación con la fracción de fumadores en varias poblaciones hipotéticasa.
el tabaquismo podían confundir el verdadero RR para el cáncer de pulmón (Tabla 5.2). Su intención era proporcionar una estimación sobre la intensidad del sesgo de confusión en la distorsión del estimado puntual del «verdadero» RR en un estudio en el que el investigador no conociese los hábitos de fumar de la cohorte expuesta. En su hipotético ejemplo usó la población general masculina de Suecia como categoría de referencia. Su estimación de los hábitos de fumar se basó en una encuesta realizada unos años antes en aquel país. Otras poblaciones pueden tener hábitos de fumar diferentes a los de Suecia, pero este punto no es relevante siempre que
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
177
las comparaciones se hagan dentro de un mismo país. La conclusión de este supuesto es que la asimetría debe ser más bien extrema para causar una distorsión sustancial del verdadero RR. La explicación es, por supuesto, que los fumadores no se comparan con no fumadores, sino con una población que tiene un determinado patrón de distribución del hábito de fumar. En la Tabla 5.2 se asume que el 50% de la población general está compuesta por ex-fumadores y no fumadores, el 40% fuma moderadamente y el 10% son grandes fumadores. La otra asunción es que el riesgo de desarrollar cáncer de pulmón es 20 veces superior para los grandes fumadores y 10 veces para los moderados, en relación con el riesgo en los no fumadores (incluyendo a los ex-fumadores). Incluso si un grupo expuesto tuviese un 20% de grandes fumadores y sólo un 30% de no fumadores, el efecto de confusión producido por el hábito de fumar sobre la estimación puntual del RR no podría ser superior a 1,43. En conclusión, el ejercicio de Axelson4 muestra que el posible efecto de confusión ejercido por el tabaquismo es menor de lo que generalmente se creía en los estudios sobre el cáncer de pulmón relacionado con el trabajo y tomando a la población general como categoría de referencia. Sin embargo, sus cálculos se aplican sólo a tasas crudas no estandarizadas. Estas asunciones han sido aplicadas empíricamente por Asp3, quien recogió información sobre los hábitos de fumar en una muestra de 1.990 hombres finlandeses. Utilizó las asunciones de Axelson para estimar cuánto hubieran confundido un hipotético RR para el cáncer de pulmón las diferencias observadas en los hábitos de fumar, con la asunción de que esta enfermedad se hubiese distribuido por igual entre las distintas categorías ocupacionales (Tabla 5.3). Comparado con la frecuencia media de tabaquismo en la muestra (la cual seguramente era una estimación correcta de la población finlandesa masculina), la estimación puntual del RR afectada por el sesgo de confusión variaba sólo entre 0,7 y 1,3, a pesar de que Asp utilizó asunciones bastante extremas. Tanto los cálculos teóricos de Axelson como los datos empíricos de Asp muestran claramente que el tabaquismo puede ser un factor de confusión significativo sólo en el caso en que el RR observado para el cáncer de pulmón esté entre 0,5 y 2,0. Estos valores no son raros en los estudios sobre el cáncer de pulmón relacionado con exposiciones ocu-
1 78
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Tabla 5.3. Razón de tasas estimada (RR) de cáncer de pulmón en relación con el porcentaje de no fumadores, ex fumadores y fumadores en varios grupos ocupacionalesa.
a Asumiendo que el RR= 1 para el conjunto de la muestra y un incremento del riesgo de 20 para los fumadores y de 10 para los ex-fumadores. Los riesgos asumidos para fumadores y ex-fumadores son extremos, por lo que los resultados exageran el efecto del tabaquismo.
pacionales, así que este hecho no debe pasarse por alto. Sin embargo, el sesgo de confusión causado por el tabaquismo no puede explicar valores observados del RR más elevados, al menos no completamente. En consecuencia, un estudio que mostrara un RR, por ejemplo de 3,5, no podría ser invalidado sólo porque los datos sobre el hábito tabáquico no estuvieran disponibles. Así como en ocasiones se ha exagerado el efecto de confusión provocado por el tabaquismo en los estudios sobre el cáncer de pulmón relacionado con el trabajo, se ha prestado poca atención a los posibles efectos de otras exposiciones ocupacionales anteriores o concomitantes. Los patrones de exposición complejos y mixtos generalmente hacen que la identificación de un agente causal específico sea imposible. En situaciones menos complicadas, las exposiciones combinadas requieren unos historiales de exposición muy detallados y un análisis de datos adecuado. A veces, incluso estas medidas son
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
1 79
insuficientes y la identificación del carcinógeno (o cualquier agente causante de una enfermedad crónica) debe confiarse a otro tipo de datos no epidemiológicos. Ejemplo 13. Se observó un exceso de leucemia entre los trabajadores de una empresa americana dedicada a la elaboración de goma de estireno-butadieno24. La exposición al estireno y butadieno se produjo en la mayoría de los trabajos. Fue imposible determinar qué tipo de agente era el causante del exceso de leucemia observado. Control del sesgo de confusión
Como se ha comentado antes, un factor de confusión puede controlarse tanto en la etapa del diseño del estudio como en la etapa del análisis de los datos. La randomización es el método más eficaz para controlar el sesgo de confusión. Es el método de elección en los ensayos clínicos y en otros trabajos experimentales. La randomización significa que los sujetos en estudio se asignan de forma aleatoria entre los grupos de expuestos y no expuestos. Sin embargo, si los grupos son reducidos, es probable que siga existiendo algún grado de confusión o, incluso, que aparezca por azar. En otras palabras, la randomización puede producir una distribución no equilibrada de los factores de riesgo entre los grupos. Desafortunadamente, la randomización es rara vez posible en los estudios epidemiológicos. Por ello, el sesgo de confusión debe controlarse mediante otros métodos. Los métodos para controlar el sesgo de confusión en los estudios epidemiológicos son la restricción, el pareamiento, la estandarización y la modelización.
La restricción significa que el estudio se centra sólo en una categoría, por ejemplo, el grupo de edad comprendido entre 40 y 69 años, varones, no fumadores y solamente los expuestos durante más de 20 años, sin exposición mixta y así sucesivamente. El material del estudio puede restringirse más, de tal forma que la distribución
180
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
de los potenciales factores de confusión resulte lo más simétrica posible en ambos grupos (ver: pareamiento frecuencial), si se eliminan los individuos «excedentes». Los grupos pueden, por ejemplo, seleccionarse de forma que contengan un 30% de administrativos, un 50% de no fumadores, una distribución por edades equilibrada y otros. Tal restricción mejora la comparabilidad entre los grupos. A menudo, la restricción se usa más para aumentar la eficiencia del estudio que para controlar el sesgo de confusión, como por ejemplo, al excluir a las categorías con una baja morbilidad o con exposiciones múltiples. La mejora de la eficiencia ahorra trabajo y dinero. El objetivo es encontrar una categoría en la cual el efecto sea el más amplio en relación con el «ruido de fondo». En otras palabras, no debemos centrarnos sólo en las categorías que tienen una incidencia elevada, tal como las personas mayores en un estudio sobre la incidencia de enfermedades cerebrovasculares; se debe considerar también para qué tipo de personas es probable que el RR sea más elevado. Esta consideración podría, por ejemplo, llevar a preferir hombres relativamente jóvenes en lugar de ancianos en un estudio sobre cáncer de pulmón relacionado con el trabajo. La restricción sola es un método débil para controlar el sesgo de confusión, especialmente si las categorías son amplias. Por ello generalmente se combina con otros métodos. En el pareamiento («matching») se seleccionan los casos y los controles de forma que sean comparables respecto a algunos potenciales factores de confusión, tales como la edad, el sexo, el estado vital, el hábito tabáquico y el momento del diagnóstico. Si el pareamiento se hace sujeto a sujeto, se llama pareamiento individual. Si se lleva a cabo por grupos de sujetos, hablamos de pareamiento frecuencial; en él, por ejemplo, no es necesario escoger un control de edad similar para cada caso. En su lugar los controles se seleccionan de manera que la distribución por edades de los casos y los controles sea similar en intervalos de 10 años (ver: restricción). Existen también otras formas de pareamiento. El pareamiento puede llevarse a cabo en relación con uno o a varios factores. Según cuantos más factores haya que parear, más difícil será hallar controles, especialmente si el material de referencia es limitado. El pareamiento siempre requiere mucho trabajo y por ello no se debería usar de forma indiscriminada. El pareamiento es típico de los diseños de casos y controles. A pesar de que
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
181
generalmente es efectivo en términos de información por unidad de sujeto, en los estudios de cohortes su coste es demasiado elevado y por lo tanto se usa poco. (El estudio de cohortes sobre el disulfuro de carbono descrito en varias ocasiones fue una excepción). El objetivo del pareamiento es controlar el sesgo de confusión debido a los factores por los que se ha pareado. Desde un punto de vista superficial, el pareamiento parece conceptualmente simple. Sin embargo, no es así. En los estudios de cohortes, que son semejantes a los experimentos, el tema es importante y el pareamiento realmente puede controlar el sesgo de confusión. En los estudios de casos y controles no ocurre lo mismo, a pesar de ser donde precisamente más se emplea el pareamiento. En lugar de conseguir su control, el pareamiento puede introducir confusión si el factor por el que se ha pareado se halla relacionado con la exposición2632. Si cumple con los criterios de confusión, tal factor deberá relacionarse con la exposición. Por lo tanto, el pareamiento por un verdadero factor de confusión siempre introducirá confusión, aunque el tipo de confusión puede ser diferente. El sesgo de confusión en la base del estudio puede haber sido positivo, mientras que el pareamiento puede introducir una confusión negativa (hacia la hipótesis nula; la confusión aportada por el pareamiento siempre es negativa). Por otro lado, si el factor de pareamiento no se correlaciona con la exposición, el pareamiento no introduce confusión. Sin embargo, en esta situación el factor en realidad no es de confusión (un factor de confusión debe estar relacionado con la exposición y con la enfermedad), y por lo tanto, el pareamiento es irrelevante. El problema es que en un estudio determinado no siempre sabemos de antemano si un factor de riesgo de la enfermedad está o no asociado con la exposición, es decir, si es o no un verdadero factor de confusión. El pareamiento puede introducir confusión negativa en los estudios de casos y controles.
El pareamiento se puede combinar con otros procedimientos para controlar el sesgo de confusión. Por ejemplo, se puede parear solamente por uno o dos factores —tal como el tiempo de ocurren-
182
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
cia del caso— y controlar el resto en el análisis estadístico. La tendencia actual es ser bastante restrictivo con el pareamiento y recurrir a otros métodos para controlar el sesgo de confusión, como la modelización. Como el pareamiento, en vez de conseguir su control, puede introducir una confusión negativa, es necesario ajustar por el factor en el análisis. Bajo ninguna circunstancia se debe parear por un factor que es (o puede ser) un paso intermedio en la cadena causal entre la exposición y la enfermedad. Este pareamiento siempre tendería a enmascarar el verdadero efecto, y por lo tanto, crearía un sesgo negativo25. Sin embargo, aunque el principal motivo del pareamiento es incrementar la validez del estudio —especialmente evitar el sesgo de confusión positivo—, también se usa para incrementar su eficiencia. El pareamiento asegura un número de observaciones suficientes en cada categoría del factor de confusión y, por lo tanto, mejora la relación coste-eficiencia del estudio. La estandarización se usa normalmente cuando una cohorte expuesta se compara con la población general, o cuando dos o más poblaciones generales se comparan mutuamente. La medida estandarizada más común es la RME (ver el Capítulo 2). La estratificación puede usarse sola o combinada con la restricción o con el pareamiento. En la estratificación, los grupos de estudio se dividen en subgrupos o estratos con la finalidad de controlar los factores de confusión, por ejemplo la edad, el sexo, el hábito tabáquico y el peso corporal. A continuación se efectúan comparaciones dentro de los estratos. El análisis estratificado controla los efectos de la distribución asimétrica de un factor de riesgo mediante la comparación de subgrupos que son similares respecto a los potenciales factores de confusión. Posteriormente, se dispone el conjunto de estratos y se calcula un RR global a partir de los valores de los RR específicos de estrato, mediante, por ejemplo, el método desarrollado por Mantel y Haenszel20. Sin embargo, la estratificación no es eficaz si la asimetría es extrema (que debería evitarse en la etapa de planificación mediante la restricción del material que estudiar), porque los extremos de las distribuciones no aportan información ya que no tienen oponente en el otro grupo. Ejemplo 14. Supongamos que la distribución por edades de dos poblaciones que se comparan son tan asimétricas como las
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
183
Tabla 5.4. Estratificación por edad en dos poblaciones hipotéticasa.
a
Ya que la distribución por edades es muy asimétrica, los grupos de edad menores de 30 años y mayores de 60 no aportan información.
que se muestran en la Tabla 5.4. El RR crudo para la enfermedad en estudio es 139/60 = 2,32. Sin embargo, es evidente que este RR es una medida fuertemente sesgada. Un análisis estratificado proporcionará un RR ponderado de 1,21 (estadísticamente no significativo). El peso de la información lo aportan las categorías de edad comprendidas entre 30 y 59 años. Sigue sin resolverse si la elevada morbilidad de los individuos expuestos del estrato de mayor edad es una consecuencia de la exposición o es «natural». Si se usa la estratificación, el potencial factor de confusión debe ser clasificado. Si se trata de una variable continua (por ejemplo, el colesterol sérico) debe clasificarse como alto, medio y bajo, o en categorías de, por ejemplo, 1 mmol/1. Cuantas más variables se usen para estratificar, más estratos serán necesarios. Por ello, un análisis estratificado requiere el estudio de una extensa muestra. Además, dentro de la categoría de valores «altos», tanto los individuos con valores más altos como los que los presentan más bajos se incluirán en un mismo estrato, por lo que el sesgo de confusión por este factor sólo puede controlarse parcialmente. Ya que los problemas siempre surgen cuando se estratifica por varios factores, en la etapa de planificación de la investigación se debe considerar seriamente si la estratificación es el mejor método para controlar el sesgo de confusión. Si la estratificación parece atractiva, entonces debe con-
184
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
siderarse qué factores potenciales de confusión deben ser controlados mediante este método y cuáles por otro. La amplitud de uso de la estratificación en el análisis de datos se halla muy determinada por el tamaño del material en estudio. Cuantos más estratos, mayor es el tamaño muestral requerido. La modelización es el método de elección siempre que haya varios factores que controlar en el análisis. Greenland8 define la modelización estadística como: «el uso de los datos para seleccionar un modelo matemático explícito del proceso de generación de los datos (pág. 340)». La construcción de modelos implica la especificación de la forma del modelo (por ejemplo, logística), la selección de las variables del sujeto (características) que deben entrar en el modelo, y la elección de su representación estadística (por ejemplo, indicadores) en la función del modelo. Las principales ventajas de los modelos multivariables con datos epidemiológicos son la mayor posibilidad de controlar más factores de confusión que con un análisis estratificado (en el que los estratos pueden quedarse sin números si tienen que estratificarse muchas variables) y que permite estimar de forma más precisa la variación del efecto de los niveles de exposición según los niveles de otros factores (modificación del efecto). Por ejemplo ¿el efecto de la exposición al disulfuro de carbono sobre la mortalidad coronaria es diferente en las distintas categorías de fumadores, presión arterial, o lípidos plasmáticos? Las desventajas de la utilización de modelos son las fuertes asunciones estadísticas implícitas, tales como la probabilidad de una respuesta individual similar según los diversos niveles de exposición y covariables, y que se requiere que las respuestas de los individuos sean independientes. Por ello, es necesaria una mayor eficiencia en el uso de modelos que en un simple análisis estratificado, ya que debe examinarse la corrección de las asunciones. Asimismo, los resultados de dichos modelos serán más difíciles de interpretar y de presentar de forma comprensible. Siguiendo un enfoque razonable, primero deben reproducirse los resultados de los análisis estratificados utilizando un número reducido de variables para verificar las asunciones, y solamente a partir de aquí se puede ampliar el modelo para describir y resumir la base de datos multivariada. Finalmente, debería utilizarse cualquier información previa disponible para evaluar cuidadosamente las implicaciones epidemiológicas inferidas a partir del modelo seleccionado.
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
185
La creación de modelos se utiliza para el control de varios factores en un material con muchas categorías.
Efecto del trabajador sano
El efecto del trabajador sano (ETS) ha sido considerado como un «hecho científico» y tratado como un fenómeno epidemiológico interesante en numerosos artículos, simposios y, más recientemente, en una monografía dedicada a la evaluación de los efectos de esta distorsión en la interpretación de los estudios de cohortes14. Y sin embargo, no es nada más que un sesgo trivial, como Miettinen27 dice: «Una manifestación de la ignorancia que aún envuelve la investigación epidemiológica modelada a partir de sus paradigmas tradicionales (pág. 72)». En un estudio de cohortes, el grupo de referencia debería proporcionar una estimación de la morbilidad en el grupo expuesto, si no se hubiese producido la exposición. Sin embargo, «la no exposición no debería interpretarse como una ausencia de exposiciones (pág. 30)26»; los grupos también deberían ser comparables en otros aspectos relevantes. La mayoría de la población general no cumple con este último criterio; de hecho, sólo un pequeño subgrupo es comparable a la cohorte expuesta. Según Miettinen26: «Aquellos que no cumplen los criterios ni de la categoría índice ni de la de referencia, se sitúan en una tercera categoría del determinante, la "otra" (pág. 30)». Esta «otra» tercera categoría es la que constituye la mayor parte de la población general. En vista de estas consideraciones, los epidemiólogos ocupacionales deben buscar otras soluciones antes de continuar de forma persistente en un diseño tan sesgado ya desde sus fundamentos. Wang y Miettinen35 describen irónicamente el problema: «Si la investigación terapéutica se llevara a cabo de forma análoga, los pacientes tratados deberían compararse con la "población general" para cualquier criterio de efecto. La experiencia nos mostraría que el grupo tratado generalmente tiene un resultado peor que la población de referencia, y esta diferencia podría conocerse como "el efecto del paciente enfermo" (pág. 153)».
186
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
La única explicación plausible para continuar con esta negligencia (a la que, desafortunadamente, muchos de nosotros hemos sucumbido) es que las cifras de mortalidad de la población general se encuentran disponibles de forma fácil, son baratas y estables. Esta última propiedad aumenta la potencia estadística de la comparación. Sin embargo, ha llegado el momento de considerar el abandono de la vieja rutina de comparar cohortes ocupacionales con la población general porque realmente existen otras opciones viables. (Ver la discusión más adelante). Sin embargo, como más bien no se han visto muchos signos de mejora en la reciente literatura epidemiológica, es inevitable realizar una breve discusión de la anatomía del ETS. McMichael, quien probablemente fue el creador de este término21, recientemente ha redefinido el ETS de la siguiente manera22: El ETS se refiere a la consistente tendencia de las personas trabajadoras activas a tener una experiencia de mortalidad más favorable que la población general. A pesar de la que la claridad parece implícita en su nombre, el ETS no es una medida intencionada de la relativa buena salud de una población laboral; ni tampoco cuantifica los efectos beneficiosos del entorno ocupacional sobre aquellos que trabajan en él. Más bien es un sesgo inintencionado, de magnitud incierta, en una inevitablemente imperfecta medición comparativa del estado de salud de una población laboral (pág. 58). El ETS provoca en la RME (razón de mortalidad estándar) que la mortalidad total de una cohorte expuesta se sitúe muy por debajo de 100, siempre que no haya factores relacionados con el trabajo o factores sociales que incrementen la mortalidad. En otras palabras, el ETS es un sesgo negativo. La literatura está llena de ejemplos que ilustran este fenómeno (véase la Tabla 5.5). Estas y otras poblaciones trabajadoras tienen un resultado mejor que el esperado debido a la no comparabilidad de la «tercera gran categoría» de la población general, que contiene personas sin empleo, inválidos y gente asocial, todos los cuales tienen una mortalidad más elevada que la «normal». Además, la población general y una cohorte de obreros difieren en estructura social. Esta diferencia tiene un notable impacto sobre la mortalidad, como ha ilus-
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
187
Tabla 5.5. Algunos ejemplos de los valores de la RME que reflejan el ETSa.
trado el trabajo de Kitagawa y Hauser15, quienes demostraron que la RME de los americanos sin empleo nacidos en el año 1950 o posteriormente (4,3% de la población) era de 204. Además, la RME del 4% de la población que no tenía ocupación era de 125. Los resultados de un estudio realizado a partir de una población finlandesa corroboran estos hallazgos33. Incluso cuando la RME para todas las causas se halla por debajo de 100, algunas RME específicas de causa pueden estar por encima de este valor. Una RME global baja no excluye la posibilidad de exposiciones que acorten la vida en el medio ambiente laboral. Sería realmente excesivo pensar que cualquier factor ocupacional incrementa todas las causas de la muerte de la misma manera. Además, la RME global es más un reflejo de los factores sociales que de los ocupacionales (dejando aparte sesgos, por supuesto). Sin embargo, también hay estudios que muestran que la RME global para todas las causas de muerte en cohortes ocupacionales puede ser perfectamente superior a 100. Por lo general, el motivo es un importante exceso de alguna simple causa principal de muerte, como el cáncer de pulmón, pero si la cohorte está formada por muchos trabajadores de clase social baja, el resultado puede ser un incremento general de la mortalidad en relación con la de la media de la población general. Por ejemplo, en un estudio británico, la RME de los trabajadores intensamente expuestos al asbesto era casi de 200, pero el incremento de la mortalidad no era
188
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
debido a un aumento global de todas las causas de muerte, sino a las neoplasias, la mayoría de pulmón y pleura29. El sesgo inducido por el ETS tiene una naturaleza compleja. Como ya se ha mencionado, no tiene relación con ningún efecto beneficioso del medio ambiente laboral sobre la salud de los trabajadores. La selección basada en la salud para un determinado empleo, o para toda la población laboral, es la causa más importante del ETS. El mero hecho de ser apto para trabajar, el ser contratado y la subsecuente permanencia en el puesto de trabajo, proporciona al trabajador una esperanza de vida mejor que la media. Adicionalmente a esta norma general, existen variaciones entre los diferentes trabajos; aquellos que exigen mayores requisitos físicos también demandan niveles superiores de salud. La categoría de comparación más correcta para cualquier grupo de trabajadores ocupados debería estar formada por trabajadores con iguales capacidades de trabajo y de similar estado de salud a priori, y no la «otra» gran tercera categoría de la población general. También existe una selección basada en la salud en los que se hallan fuera del trabajo, es decir, en aquellos que han dejado el trabajo, que causa más sesgo cuanto menos éxito se tiene en el seguimiento y valoración de su situación vital. Estos trabajadores, en promedio, tienen un estado de salud peor que los que permanecen en el trabajo.7,17 A pesar de que, sin lugar a dudas, se produce una selección basada en la salud tanto dentro como fuera del trabajo, es mejor considerar el ETS como un sesgo de confusión. Este tipo de sesgo se debe a una característica de la población en estudio, tanto intrínseca como extrínseca, o ambas, mientras que un sesgo de selección es el resultado de las actuaciones del investigador28. Como se ha comentado antes, el sesgo de confusión por el ETS se produce por la comparación sesgada con una categoría de referencia no comparable, la población general. La distinción no es sólo académica, porque, en principio, el sesgo de confusión puede controlarse durante el análisis, mientras que el sesgo de selección no. Sin embargo, en el caso del ETS, el estado de salud inicial, que es el principal factor de confusión, rara vez puede medirse en una cohorte ocupacional y nunca en la población general entera. Lo mismo ocurre respecto a otros potenciales factores de confusión, tales como los
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
189
factores relacionados con el estilo de vida, otras exposiciones ocupacionales, etc. Debido a que se hallan implicados errores sistemáticos, no tiene sentido (aunque es muy común) comprobar la significación estadística de los valores desviados de las RME, independientemente de si son altos o bajos. Es verdad que el estimado puntual de una RME tiene, además de un posible sesgo, un margen de variación aleatoria y, de acuerdo con la práctica convencional, las pruebas de significación valoran la probabilidad de que el resultado sea debido al azar. (Ni siquiera esta afirmación es del todo correcta; ver la discusión más adelante en este mismo capítulo.) Para tener una idea de la magnitud de la variación del estimado puntual de una RME en las hipotéticas réplicas de un estudio, es mejor comprobar el intervalo de confianza es vez de considerar si el valor de p es «blanco o negro». Sin embargo, ni el intervalo de confianza ni el valor de p proporcionan ninguna información sobre los errores sistemáticos como el ETS. El ETS no es constante y varía según los siguientes factoRes:21,22,28
1. El ETS es más importante en los grupos de edad más jóvenes, disminuye al avanzar la edad y desaparece después de la jubilación. En el caso de gente joven empleada, la comparación se efectúa con una población general joven que incluye los que tienen defectos congénitos, retraso mental y otras patologías, todos los cuales tienen una mortalidad elevada. Los trabajadores jubilados a causa de su edad no son muy diferentes de los de la población general que han sobrevivido a esta edad. 2. El ETS es más elevado en hombres que en mujeres, ya que la población general femenina incluye muchas mujeres inactivas por otras razones aparte de la salud. 3. Las clases sociales altas presentan un ETS más fuerte que las clases bajas debido a que la mortalidad en general es comparativamente baja en las clases sociales altas. Así, al comparar administrativos con una población general cuya mayoría pertenece a la clase social baja, puede producirse un fuerte ETS de base social. 4. El ETS es más fuerte al inicio del trabajo o poco tiempo después de haber entrado en una cohorte, porque en este momento es cuando la selección basada en la salud opera con más fuerza.
190
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
5. El ETS es distinto para las diferentes causas de muerte. En general, las enfermedades con una fase inicial silente y una rápida evolución posterior ocasionan un ETS sólo durante los primeros años posteriores a la identificación de la cohorte. El cáncer es un ejemplo típico. Con pocas excepciones, no existen buenos métodos para el cribaje o el diagnóstico precoz que mejoren significativamente el pronóstico en base a un grupo, o por lo menos no existen métodos aplicables en el ámbito de los servicios de salud ocupacional. En cambio, se puede diagnosticar a menudo (aunque no siempre) y con años de antelación, un riesgo elevado de enfermedad coronaria, ya se trate de las manifestaciones tempranas de insuficiencia coronaria, o de la presencia de factores de riesgo coronario (por ejemplo, hipertensión, colesterol sérico elevado, tabaquismo importante). Además, los síntomas tempranos de la enfermedad, como la angina en aquellos con EC, y la tos persistente o la disnea en los que tienen bronquitis crónica o enfisema, producen una autoselección, sobre todo si el trabajo requiere un buen estado físico. El efecto del trabajador sano es fuerte para las enfermedades respiratorias y cardiovasculares y débil para el cáncer.
Por los motivos discutidos, la RME global para todas las causas de muerte es difícil de interpretar si se halla en un rango de 80 a 100. Sin embargo, la RME global interesa poco en Epidemiología Ocupacional. Son más interesantes los valores de las RME de causa específica, especialmente si existe una hipótesis previa, en el sentido de que alguna exposición específica, una mezcla de exposiciones o alguna otra condición sean la causa de una determinada enfermedad. Rara vez puede pensarse que una exposición ocupacional incremente todas las causas de muerte, al contrario de lo que ocurre con la clase social, que tiene una gran influencia sobre la mortalidad global. El ETS entorpece también la interpretación de muchos valores de RME de causa específica. Sin embargo, por lo que respecta al cáncer, el ETS no ocasiona que un estudio de cohortes ocupacional sea totalmente ininterpretable. Se deberían comparar especialmente los valores de las RME de localizaciones específicas; la hi-
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
191
pótesis establecida es lo más importante que considerar. Si la RME para una localización es elevada y casi normal para las demás, el hallazgo es un argumento a favor de un efecto verdadero. Sin embargo, el enmascaramiento de los efectos verdaderos es un problema más serio y, por ello, el sesgo de confusión negativo, incontrolable debido a la falta de información, complica a menudo la interpretación de los resultados. Por este motivo, la población general no es una buena categoría de referencia, ni siquiera en los estudios sobre cáncer. Ejemplo 15. Supongamos que un estudio en una cohorte ocupacional de trabajadores de una fundición muestra una RME ligeramente elevada para el cáncer de pulmón, por ejemplo de 132. ¿Es debida a alguna exposición en la fundición, como el polvo de sílice o los hidrocarburos policíclicos aromáticos, o a ambos, o al consumo de tabaco? Se puede asumir que los trabajadores de la fundición fuman mucho, e incluso es posible calcular alguna medida aproximada sobre el nivel de tabaquismo entrevistando a los trabajadores actuales, pero como no se conoce suficientemente el hábito tabáquico en la población general, el problema normalmente permanece sin resolver. (Por supuesto, si la RME es más elevada, por ejemplo superior a 200, no puede explicarse solamente por el tabaquismo; ver la Tabla 5.2). Se pueden hacer algunas extrapolaciones de los valores de la RME observados en otras enfermedades relacionadas con el tabaco, tales como el cáncer de vejiga urinaria, la EC y el enfisema. Si estos valores son bajos, la etiología ocupacional es más creíble y viceversa, aunque no pueda llegarse a conclusiones definitivas.
A pesar de que existen algunos métodos para reducir el ETS, ninguno de ellos es totalmente satisfactorio. No se debe comenzar a calcular las personas-año antes de que hayan transcurrido entre 5 y 10 años desde el comienzo del empleo. Además, deberían hacerse análisis por separado para los distintos períodos de calendario, las distintas categorías de edad y los distintos períodos de seguimiento. Si se dispone de los datos de exposición o de detalles de la historia laboral, es importante dicotomizar la cohorte expuesta, por lo menos, entre fuertemente y ligeramente expuestos, y comparar mutuamente estas subcohortes. Sin embargo, tales perfeccionamientos
192
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
analíticos requieren grandes cohortes de expuestos, a menudo mucho más grandes de las que habitualmente son disponibles. A la vista de estas consideraciones, siempre que fuese posible se debería evitar la utilización de la población general como categoría de referencia. Es verdad que puede ser difícil encontrar buenos grupos de referencia ad hoc, y que el uso de un grupo de referencia ad hoc duplica los costes del estudio, tanto en términos de trabajo como de dinero, pero éste es el precio que se debe pagar por la calidad. Un estudio válido, fiable y eficiente es más informativo que diez estudios débiles e ininterpretables. Ciertamente, para elevar la potencia estadística a un nivel suficiente, el grupo de referencia debe ser bastante extenso y esto también puede ser costoso. Por otro lado, tanto la exposición como los potenciales factores de confusión pueden medirse a partir de una muestra estadística del conjunto del material, aunque la morbilidad o la mortalidad se hayan recogido del grupo entero. Esta es una forma de disminuir los costes. Otro método para evitar el ETS es definir la base de cohortes «expuesta» según criterios de inclusión liberales o amplios. Incluso se pueden admitir sujetos no expuestos. Después se puede hacer una valoración utilizando un diseño de casos y controles dentro de la base de cohortes. En este diseño, todos los casos de la enfermedad y una muestra de los no casos, representados por otra enfermedad o por toda la base de estudio, se comparan respecto a la exposición de interés. El criterio de inclusión liberal permite contrastes suficientemente amplios entre exposiciones, y hace posible el estudio de los efectos de la exposición de interés sin utilizar la población general. Sin embargo, una cohorte definida de esta forma no es adecuada para el análisis convencional de la RME, ya que la inclusión de sujetos ligeramente expuestos diluye el efecto si la cohorte se analiza como un grupo homogéneo (ver el Capítulo 4). PRECISIÓN
Los errores aleatorios resultan de la imprecisión de mediciones aisladas. El estimado puntual del resultado global del estudio (por ejemplo, el RR) también tiene una variación aleatoria; cuanto más pequeño es el estudio, mayor es la variación. La imprecisión se produce siempre que el método de medición
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
193
es poco sensible o bien si su especificidad es baja. Los métodos crudos dan lugar a variación alrededor de la media y esta variación no puede ajustarse mediante un factor de corrección ni por cualquier otro método. Por ejemplo, el error de un método analítico no específico al medir un cierto producto químico, o un metabolito de un agente tóxico, puede mostrar una dirección constante (por ejemplo, siempre da valores demasiado altos debido a su inespecificidad); como este método también mide otras sustancias, al contrario de otro más específico, nunca se puede saber cuánto error hay en el resultado. (Muchos métodos antiguos para analizar los metabolitos de los xenobióticos en la orina producían valores demasiado elevados, aunque no de forma constante, en comparación con los resultados de métodos más modernos y más específicos; por ejemplo, la cromatografía de gases.) La diferencia entre la naturaleza de los errores aleatorios y los errores sistemáticos se ilustra en la figura 5.5. Los errores aleatorios desaparecen, al menos, en los materiales extensos. (Técnicamente, tienen una distribución cuya media aritmética es 0.) Pueden compararse con unos disparos al blanco poco acertados, en los que los tiros se hallan dispersos alrededor de la diana. Incluso si no se tuviera en cuenta la diana, la media de los tiros podría situarse en el centro (figura 5.5). En una competición de tiro, este resultado se hallaría lejos de la medalla de oro. En un estudio científico tal dispersión da lugar al «ruido de fondo». Es difícil alcanzar significación estadística porque la amplitud de la variación es uno de los componentes de las pruebas de significación. Un error sistemático es muy diferente. Se puede comparar a unos tiros concentrados en el blanco, pero en un lugar equivocado (por ejemplo, alrededor del punto 2, a las cuatro y media, según la figura 5.5). Este error puede corregirse si el punto de mira del rifle se ajusta correctamente —entonces se puede llegar a medalla de oro. En un estudio científico, de la misma manera, se pueden ajustar los errores medidos, siempre que se conozca su magnitud, o bien corregir el sesgo de confusión (pero no un sesgo de selección). Si la corrección tiene éxito el resultado será más preciso, aunque su estimado puntual variará aleatoriamente dependiendo del tamaño del estudio. Los límites de la variación aleatoria pueden estimarse estadísticamente, al contrario de los errores sistemáticos, cuya presencia elimina las asunciones para las puebas de significación.
194
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
error sistemático
Figuras 5.6a y 5.6b.
La diferencia entre los errores aleatorios y sistemáticos puede observarse en el tiro al blanco.
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
195
Ya nos hemos referido a la variación aleatoria del resultado global, es decir, la estimación del RR de todo el estudio. En la siguiente discusión sobre esta variación aleatoria, se asume que los errores sistemáticos han sido controlados. Cuanto más pequeño es el estudio, más varía por azar el RR estimado. Supongamos que en un estudio pequeño se obtiene un RR de 8 con un intervalo de confianza del 95% de 0,6-106. Una repetición del estudio podría, por puro azar, dar un RR que estuviese dentro de estos límites, e incluso fuera de ellos en situaciones extremas. Ya que el límite inferior está por debajo de 1, el resultado no es estadísticamente significativo y la posibilidad de que el RR = 8 indique realmente un exceso de riesgo no es convincente. Cuanto más aumenta el tamaño del material de estudio, el intervalo de confianza se estrecha más. En otras palabras, la estimación puntual del RR se estabiliza y su variación aleatoria disminuye. Con un material amplio, el supuesto RR = 8 podría tener un intervalo de confianza del 95% de, digamos, 6,5-9,8, que es estadísticamente significativo y que sugiere fuertemente que el incremento de riesgo es real, Incluso si el RR fuese sólo de 3, pero el intervalo de confianza del 95% fuese de 1,8-5,0, el resultado sería igualmente estadísticamente significativo y más creíble que un RR de 8 en un estudio pequeño. Cuanto más pequeño es el estudio, mayor es la variación aleatoria de la razón de tasas.
El término «estadísticamente significativo» se ha mencionado en relación con los valores de RR que tienen un límite inferior del intervalo de confianza por encima de 1. Realmente existe una relación entre el valor de p y el límite inferior del intervalo de confianza; de hecho, se puede decir que expresan lo mismo de dos maneras distintas para un determinado nivel de significación. Una prueba de significación estadística proporciona una estimación formal de la probabilidad de que la diferencia observada entre los grupos de estudio es «verdadera» y no debida a la variación aleatoria. El objetivo es evaluar la hipótesis nula, según la cual no hay ningún efecto de la exposición sobre un resultado determinado, en contra-
196
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
posición a la hipótesis alternativa no especificada del estudio, según la cual la exposición tiene un efecto en la dirección establecida. El resultado de una prueba estadística proporciona una estimación de la frecuencia con la que se puede esperar que ocurra, por puro azar, una diferencia de la magnitud observada, en un material de estudio de dicho tamaño. Este cálculo puede hacerse mediante varias pruebas estadísticas (depende del diseño del estudio y de la distribución de la variable de resultado) y a partir de sus resultados puede obtenerse el valor de p. La prueba estadística mediante la cual se calcula debe cumplir satisfactoriamente determinadas asunciones para ser adecuada al material del estudio. Es importante escoger el parámetro estadístico correcto. Para su elección se necesita la ayuda de un estadístico experto (no basta un ordenador personal). El valor de p es un concepto estadístico familiar para muchos, pero comprendido por pocos. Pequeños valores de p van a favor de la aceptación de la hipótesis del estudio, mientras que los valores grandes apoyan la hipótesis nula, según la cual la exposición en cuestión no tiene efecto alguno. De acuerdo con la definición clásica, el valor de p expresa la probabilidad de obtener resultados que son tanto o más extremos que el observado solamente por azar. Un valor de p muy bajo indica una baja probalilidad de que los hallazgos sean debidos al azar y una elevada probabilidad de que sean debidos al verdadero efecto de la exposición. Los valores bajos de p no aportan información, mientras que los valores altos apoyan la hipótesis nula. Sin embargo, los valores de p facilitan más información que eso. Es un estadístico global que, además de la magnitud de la diferencia observada, tiene en cuenta el volumen de información en el material (es decir, el tamaño del material y la frecuencia del fenómeno de interés en dicho material). En otras palabras, el valor de p expresa la probabilidad de que el resultado obtenido esté bajo la hipótesis nula, es decir, la probabilidad de encontrar una diferencia como la que se encontraría si no existiese ninguna diferencia verdadera, para un determinado tamaño del material y una determinada frecuencia del fenómeno de interés en él. La interpretación de los valores de p se tratará más adelante en el Capítulo 9.
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
197
Los valores de p son un síntesis parcial de la evidencia a favor o en contra de la hipótesis nula en unos datos determinados.
Se considera que existe significación estadística cuando los resultados muestran un valor de p < 0,05. Por este motivo, por definición, un resultado de cada 20 es estadísticamente significativo, aunque no exista ningún efecto verdadero. Si como nivel de significación se escoge un valor de p < 0,01, entonces uno de cada 100 resultados será «significativo» por definición. Nunca se tiene la completa seguridad de que un resultado observado no sea debido al azar. Cuanto más bajo es el valor de p, más baja será esta probabilidad. Los niveles usados habitualmente para la significación estadística no tienen fundamento científico. No hay bases teóricas que indiquen que p = 0,04 es significativo y que p = 0,06 no lo es. Esta práctica no se basa ni tan solo en un consenso de un grupo de expertos formado para profundizar en el problema. Aunque pueda parecer sorprendente, los puntos de corte adaptados en primer lugar por los experimentadores, e imitados más tarde por los epidemiólogos, son puramente arbitrarios. El hecho de aceptar o rechazar las hipótesis, en base a estos puntos de corte estadísticos tan arbitrarios, no tiene una motivación científica. Una conclusión científica nunca puede ser tan mecánica y debe basarse en un profundo conocimiento del problema. Cuando se planifica un estudio, se define convencionalmente un límite por debajo del cual se rechazará la hipótesis nula. Este límite se llama alfa. Si el valor de p obtenido de los datos es igual o menor que alfa, se considera que los resultados apoyan la hipótesis alternativa y se rechaza la hipótesis nula. Generalmente se usan los límites arbitrarios de 0,05 ó 0,01 como valores de alfa, con los problemas inherentes discutidos anteriormente. Es posible calcular de manera formal el tamaño del material que se necesita para conseguir una diferencia (delta) estadísticamente significativa para cada nivel de alfa. En otras palabras, se puede calcular la probabilidad de rechazar erróneamente la hipótesis nula, es decir, de llegar a una conclusión positiva falsa cuando el verdadero
198
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
resultado es negativo. Los estadísticos llaman a este error error de tipo I. Al escoger un límite alfa bajo, el investigador reduce la posibilidad de este tipo de error, pero la diferencia (delta) o, alternativamente, el tamaño del material requerido aumentan. Existe también otro tipo de error, el de aceptar la hipótesis nula a pesar de que la hipótesis de estudio es correcta. Dicho de otro modo, se puede concluir erróneamente que la exposición en estudio no tiene efecto, aunque en realidad sí lo tiene. Esta afirmación tiene lugar si la diferencia observada en un material pequeño no alcanza la significación estadística. Este fenómeno se llama, en términos estadísticos, error de tipo II. De nuevo, el problema estriba en una interpretación demasiado mecánica de los valores de p y unos conocimientos escasos de las limitaciones de las pruebas estadísticas (ver el Capítulo 9). Como norma, los investigadores se han centrado en evitar los errores de tipo I a la hora de decidir el tamaño de la muestra. Sin embargo, los errores de tipo II no deben despreciarse, porque una conclusión falsamente negativa puede ser un error incluso más serio que una conclusión falsamente positiva. Por ejemplo, los estudios falsamente negativos sobre agentes carcinógenos pueden crear un falso sentimiento de seguridad y conducir a descuidar la adopción de las mejoras higiénicas necesarias. Por lo tanto, es importante diseñar el estudio de manera que el riesgo de errores de tipo II sea pequeño. La probabilidad de evitar errores de tipo II es la potencia del estudio para detectar diferencias verdaderas entre los grupos y, en términos estadísticos, se expresa como 1-beta. También se puede calcular el tamaño del estudio requerido para distintos niveles de beta como una función del RR, es decir, lo grande que debe ser el material en estudio para que el investigador sea capaz de detectar un determinado riesgo con una probabilidad suficientemente elevada (por ejemplo, una potencia de 0,8). Existen fórmulas para calcular tanto el alfa como el beta para diferentes valores del RR (ver, por ejemplo, las citas 6 y 34). Sin embargo, algunos autores son escépticos respecto a estos cálculos. Según Miettinen26, la primera y principal decisión en cuanto al tamaño del estudio es si el tamaño de la muestra debe ser cero o cualquier otra cifra. Expresa que si no es posible diseñar un estudio sin sesgos, la muestra de tamaño cero es la única justificable. En caso contrario, sólo se producirá confusión además de mal-
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
199
gastar el dinero. Miettinen dice también que es difícil definir con métodos estadísticos un tamaño óptimo de la muestra. De antemano, no es posible saber lo grandes que serán las diferencias halladas; además, la disponibilidad del material de estudio puede ser limitada, los fondos generalmente son escasos y en los proyectos de investigación muchas veces suceden hechos inesperados. En otras palabras, el tamaño óptimo del estudio no se puede determinar estadísticamente de antemano. De todas formas, incluso así, existen algunas consideraciones formales e informales que ayudarán al planteamiento del estudio. Puede ser prudente iniciar la evaluación del tamaño de la muestra que se necesita, primero, realizando cálculos crudos sobre la potencia necesaria para obtener una aproximación del tamaño requerido. (En esta situación, se debe ser muy consciente de si el objetivo del estudio es cualitativo o cuantitativo). Después, debe perfeccionarse dicha estimación de forma informal, mediante la intuición de un epidemiólogo experto que posea un buen conocimiento del tema en estudio. Si las perspectivas son dudosas, se debe tener el valor suficiente para abandonar el proyecto. GENERALIZACIÓN
La generalización significa la extrapolación estadística desde una muestra a una población de base más grande, o también la generalización científica de la experiencia de un estudio determinado a un nivel abstracto-general o al nivel de las teorías científicas. En investigación epidemiológica, se utilizan ambos tipos de generalización, puesto que los problemas pueden ser tanto concretos como abstractos. Un problema concreto va ligado al tiempo y al lugar, por lo que los estudios de estas situaciones son sólo descriptivos. En este caso, el material de estudio es una muestra extraída de una población de base más grande. Ejemplos de tales problemas son el nivel de exposición al plomo en distintos tipos de empresas en un área geográfica o la prevalencia de pérdida auditiva en los astilleros. Estos estudios se llevan a cabo a partir de muestras estadísticamente representativas de, por ejemplo, industrias de una ciudad que utilizan plomo o de todos los astilleros de un país. En estos casos, la
200
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
generalización se produce desde la muestra a la población. Siempre que las muestras se seleccionen correctamente, es decir, sean estadísticamente representativas, sus resultados pueden generalizarse a la población de base más grande. Ejemplo 16. Supongamos que el 5% de los trabajadores del plomo de Chicago, examinados aleatoriamente, tienen un nivel de plomo en sangre superior a 60 µg/100 ml (aproximadamente 3 µmol/1), y un 15% adicional tiene valores entre 41 y 60 µg/dl. Supongamos también que hay 14.000 trabajadores expuestos en dicha ciudad. Entonces se puede estimar que 700 trabajadores están en riesgo de intoxicación por plomo y un total de 2.800 necesitan una vigilancia regular. Sin embargo, la generalización sólo sirve para esta base de la población y sólo en las condiciones que prevalecen en el momento de la encuesta. Los resultados no pueden generalizarse a otro estado o país, o a otro período de tiempo. Su uso queda restringido a fines administrativos. Los problemas de la generalización en la investigación científica son fundamentalmente diferentes, porque en la Ciencia los resultados de un estudio se generalizan más allá de los datos recogidos en un estudio concreto, y desde la base de la población en particular a la esfera del conocimiento abstracto o de las «verdades científicas». Aquí es irrelevante si la muestra es estadísticamente representantiva; por ejemplo, de todas las fábricas o de todos los trabajadores de un país o del mundo entero. Por el contrario, la muestra debería representar a una determinada categoría de gente, por ejemplo, los trabajadores de rayón viscosa que se han expuesto al disulfuro de carbono durante al menos 5 años. El propósito de la generalización científica es determinar si la exposición al disulfuro de carbono en general causa o empeora la EC. Para este problema es totalmente irrelevante si los trabajadores son representativos de todos los hombres de Finlandia o si la fábrica es representativa de todas las fábricas del mundo. La generalización se refiere a si el disulfuro de carbono es o no cardiotóxico. Si lo es, la exposición (de una cierta intensidad y duración) a esta sustancia química es perjudicial para todos. Este es un ejemplo de la conclusión general y científica, que es el objetivo de los estudios científicos. Pero el interés científico puede ir más allá. La generalización puede perfeccionarse o especificarse
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
201
mejor para implicar a los modificadores del efecto (por ejemplo, para definir factores que aumenten o disminuyan los efectos cardiotóxicos del disulfuro de carbono). En otras palabras, el incremento de riesgo, ¿se produce sólo después de cierta edad, sólo en los fumadores, sólo en aquellos con altos niveles de lípidos en sangre, persiste después del cese de la exposición, y así sucesivamente? Estas especificaciones permiten profundizar en el conocimiento del mecanismo de la acción cardiotóxica. La generalización científica va de los resultados de un estudio particular al nivel del conocimiento abstracto-general.
La inferencia científica reside en el juicio crítico del investigador, así como en el del lector del informe del estudio. Es crucial ser capaz de valorar los nuevos resultados desde una perspectiva que permita tomar en consideración el conocimiento existente (ver el Capítulo 9). La generalización de los resultados de un estudio determinado requiere que el estudio sea válido. La generalización de resultados sesgados sólo conduce a conclusiones erróneas y a confusión. Además, no es prudente sacar conclusiones que vayan demasiado lejos a partir de estudios epidemiológicos aislados porque los errores aleatorios, los sesgos no detectados o la falta de sensibilidad pueden conducir a conclusiones falsas. Sólo un limitado número de estudios epidemiológicos aislados han sido capaces de cambiar los conocimientos científicos fundamentales que prevalecen. La Ciencia generalmente avanza a pasos pequeños y los conocimientos se deben acumular a partir de fuentes muy diferentes para poder crear nuevas teorías. BIBLIOGRAFÍA 1. Ahlman, K., A.-L. Backman, y I.Hannunkari, et al. «Kivityóntekijóiden tyóolosuhteet ja terveydentila». En Kansanelakelaitoksen julkaisuja AL n.° 4. (Helsinki: Kansaneläkelaitos, 1975). 2. Ahlman, K., A.-L. Backman, R.-S. Koskela y K. Luoma. «Satamatyöntekijöiden työolot ja terveydentila» en Työterveyslaitoksen tutkimuksia n.°105 (Helsinki: Työterveyslaitos, 1975).
202
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
3. Asp, S. «Confounding by variable smoking habits in different ocupationalgroups». Scand. J. Work Environ. Health 10:325 (1984). 4. Axelson, O. «Aspects on confounding in ocupational health epidemiology ». Scand. J. Work Environ. Health 4:98 (1978) 5. Campbell, D. «Factors relevant to the validity of experiments in the social setting». Psychol. Bull. 54:297 (1957). 6. Feinstein, A. R. «Clinical biostatistics: XXXIV. The other side of "statistical significance": alfa, beta, delta and the calculation of sample size». CU. Pharmacol. Ther. 18:491 (1975). 7. Fox, A. J., y P. F. Collier. «Low mortality rates in industrial cohort studies due to selection for work and survival in the industry». Br. J. Prev. Soc. Med. 30:225 (1976). 8. Greenland, S. «Modeling and variable selection in epidemiologic analysis. J. Public Health 79:340 (1989). 9. Hansson, T. Lándryggsbevár och arbete. (Stockolm: Arbetsmiljófondens Rapporter, 1989). 10. Hernberg, S., T. Kauppinen, R. Riala, M. L. Korkala y U. Asikainen. «Increased risk for primary liver cáncer among women exposed to solvents». Scand. J. Work Environ. Health 14:356 (1988). 11. Hernberg, S., M. L. Korkala, U. Asikainen y R. Riala «Primary liver cancers and exposure to solvents». Int. Arch. Occup. Environ. Health 54:147(1984). 12. Hernberg, S., T. Partanen, C. H. Nordman y P. Suman «Coronary heart disease among workers exposed to carbón disulphide».¿?r /. Ind. Med. 27:313(1970). 13. Hernberg, S., P. Westerholm, K. Schultz-Larsen et al. «Nasal and sinonasal cáncer: connection with occupational exposure in Denmark, Finland and Sweden». Scand. J. Work Environ. Health 9:315 (1983). 14. Industrial Disease Standard Panel «Report to the worker's compensation board on the healthy worker effect», Industrial Diseases Standard Panel, Toronto, Ontario, 1988, (IDSP Rep. n.° 3). 15. Kitagawa, E. M. and P. M. Hauser. Differential Mortality in the United States. (Cambridge,M.A: Harvard University Press, 1973). 16. Koskela, R. S., S. Hernberg, R. Kärävä, E. Järvinen y M. Nurminen. «A mortality study of foundry workers». Scand. J. Work Environ. Health 2 (Suppl.l):73(1976). 17. Koskela, R.-S., K. Luoma y S. Hernberg. «Turnover and health selection among foundry workers». Scand. J. Work Environ. Health 2 (Suppl.l):90 (1976). 18. Kurppa, K., P. C. Holmberg, S. Hernberg, K. Rantala, R. Riala y T. Nurminen. «Screening for occupational exposures and congenital malformations: preliminary results from a case-.referent study». Scand. J. Work Environ. Health 9:89 (1983).
VALIDEZ INTERNA, PRECISIÓN Y GENERALIZACIÓN
203
19. Lloyd, J. W., F. E. Lundin, C. K. Redmond y P. B. Geiser «Long-term mortality study of steel workers: IV. Mortality by work area». J. Occup. Med. 12:151 (1970). 20. Mantel, N. y W. Haenszel. «Statistical aspects of the analysis of data from retrospective studies of disease». J. Natl. Cancer Inst. 22:719 (1959). 21. McMichael, A. J. «Standardized mortality ratios and the healthy worker effect: scratching beneath the surface».J. Occup. Med. 18:165 (1976). 22. McMichael, A. J. «Assigning handicaps in the mortality stakes: an evaluation of the «Healthy worker effect». Report to the Workers' Compensation Board on the Healthy Worker Effect, Industrial Disease Standards Panel, Toronto, Ontario, 1988 p. 58 (IDSP Rep. n.° 3). 23. McMichael, A. J., R. Spirtas y L. L. Kupper. «An epidemiologic study of mortality within a cohort of rubber workers 1964-72». J. Occup. Med. 16:458(1974). 24. Meinhardt, T. J., R. J. Young y R. W. Hartle. «Epidemiologic investigations of styrene-butadiene rubber production and reinforced plástic production». Sean. J. Work Environ. Health 4 (Suppl.2);240 (1978). 25. Miettinen, O. S. «Matching and design efficieney in retrospective studies». Am. J. Epidemiol. 91:111 (1970). 26. Miettinen, O. S. Theoretical Epidemiology. Principies of Ocurrence Research in Medicine. (New York: John Wiley & Sons, 1985). 27. Miettinen, O. S. «The healthy worker effect». Report to the Worker's Compensation Board on the Healthy Worker Effect. Industrial Diseases Standards Panel, Toronto, Ontario, 1988, p. 72 (IDSP Rep. n.° 3). 28. Monson, R. R. «Healthy worker effect». Report to the workers compensation Board on the Healthy Worker Effect. Industrial Disease Standards Panel Toronto, Ontario, 1988 p. 77 (IDSP Rep. N.° 3). 29. Newhouse, M. L. «A study of the mortality of workers in an asbestos factory». Br. J. Ind. Med. 26:294 (1969). 30. Ott, M. G. «Determinants of mortality in an industrial population». J. Occup. Med. 18:171 (1976). 31. Pershagen, G. y O. Axelson. «A validation of questionnaire information on oceupational exposure and smoking». Scand. J. Work Environ. Health 8:24(1982). 32. Rothman, K. J. Modern Epidemiology (Boston MA: Little Brown, 1986). Existe versión en castellano: Epidemiología moderna (Madrid: Ed. Díaz de Santos, 1987). 33. Sauli, H. Oceupational mortality in 1971-75. (Helsinki: Central Statistical Office ofFinland, 1979). 34. Schlesselman, J. J. Case-Control Studies: Design, Conduct, Analysis (Monographs in Epidemiology and Biostatistics) (New York: Oxford University Press, 1982). 35. Wang, J. D., y O. S. Miettinen. «Oceupational mortality studies: principies of validity». Scand. J. Work Environ. Health 8:153 (1982).
6 Problemas específicos en el estudio de algunas patologías relacionadas con el trabajo* INTRODUCCIÓN Cuando una relación causal entre una exposición ocupacional y una enfermedad específica es clara, la enfermedad se define como ocupacional, tanto médica como por lo general legalmente. Sin embargo, el trabajo y las condiciones de trabajo pueden, además, contribuir al desarrollo de morbilidad no específica, ya sea causando o agravando procesos, o indirectamente a través del estilo de vida asociado a la ocupación del trabajador. Conceptualmente, las enfermedades relacionadas con el trabajo comprenden una amplia gama de morbilidad, relacionada de un modo u otro —no necesariamente causal— con la ocupación, el trabajo o las condiciones de trabajo. Las enfermedades ocupacionales clásicas constituyen un extremo del continuo, mientras que los trastornos cuya conexión con la ocupación es muy leve o incierta, se sitúan en el otro extremo. Muchas de las enfermedades incluidas en este continuo pueden estar relacionadas con el trabajo sólo bajo ciertas condiciones y su etiología es siempre multicausal. De acuerdo con la definición de la Organización Mundial de la Salud (OMS)50, las enfermedades relacionadas con el trabajo son procesos multifactoriales en los que la ocupación, el trabajo o las condiciones de trabajo pueden ser uno de los muchos factores etiológicos. Las enfermedades ocupacionales clásicas se excluyen de este * Este capítulo está basado en parte en los documentos de trabajo presentados por el autor en la X.a Reunión de Comité Conjunto OIT/OMS sobre «Epidemiología de las enfermedades y lesiones relacionadas con el trabajo». 205
206
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
concepto, según la definición de la OMS. Sin embargo, existen otras definiciones, como la del National Institute for Occupational Safety and Health (NIOSH), que incluyen las enfermedades ocupacionales. Los factores ocupacionales también pueden agravar, acelerar o exacerbar enfermedades con orígenes no ocupacionales. En este caso, el trabajo está relacionado con estas condiciones, aunque no de forma etiológica. Finalmente, el trabajo puede tener efectos rehabilitadores beneficiosos en ciertas condiciones patológicas, siempre que los trabajadores afectados estén correctamente asignados a sus puestos de trabajo de acuerdo con sus capacidades y limitaciones10. Ya que es posible mejorar las condiciones de trabajo, las patologías relacionadas con el trabajo son, al menos en principio, prevenibles. Sin embargo, antes de poder conseguir una prevención efectiva, el problema debe identificarse y cuantificarse. La investigación epidemiológica tiene un importante papel en este proceso. Las condiciones de trabajo varían de una situación a otra; por lo tanto, la fuerza del factor etiológico ocupacional también varía. Esta variación puede conducir a encontrar resultados aparentemente discrepantes en diferentes estudios. En otras palabras, en estudios sobre la misma enfermedad, en ocasiones puede identificarse una etiología ocupacional, pero no siempre. Ocurre lo mismo cuando el grado de relación con el trabajo es distinto en diferentes situaciones. Por ello, es importante para una prevención eficiente de patologías relacionadas con el trabajo (especialmente coste-eficiente), no sólo identificar, sino también cuantificar la fracción etiológica relacionada con el trabajo. Este capítulo trata de los problemas inherentes a la investigación epidemiológica dirigidos a identificar y cuantificar la etiología relacionada con el trabajo de cinco categorías de grandes enfermedades: cáncer, enfermedades respiratorias crónicas no específicas, trastornos musculoesqueléticos, enfermedad coronaria y respuestas conductuales y síntomas psicosomáticos. En principio, el estudio epidemiológico de las enfermedades relacionadas con el trabajo no difiere, en general, de la investigación epidemiológica. Por ello, padece las dificultades inherentes a toda investigación no experimental, por ejemplo, en el aporte de evidencias a favor o en contra de la causalidad de una asociación obser-
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
207
vada entre dos fenómenos. Lo que es típico, sin embargo, es que la fracción etiológica ocupacional (ver el Capítulo 4) de una enfermedad relacionada con el trabajo (no considerada como una enfermedad ocupacional clásica) es comparativamente pequeña. En otras palabras, muchas causas no ocupacionales también contribuyen a la etiología de la enfermedad en cuestión y su participación, considerada en conjunto, es más grande que la del factor ocupacional. Esta situación crea problemas tanto para el diseño de los estudios epidemiológicos como para la interpretación de sus resultados. La demostración de un ligero incremento en la ocurrencia de una patología frecuente entre personas expuestas a un factor relacionado con el trabajo requiere un estudio amplio y un agudo diseño. Este último requisito significa que los errores aleatorios, tales como los errores de muestreo, los errores de clasificación no diferencial y otros errores de medida, deben mantenerse en un mínimo. Cuanto mejor sea el diseño, más pequeños serán los efectos relacionados con el trabajo que podrán demostrarse. Sin embargo, en general, las fracciones etiológicas relacionadas con el trabajo, de alrededor de un 20% o menores entre los expuestos, son muy difíciles o casi imposibles de detectar mediante métodos epidemiológicos. Para la interpretación y la síntesis de los resultados de distintos estudios deben tenerse en cuenta las variaciones en la validez como en la sensibilidad de los estudios individuales y el hecho de que las variaciones en la intensidad de la exposición entre los estudios pueden conllevar resultados aparentemente inconsistentes. Mientras la comunidad científica en general está alerta en la búsqueda de sesgos, especialmente los que crean un efecto falso positivo, se ha prestado poca atención a la identificación de la «falsa negatividad», debida generalmente a un tamaño de la muestra pequeño, a una falta de sensibilidad del diseño, a errores aleatorios, a un error de clasificación no diferencial de la exposición o a combinaciones de estas circunstancias (ver el Capítulo 9). Una variación interestudio respecto a la intensidad y a la duración de la exposición puede crear una aparente inconsistencia en los resultados, especialmente si los datos de exposición son débiles. El lector debería darse cuenta de que los datos de exposición de poca calidad pueden enmascarar incluso efectos verdaderos fuertes. Ni siquiera diez estudios «negativos» («negativos» por la mala calidad de los datos de exposición)
208
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
«contradicen» un hallazgo positivo si este último se basa en datos válidos. La falta o la insuficiencia de datos de exposición, o incluso peor, las asunciones erróneas derivadas de datos débiles y utilizados como hechos en artículos científicos, han creado confusión y un conflicto aparente cuando la cuestión ha sido identificar y cuantificar factores etiológicos ocupacionales. Además, la génesis de las enfermedades multifactoriales puede ser realmente complicada y, a veces, la falta de conocimientos sobre las interacciones entre diferentes «causas contributorias» y de cómo están compuestas las «causas suficientes», pueden hacer difícil de explicar por qué se puede demostrar un factor ocupacional en algunos casos pero no en otros. Por ejemplo, varios estudios europeos han demostrado que la exposición al disulfuro de carbono se asocia a una tasa elevada de enfermedad coronaria, pero éste no parece ser el caso de Japón42,43. Pueden explicar esta enigmática diferencia efectos modificadores de otros factores de riesgo coronarios, cuya ocurrencia es distinta en Europa y Japón (por ejemplo, la dieta). Mientras el aspecto cualitativo de la relación de una enfermedad con el trabajo tiene un sentido abstracto-general (científico), el aspecto cuantitativo es concreto (asociado a un tiempo y lugar). En otras palabras, si uno, por ejemplo, acepta los estudios que demuestran que la exposición al disulfuro de carbono contribuye a causar enfermedad coronaria, entonces esto es un hecho biomédico aplicable en general. Por el contrario, la fuerza de este factor etiológico varía dependiendo del tiempo y del lugar. Es más grande cuando los niveles de exposición son elevados, y quizás está modificado por otros factores de riesgo, que varían entre diferentes poblaciones, tales como la ingesta de grasas en la dieta y el tabaco (ver el Capítulo 1). CÁNCER Exposiciones ocupacionales Hace mucho tiempo se reconoció que algunos cánceres estaban asociados con exposiciones ocupacionales. La primera observación la hizo Sir Percival Pott, quien en 1775 observó una elevada ocu-
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
209
rrencia de cáncer de escroto entre los deshollinadores. En 1895 Rehn informó sobre 3 casos de cáncer de vejiga urinaria entre 45 trabajadores en una fábrica de tintes de anilinas. En un principio se creyó erróneamente que la causa era la anilina, pero estudios posteriores en otros países demostraron que los agentes causantes eran la naftilamina y la benzidina. Desde entonces, muchas exposiciones ocupacionales han sido identificadas como carcinógenos seguros o probables. Actualmente, los estudios epidemiológicos sobre cáncer ocupacional son frecuentes y aportan una evidencia creciente de los efectos carcinogénicos de las exposiciones ocupacionales. Desde 1969, la Agencia Internacional de Investigación sobre el Cáncer (IARC) ha llevado a cabo un programa para evaluar el riesgo carcinogénico de los agentes químicos en humanos. Este programa ha dado lugar a la publicación de monografías de evaluación de un gran número de sustancias químicas individuales o de grupos de sustancias químicas. A mediados del año 1990, se habían publicado 48 volúmenes monográficos. En 1987 un grupo de expertos actualizó los volúmenes del 1 al 42 y, como resultado, la IARC publicó el llamado Suplemento 7, que contenía todas las evaluaciones sobre la carcinogenicidad humana de más de 700 agentes químicos, grupos de agentes químicos, procesos industriales, exposiciones ocupacionales y hábitos culturales15. Los agentes químicos o, alternativamente, las condiciones de exposición se clasificaron en: • Grupo 1:
Carcinógenos para el hombre
• Grupo 2A: Probablemente carcinógenos para el hombre • Grupo 2B: Posiblemente carcinógenos para el hombre • Grupo 3:
No clasificables en cuanto a su carcinogenicidad para el hombre
• Grupo 4:
Probablemente no carcinógenos para el hombre.
Para que un agente químico se clasifique en el grupo 1, se requiere una «evidencia suficiente» de carcinogenicidad en el hombre. El suplemento de la IARC15 la define de la siguiente forma: «Se
210
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Tabla 6.1. Carcinógenos ocupacionales para los que existe evidencia suficiente.
ha establecido una relación causal entre la exposición al agente y el cáncer humano. Es decir, se ha observado una relación positiva entre la exposición al agente y el cáncer en estudios en los que el azar, los sesgos y los factores de confusión pueden ser excluidos con una seguridad razonable» (pág. 30). Para los agentes clasificados en el grupo 2A, el requisito es una evidencia «limitada» para el hombre y «suficiente» para los animales de experimentación (ver la cita 15). En 1987 sólo 17 agentes o compuestos usados en el ámbito ocupacional se pudieron clasificar en el grupo 1. Se muestran en la Tabla 6.1. Además, 11 procesos industriales fueron considerados causalmente asociados con el cáncer en el hombre (Tabla 6.2). Considerando el gran número de agentes en los que hay evidencia animal de carcinogenicidad, es sorprendente, a simple vista, que la lista de carcinógenos humanos sea tan corta. Sin embargo, los problemas inherentes en los estudios epidemiológicos sobre cáncer
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
211
Tabla 6.2. Procesos industriales asociados causalmente con el cáncer en el hombre.
ocupacional, tales como patrones de exposición mixtos, poblaciones expuestas pequeñas, falta de datos de exposición disponibles y bajos niveles de exposición, pueden explicar el porqué en tan pocos agentes se ha probado que sean carcinógenos humanos. Además, muchas sustancias químicas que son carcinógenos animales sólo se usan bajo condiciones de laboratorio o quizás en pocas pequeñas empresas, por lo que los estudios epidemiológicos son imposibles. Otro importante y demasiado frecuente (pero remediable) motivo de la falta de datos concluyentes es que los estudios realizados durante mucho tiempo han sido de baja calidad. Los estudios que contienen sesgos incrementan la confusión prevalente y no aportan nada al conocimiento ya existente. Se puede decir lo mismo de los estudios de baja sensibilidad que conducen a conclusiones falsamente negativas. Otro problema es que muchos investigadores tienden a apoyar los carcinógenos «de moda». En lugar de repetir de nuevo costosos estudios de cohortes, como por ejemplo, sobre asbesto, níquel, polvo de madera dura y otros carcinógenos establecidos, deberían escoger agentes ampliamente utilizados para los que no existe una eviden-
212
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Tabla 6.3. Carcinógenos humanos probables (2A) y posibles (2B) que requieren más estudios epidemiológicos. Agente (2A)
Agente (2B)
Acrilonitrilo Berilio y compuestos Creosotas Epiclorhidrina Oxido de etileno Formaldehído Silicio
Bitúmenes Tetracloruro de carbono Clorofenoles Herbicidas clorofenoxi Hexaclorobenceno Hidracina Estireno Tetracloroetileno
cia concluyente. En la Tabla 6.3 se presenta una propuesta de prioridades de investigación, compilada a partir de las categorías 2A y 2B de la IARC. El grupo 3 de la IARC incluye también diversos agentes a los que podría y debería prestarse más atención epidemiológica: carbón negro, clordane, plomo y tricloroetileno. A pesar de que la Epidemiología del Cáncer trata, en primer lugar y primordialmente, de identificar y cuantificar los riesgos carcinogénicos y no de explicar sus mecanismos, es útil recordar que la carcinogénesis es un proceso multietápico. Es corriente hablar de «iniciadores», que ponen en marcha el proceso carcinogénico provocando principalmente daño en el ADN, y de «promotores», que aportan el estímulo final para el proceso neoplásico. Sin embargo, mientras algunos agentes actúan en distintas etapas de este proceso multietápico, la mayoría de los carcinógenos identificados son «completos», es decir, tienen actividades tanto iniciadoras como promotoras45. Su acción en distintas etapas ayuda a explicar los efectos sinérgicos observados en ocasiones entre dos carcinógenos, por ejemplo, entre la exposición al asbesto y el tabaco. En el estudio epidemiológico del cáncer ocupacional, el proceso multietápico requiere un análisis profundo de las relaciones temporales entre la exposición y la enfermedad. Si se permite una simplificación, podríamos decir que los iniciadores tienen un período de latencia largo, mientras que los promotores lo tienen corto. Sin embargo, los carcinógenos completos pueden actuar como iniciadores a bajas
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
213
dosis y como promotores a dosis elevadas, por lo que el problema puede ser más complicado. Además, como los hombres se hallan generalmente expuestos a múltiples agentes, ciertos patrones complicados de interacción pueden confundir la relación temporal, especialmente porque no hay suficientes datos detallados sobre la exposición. Las «exposiciones cóctel», especialmente cuando conciernen a muchos agentes químicos en comparativamente bajas intensidades de exposición, resultan cada vez más frecuentes en el mundo «quimicalizado» de hoy en día y sus efectos pueden eludir cualquier evaluación epidemiológica. Niveles de la Epidemiología del Cáncer
La relación del cáncer con el trabajo puede estudiarse epidemiológicamente mediante varios enfoques diferentes. El nivel más crudo es relacionar los datos de morbilidad de un registro de cáncer con las categorías ocupacionales. Por las razones discutidas en el Capítulo 3, éste no es un método eficiente. Se puede obtener información mejor si los datos del registro de cáncer se relacionan con las ocupaciones registradas en censos anteriores, por ejemplo, 10 ó 20 años antes. Los datos sobre el cáncer también pueden relacionarse con otros registros que contengan datos de exposición directos o indirectos, tales como los registros de enfermedades ocupacionales o los registros de empleo. Pero este tipo de información es, como mucho, sugestiva, y los errores de clasificación de la exposición tienden a enmascarar los verdaderos riesgos. Recientemente la epidemiología de enlace de registros ha mejorado en Suecia. Allí un registro, el «Miljödataregistret», ha suplementado los epígrafes ocupacionales con el nombre del lugar de trabajo y el domicilio de la persona. Relacionar los datos ocupacionales del censo de 1960 con los datos de la incidencia de cáncer de los años 80, por ejemplo, puede producir información más precisa sobre la relación de varias formas de cáncer con el trabajo que las prácticas de enlace convencionales. Ejemplo 1. Un estudio publicado recientemente28 puede considerarse como un intento de probar la sensibilidad de este enfoque. El mesotelioma, que tiene una conocida relación con ciertas ocupaciones expuestas al asbesto, fue el elemento escogido
214
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
como el «cáncer de prueba». El objetivo era determinar lo bien que este tipo de enlace podía detectar las ocupaciones previamente conocidas como causantes de mesotelioma. Los resultados eran prometedores. Aunque los códigos ocupacionales de un dígito (muy amplios) no aportaron información útil, los códigos de dos dígitos proporcionaron resultados sugestivos y los de tres dígitos reconocieron la mayoría de ocupaciones conocidas por su exposición al asbesto. Las ramas típicas de la industria (construcción de barcos, construcción de motores de ferrocarriles, aislamientos) mostraron todas razones de tasas de 3 a 7. Sin embargo, otras categorías ocupacionales menos conocidas mostraron un incremento de riesgo de mesotelioma, como por ejemplo, los trabajadores de plantaciones de azúcar (RIE, razón de incidencia estandarizada, 6,3) y los trabajadores de pasta y de papel (RIE 4,7). Si estos últimos resultados se pueden confirmar en estudios más específicos, indican un uso inicial, quizás no reconocido, del asbesto en estas industrias, por ejemplo, en el aislamiento de las marmitas de azúcar o en la presencia de asbesto en forma de impurezas en el talco usado para la producción de papel.
Este ejemplo ilustra que al menos se puede obtener una evidencia sugestiva del elevado riesgo de cáncer a partir de buenos registros siempre que los datos de registros ocupacionales convencionales se hagan más específicos. Sin embargo, es dudoso que riesgos medios y bajos puedan detectarse con esta metodología. Lo mismo puede decirse cuando sólo una pequeña parte de los que forman una categoría ocupacional están expuestos a carcinógenos, aunque su exposición sea de gran intensidad. El cáncer relacionado con el trabajo también puede investigarse mediante estudios de mortalidad proporcional, los cuales pueden aportar las primeras señales del incremento de riesgo de cáncer. Las debilidades de los estudios de la RMP se han discutido en el Capítulo 4. El enfoque de cohortes es quizás el diseño más tradicional para estudiar el cáncer ocupacional. Su ventaja es la posibilidad de incluir varios cánceres al mismo tiempo y su desventaja es la gran cantidad de trabajo que implica. Desafortunadamente, la mayoría de estudios de cohortes sobre cáncer ocupacional han utilizado la población general como categoría de referencia. Esta práctica ha creado gran confusión debido al efecto del trabajador sano y a otros tipos de sesgos de comparación (ver los capítulos 5 y 9). Durante la
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
215
última década ha surgido el análisis de casos y controles dentro de una base de cohortes, que ha proporcionado un complemento útil al clásico diseño de cohortes. Siempre que los contrastes entre exposiciones sean lo suficientemente grandes y que retrospectivamente puedan encontrarse suficientes y detallados datos de exposición, este enfoque supera la mayoría de los problemas de validez surgidos con el uso de la población general como categoría de referencia. Un diseño de casos y controles que utilice casos y controles de una base de población dinámica a menudo es una buena alternativa al uso de una base de cohortes. Ya que una base de población dinámica es generalmente muy grande, pues a veces incluye la experiencia de población-tiempo de todo un país, también pueden estudiarse formas raras de cáncer. Los registros nacionales o regionales de cáncer son los más utilizados para este enfoque; los registros de hospitales o parroquiales también sirven como posibles fuentes de casos y controles. Los problemas surgen cuando la exposición de interés es rara o está mal definida. Debe tenerse en consideración también el sesgo de recuerdo (ver el Capítulo 5). Para solucionar este último problema, al menos en parte, los pacientes con alguna otra forma de cáncer, no relacionada con la(s) exposiciones) en estudio, se usan a menudo como controles. Los controles con cáncer pueden también obtenerse en forma de muestra a partir de un registro de cáncer. Problemas en el diseño del estudio
El largo período de latencia entre el inicio de una exposición y la manifestación de la enfermedad es, quizás, el factor aislado que causa un problema más grave para el estudio epidemiológico de las causas de cáncer relacionadas con el trabajo. A veces el tiempo de latencia medio es de hasta 30 ó 40 años, como por ejemplo, en el caso del mesotelioma inducido por el asbesto. Otros tipos de cáncer pueden tener períodos de latencia más cortos pero, incluso así, existe un intervalo de muchos años, incluso de décadas, entre el inicio y la manifestación. Se cree que los iniciadores que causan daño genético a nivel del ADN generalmente tienen períodos de latencia largos, mientras que los promotores que ejercen su acción en las etapas finales de la carcinogénesis tienen latencias cortas. Los car-
216
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
cinógenos completos ejercen su acción en diversas etapas, complicando el estudio de las relaciones temporales. Por ejemplo, el humo de los cigarrillos es tanto un iniciador como un promotor y este hecho es bastante plausible considerando la compleja composición del humo del tabaco. Además, tanto la duración del período de latencia como la magnitud del exceso de riesgo pueden variar dependiendo, entre otras cosas, de la edad de la persona cuando se inició la exposición, la duración y la fuerza de la exposición y otras exposiciones químicas concomitantes. La heterogeneidad causada por éstos y otros factores tiende a disminuir la sensibilidad de los estudios epidemiológicos sobre el cáncer. El largo período de latencia observado para muchos carcinógenos tiene la consecuencia práctica de que los estudios epidemiológicos sobre el cáncer deben ser por lo general retrospectivos. La peor desventaja de los enfoques retrospectivos es la pérdida de calidad de los datos de exposición y de otra información importante. Los estudios cuantitativos (dosis-respuesta) resultan especialmente difíciles o imposibles de realizar cuando los datos de exposición son pobres. El período de latencia largo significa también que los métodos epidemiológicos no sirven para la detección de nuevos carcinógenos, porque las sustancias químicas introducidas recientemente se dispersarían en el medio ambiente ocupacional o incluso general durante varias décadas antes de ser clasificadas como carcinógenos. Por lo tanto, el requisito de evidencia epidemiológica como prueba «final» de la carcinogenicidad de algunas sustancias químicas presenta serias desventajas. Deben adoptarse acciones reguladoras y preventivas en base a la evidencia experimental, incluso antes de que se disponga de la prueba «final». En consecuencia, desde el punto de vista de la regulación, muchos países consideran a los agentes químicos listados en las categorías 2A, e incluso algunos de los del 2B de la IARC como carcinógenos demostrados. Sin embargo, aunque la clasificación de los nuevos agentes químicos debe basarse en métodos experimentales, los estudios epidemiológicos valoran los agentes químicos de uso habitual considerados como probables o posibles carcinógenos humanos; también, por supuesto, es muy recomendable estudiar los agentes químicos habituales no clasificados, siempre que ello sea factible.
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
217
Los métodos epidemiológicos no son sensibles y son lentos. La detección inicial de las propiedades carcinógenas de un agente químico debe, en consecuencia, basarse en métodos experimentales.
La rotación de los trabajadores es otro problema parcialmente conectado con el largo intervalo de tiempo entre la primera exposición y la manifestación del cáncer. Una elevada rotación complica el seguimiento de aquellos que han cambiado de empleo o que se han jubilado. Este problema es más grave en los países con registros de población deficientes o cuando la legislación sobre confidencialidad restringe el uso de tales registros. Dinamarca, Noruega, Finlandia y Suecia tienen excelentes registros de población, en los que por lo general se puede seguir entre el 97 y el 99% de los miembros de la cohorte original, e incluso a veces a todos ellos, aunque es una tarea laboriosa. En muchos otros países, donde el seguimiento debe llevarse a cabo mediante entrevistas a los familiares cercanos o a compañeros de trabajo, o a través de la utilización de las guías telefónicas, registros de tarjetas de crédito y similares, lo máximo que puede alcanzarse es un 90%. Cuanto menor sea el éxito, más grande será la probabilidad de sesgo, porque los individuos que no pueden seguirse probablemente difieren de los que sí pueden seguirse. De todas formas, deberían emplearse todos los esfuerzos para hacer un seguimiento lo más completo posible. El requisito de unos cuantos años de exposición mínima como criterio de elegibilidad reduce el esfuerzo del seguimiento, porque la rotación de los trabajadores es siempre mucho más elevada durante el primer año de empleo que más adelante. Una rotación elevada conlleva períodos de exposición cortos para una gran proporción de la cohorte. Además, incrementa los costes del seguimiento de las bajas.
La rotación también tiene como resultado que una gran proporción de la cohorte original acumule períodos de exposición cor-
218
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
tos. En investigación cualitativa, la información más valorable proviene del estudio de individuos con largos períodos de exposición a elevadas intensidades. Incluso una cohorte aparentemente grande puede contener pocos individuos que cumplan este criterio si la rotación es elevada. Esta es otra circunstancia que disminuye la sensibilidad de los estudios epidemiológicos sobre el cáncer. Sin embargo, en investigación cuantitativa, la heterogeneidad de la exposición es útil, pero entonces el número de personas-año de cada subcategoría de exposición debe ser lo suficientemente grande. Sin embargo, cuando el problema es cualitativo y el investigador sucumbe a la tentación de incluir en la cohorte a trabajadores con exposiciones cortas y leves para incrementar su tamaño, se produce una «dilución» del efecto. En muchos lugares de trabajo, algunos trabajadores llamados «expuestos», realmente no están expuestos. Cuando se analiza la cohorte como un grupo homogéneo, la inclusión de trabajadores «expuestos» mal clasificados diluye fuertemente el efecto. La situación es diferente, sin embargo, si los datos se analizan mediante un enfoque de casos y controles. En este caso las diferencias de exposición se convierten en un recurso y es incluso ventajoso incluir individuos no expuestos en la base del estudio. Por supuesto, un enfoque de casos y controles no puede solucionar todos los problemas derivados de disponer de muy pocos individuos fuertemente expuestos (por ejemplo, se traduce en pocos casos «expuestos»). Sin embargo, ya que este enfoque implica mucho menos trabajo que con un enfoque de censo, el hecho de incrementar el tamaño de la base del estudio, mediante por ejemplo la incorporación de más compañías similares, puede ser una alternativa válida. Por supuesto, la cuestión clave es, al igual que en todos los estudios sobre cáncer, garantizar datos de exposición precisos y detallados. Para tal objetivo se necesita la ayuda de un higienista experto. Incluso así, los datos de exposición retrospectivos pueden resultar poco fiables y es probable que se produzcan clasificaciones erróneas. Las exposiciones ocupacionales concurrentes o consecutivas a varias sustancias químicas, junto con las exposiciones no ocupacionales, complican también el diseño del estudio y la interpretación de los resultados. La mayoría de trabajadores presentan estos patrones de exposición y, ya que el período de tiempo de interés es largo, las oportunidades para clasificar los patrones de exposición complejos
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
219
no son buenas. De nuevo, un diseño de casos y controles tiene un potencial mayor que un estudio basado en el censo, porque se pueden dedicar mayores esfuerzos a aclarar la exposición de la muestra cuando ésta no implica a toda la base poblacional. Los patrones de exposición mixtos son un problema frecuente en la epidemiología del cáncer.
Es difícil o imposible solucionar los problemas tratados hasta ahora, porque son inherentes a la naturaleza del problema. Por ejemplo, el largo período de latencia es una característica del cáncer ocupacional y por esa razón no puede evitarse. Por ello, puede que se tenga que abandonar un estudio, al no haber posibilidad alguna de solucionar cuestiones tales como la ausencia de datos de exposición o una rotación elevada. Por otro lado, a veces es realmente posible encontrar poblaciones en las que los efectos de estos problemas sean menores, como por ejemplo, los trabajadores empleados en grandes compañías con poca rotación, con buenos historiales de exposiciones anteriores y con pocas exposiciones simultáneas. Oportunidades como éstas no deberían despreciarse. Otros tipos de problemas son más específicos del tiempo y del lugar, y en determinadas circunstancias pueden crear dificultades insuperables, mientras en otras su efecto puede solucionarse. Los problemas que se derivan de datos de exposición pobres o inexistentes ya han sido mencionados. Aunque los problemas para garantizar los datos de exposiciones pasadas ocurren en casi todos los estudios sobre el cáncer, existen de hecho lugares de trabajo con historiales satisfactorios; incluso a veces es posible disponer de mediciones higiénicas. Tales oportunidades deberían aprovecharse, ya que un buen estudio puede aportar datos más concluyentes que la combinación de muchos estudios flojos. Además, los datos sobre posibles factores de confusión (por ejemplo, el tabaquismo) pueden o no estar disponibles. Si el investigador tiene varias opciones como material del estudio, debería preferir aquéllos con datos disponibles sobre la exposición y los potenciales factores de confusión. Si los datos son pobres, lo mejor puede ser abandonar el estudio. Una mala clasificación también puede surgir a partir de unos
220
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
diagnósticos erróneos de cáncer. En los países que tienen buenos registros de cáncer, el problema generalmente estriba en diferenciar entre cáncer primario y metastásico o entre diferentes subtipos histológicos. Los cánceres de los ancianos, en particular, pueden clasificarse erróneamente porque las autopsias no se realizan con la misma frecuencia que en personas más jóvenes. En los países con registros del cáncer menos precisos, el error, lógicamente, puede ser peor. Ejemplo 2. En un estudio finlandés de casos y controles sobre cáncer hepático primario, en el registro de cáncer se encontraron 182 casos durante un período de 2 años. De ellos, 16 no pudieron ser confirmados como tales por el patólogo del equipo. Se realizaron otros 28 diagnósticos basados solamente en datos clínicos. Las fuentes más comunes de clasificación errónea fueron los tumores metastásicos y el crecimiento tumoral invasivo a partir de órganos vecinos. Sin embargo, la serie de casos en este estudio estaba formada por casos incidentes, que aún no habían sido revisados por el patólogo del registro. Un estudio desarrollado más adelante con casos anteriores (que habían sido ya revisados por el registro) mostró menos errores de clasificación, pero la proporción de diagnósticos anatomopatológicos no verificados fue similar. En los estudios de casos y controles, los diagnósticos mal clasificados diluyen también los verdaderos efectos. Siempre que la exposición de interés tenga realmente un efecto carcinógeno, está claro que el incluir erróneamente otros cánceres sin relación alguna con la exposición disminuirá la odds ratio. Por este motivo, en un estudio de casos y controles siempre se debe asegurar que el diagnóstico del caso es correcto. Sin embargo, como ya se ha señalado en el Capítulo 5, si un estudio de cohortes utiliza a la población general como control, el diagnóstico de la cohorte expuesta no debería corregirse porque la categoría de referencia no puede comprobarse; esto produciría una información asimétrica en cuanto a calidad (es decir, con sesgo). En un estudio de casos y controles, los diagnósticos de los casos deberían ser lo más precisos posible.
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
221
El uso de la población general como población control, aunque muy común, no está recomendado. En realidad, el efecto del trabajador sano es menor en el cáncer que en otras muchas enfermedades, pero incluso así, la población general no cumple el criterio más fundamental para garantizar la validez de la comparación (tal como se discute en los capítulos 5 y 9). A partir de las diferencias en la estructura de la clase social entre la cohorte y la población general pueden aparecer grandes sesgos de confusión. Tales sesgos de confusión es probable que sean positivos cuando se estudian cohortes de personal de oficio y negativos cuando se refieren a categorías de profesionales liberales, como por ejemplo, médicos. Ejemplo 3. Un estudio llevado a cabo por el Registro de Cáncer de Finlandia mostró diferencias en la incidencia de cáncer de pulmón entre distintas categorías ocupacionales caracterizadas por una estructura de clase social diferente38. La RME osciló desde 18 (religiosos) a 208 (mineros) para hombres de edades comprendidas entre los 35 y los 69 años durante el período de estudio de 1975 a 1979, cuando la RME para toda la población masculina se situó en 100. Este ejemplo subraya lo importante que es disponer de un grupo de referencia válido, comparable con el grupo expuesto en todos los aspectos relevantes excepto en la exposición. Sin embargo, debe admitirse que tales grupos no se hallan fácilmente disponibles. Un diseño de casos y controles que utilice una extensa base de estudio proporcionaría una alternativa al diseño de cohortes y contribuiría a resolver los problemas de comparabilidad. El sesgo de recuerdo es seguramente el problema de validez más difícil en el diseño de casos y controles (ver el Capítulo 5). El uso de fuentes de información alternativas (datos de exposición procedentes de fuentes laborales, el uso de expertos en higiene) ayuda a superar este tipo de sesgo. A excepción del sesgo de recuerdo y, a veces, del sesgo de confusión, la mayoría de los errores inherentes a los estudios epidemiológicos sobre cáncer ocupacional tienen una dirección negativa, esto es, una dirección hacia el enmascaramiento del efecto. Por lo tanto, la sensibilidad de los estudios epidemiológicos para detectar los verdaderos riesgos es bastante baja, especialmente en el diseño de cohortes. Por este motivo, los estudios de cohortes «negativos»
222
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
siempre deberían considerarse con precaución, sobre todo cuando existe una razón previa para sospechar que una sustancia química es un carcinógeno (por ejemplo, la evidencia experimental). Los métodos epidemiológicos son tan crudos que sólo pueden detectar riesgos de cáncer fuertes o medios e, incluso entonces, tienen que haber pasado décadas de exposición desde el inicio de la misma. La mayoría de errores inherentes a los estudios epidemiológicos sobre cáncer ocupacional tienen una dirección negativa.
ENFERMEDADES RESPIRATORIAS CRÓNICAS INESPECIFICAS Definición El comité de expertos de la OMS en identificación y control de las enfermedades relacionadas con el trabajo50 afirmó que: La enfermedad respiratoria crónica inespecífica (ERCI) es un término general utilizado para describir los grupos de procesos en los que existe expectoración crónica y/o hipoventilación en reposo y/o durante el ejercicio. Estos procesos incluyen la bronquitis crónica, el enfisema y el asma bronquial. Todas estas enfermedades pueden exacebarse aguda o crónicamente y complicarse por infecciones respiratorias. En algunas de ellas pueden hallarse involucrados mecanismos inmunológicos. Son indudablemente enfermedades de etiología múltiple y representan un ejemplo clásico de trastornos que pueden tener un origen principalmente ocupacional o relacionado parcialmente con el trabajo, así como estar relacionadas con los fenómenos sociales de urbanización e industrialización (pág. 25).
El Comité centró su atención en el hecho de que un mismo polvo (por ejemplo, el polvo del algodón) puede causar tanto una enfermedad ocupacional clásica (bisinosis) como una ERCI. Otra enfermedad respiratoria, el asma, cuando está provocada por un determinado agente, puede ser considerada una enfermedad ocu-
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
223
pacional en un país pero no en otro. Del mismo modo, la bronquitis se considera como «ocupacional» en algunos países, pero no en todos. En tales casos, el término «ocupacional» es un concepto más legal que médico. Factores de riesgo relacionados con el trabajo Algunos factores de riesgo son importantes en la etiología y patogénesis de las ERCI; entre ellos están el consumo de tabaco, la contaminación del aire, las condiciones atmosféricas, los factores socioeconómicos, factores familiares y genéticos, la predisposición atópica (para el asma), la reactividad bronquial, las enfermedades respiratorias infantiles y las exposiciones ocupacionales. Los múltiples factores implicados complican a menudo la identificación de su relación ocupacional; sin embargo, existen muchos grupos ocupacionales en los que la fracción etiológica relacionada con el trabajo es importante. Las ocupaciones con una prevalencia elevada de bronquitis crónica incluyen a los mineros del carbón y a otros mineros en general, a los trabajadores de la siderometalurgia, los trabajadores de fundiciones, los trabajadores de fábricas de papel, los panaderos, los granjeros y los trabajadores del algodón50. En muchos países desarrollados, la exposición al polvo que se genera en empresas tales como fábricas de algodón, lino, cáñamo, grano y madera es un factor importante en la elevada ocurrencia de bronquitis crónica. El tabaquismo es frecuentemente un cofactor importante; en algunos estudios, el efecto del polvo sólo es evidente en los fumadores. Los soldadores han sido también estudiados en profundidad. Los resultados han sido contradictorios, probablemente debido a la gran variedad de técnicas de soldadura, intensidades de exposición y a los hábitos tabáquicos en los distintos estudios20,41. El asma bronquial relacionada con el trabajo, un trastorno con obstrucción generalizada de las vías aéreas, está provocada por la inhalación de sustancias o materiales que manufactura o usa directamente un trabajador, o por aquellas que están presentes incidentalmente en el lugar de trabajo32. Existen numerosas causas conocidas de asma relacionada con el trabajo, incluida la exposición a metales, plásticos, productos químicos orgánicos, productos far-
224
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
macéuticos, productos vegetales y animales. En general, se desconoce la prevalencia de asma relacionada con el trabajo7. Sin embargo, existen datos de algunas industrias que muestran que alrededor del 5% de los trabajadores de isocianato desarrollan asma (NIOSH, 1978)35. El asma afecta entre un 10 y un 45% de los trabajadores expuestos a enzimas proteolíticas y entre un 2 y un 40% de los expuestos a polvos de grano6. Según 7 estudios que incluyeron un total de 2.075 personas, la prevalencia de alergia a los animales de laboratorio entre manipuladores de animales de laboratorio varió entre un 15 y un 30% y la de asma bronquial entre un 2 y un 12%36. Sin embargo, la mayor experiencia disponible sobre el asma relacionada con el trabajo procede de material clínico y de casos publicados, y no de estudios epidemiológicos. Indicadores de morbilidad y su medición Aunque alrededor de un 3% de todas las muertes declaradas en 88 países distintos fueron debidas a ERCI51, la mortalidad es un indicador demasiado crudo para estudiar las ERCI relacionadas con el trabajo. En países que disponen de registros de morbilidad, se puede estudiar la incapacidad debida a ERCI. La incapacidad crónica proporciona una mejor estimación de su ocurrencia que las cifras de mortalidad. Se podría, por ejemplo, formar cohortes basadas en la exposición (por ejemplo, los trabajadores de fundiciones o del algodón), usar para su identificación los números de identificación personal y luego identificar, a partir del registro, a aquellos que reciben una pensión por incapacidad y comparar los resultados con los de la población general o un grupo de referencia más válido. En algunos países (por ejemplo, Finlandia), se pueden obtener datos sobre bajas laborales de causa específica y la medicación gratuita, lo cual está disponible para un gran número de enfermedades crónicas, entre ellas el asma. Sin embargo, un control efectivo del sesgo de confusión requiere más información que la disponible a partir de grandes registros. Por todo ello, los estudios ad hoc son mejores. En estos estudios, pueden y deben recogerse datos adicionales (por ejemplo, sobre tabaquismo, infecciones y exposiciones concurrentes) a partir de los grupos de estudio, mediante cuestionarios o entrevistas.
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
225
Mientras el sesgo de confusión, en principio, puede controlarse, la selección, basada en la salud, de los trabajos expuestos es un problema más difícil, incluso en estudios con diseño longitudinal. Aunque en un estudio longitudinal puede conocerse la tasa de rotación, aquellos que permanecen en su puesto de trabajo y, en consecuencia, reciben una mayor exposición, representan una «población superviviente» cuyo estado de salud primario y resistencia a la exposición están por encima de la media. Un estudio de casos y controles de base poblacional es en ocasiones una alternativa a un estudio de cohortes. Los casos de asma (o ERCI, que sin embargo es más difícil de definir) se comparan con una muestra de no casos o con una muestra de la población fuente, en relación con la historia laboral pasada. Este enfoque permite al investigador encontrar nuevas causas de enfermedad pulmonar relacionada con el trabajo, porque al usar un diseño de casos y controles se pueden estudiar al mismo tiempo muchas exposiciones diferentes. Pueden diseñarse estudios similares para la fibrosis difusa radiológica, la función pulmonar alterada (según criterios preestablecidos) y algunas otras condiciones en las que una etiología ocupacional podría ser plausible como factor contribuyente. Sin embargo, en muchos casos, el conocimiento de la relación de las ERCI y el asma con el trabajo se basa en estudios epidemiológicos transversales (u observaciones clínicas). Los indicadores de enfermedades respiratorias generalmente han sido cuestionarios (o entrevistas), pruebas de función pulmonar, exploraciones radiológicas y, en algunos casos, pruebas inmunológicas. Todos estos métodos tienen problemas. Los cuestionarios y las entrevistas, para ser fiables, deben validarse. Debería conocerse tanto su especificidad como su sensibilidad. Ejemplo 4. El cuestionario de bronquitis del British Medical Research Council, de amplio uso en estudios epidemiológicos, fue originalmente validado de forma correcta. Sin embargo, pocos investigadores tienen en cuenta que el cuestionario fue validado como entrevista, y no como un cuestionario autoadministrado. Se validó además en un país con una prevalencia excepcionalmente elevada de bronquitis crónica. Además, el cuestionario original era en inglés, pero posteriormente se ha traducido a otros
226
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
idiomas. Todas estas circunstancias han cambiado su estado original, por lo que es cuestionable si una versión traducida, utilizada como cuestionario autoadministrado en, por ejemplo, un país escandinavo con una baja prevalencia de bronquitis, cumple los criterios de validación.
Cuando se utilizan pruebas de función pulmonar, es importante saber exactamente lo que miden. Se puede obtener poca información de las pruebas que miden la obstrucción de las grandes vías aéreas (volumen de espiración forzada, capacidad vital forzada, etc.) cuando la condición en estudio es principalmente un trastorno restrictivo (por ejemplo, fibrosis). En tales casos, se debería hacer énfasis en las pruebas que miden la difusión, aunque sean más complicadas de llevar a cabo en los estudios de campo. Las buenas mediciones de función pulmonar requieren pruebas simples y repetibles. Es crucial la cooperación del sujeto. También puede existir una gran variabilidad interobservador, por lo que lo ideal sería que el mismo técnico llevara a cabo todas las pruebas. Si no es posible usar un solo técnico (por ejemplo, si el material de estudio es demasiado grande), se debe medir el error interobservador y cada uno de los técnicos debe examinar la misma proporción de sujetos expuestos y de controles, e incluso la misma proporción de subcategorías del grupo expuesto. Si no es así, se produce fácilmente una imprecisión asimétrica de las observaciones, lo cual distorsiona los verdaderos resultados del estudio. El uso de exploraciones radiológicas también se ve complicado por errores inter e intraobservador. Sin ser perfecta, la clasificación más reciente de la Organización Internacional del Trabajo (OIT)16, es el mejor método disponible para la estimación radiológica de la fibrosis; por lo tanto, debería utilizarse siempre que sea posible. Debería haber varios lectores que tendrían que ser «ciegos» en relación con el estado de exposición del sujeto y la secuencia temporal de las radiografías seriadas. Los errores inter e intraobservador deberían medirse e informarse. El diagnóstico del asma es generalmente más correcto en los hospitales, pero en el marco epidemiológico es raramente posible conseguir la misma perfección de la exploración, por lo menos en grandes poblaciones. Es importante definir criterios estrictos para un diagnóstico epidemiológico positivo de asma. Estos criterios de-
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
227
berían aplicarse de la misma manera en el grupo de expuestos que en el de referencia, los cuales deberían ser sometidos a las mismas exploraciones. Es esencial una historia cuidadosa, que puede obtenerse tanto a partir de un cuestionario estandarizado como de una entrevista estructurada. Incluso así, el diagnóstico epidemiológico del asma es incierto. Una de las mejores preguntas, sobre todo cuando el historial evaluado abarca muchos años, es sencillamente: «¿Le ha dicho algún médico alguna vez que usted tenía asma?». Debería también recordarse que hay distintos patrones de reacción, es decir, inmediata, no inmediata o tardía, así como patrones combinados. Las reacciones inmediatas se producen entre 15 y 30 minutos después de la exposición y son de duración relativamente corta. Las reacciones no inmediatas o tardías pueden (1) empezar una hora después de la exposición y durar 2 ó 3 horas; (2) empezar después de 4 ó 5 horas y durar de 24 a 36 horas; o (3) empezar temprano por la mañana durante varios días y permanecer durante todo el día37. La posibilidad de que ocurra uno de estos patrones debe tenerse en cuenta al recoger la historia estandarizada. Con frecuencia, el asma es de tipo hiperreactivo, lo que significa que, por ejemplo, los gases fríos o irritantes pueden provocar ataques de forma inespecífica sin la implicación de un mecanismo alérgico. Deben también incluirse en la historia otras manifestaciones alérgicas (rinitis, síntomas atópicos). Además, la evaluación de los resultados de las puebas de función pulmonar debe tener en consideración que existen diferentes patrones de reacción. Una prueba estandarizada de provocación con histamina o metacolina puede servir como prueba no específica para estudiar la hiperreactividad de las vías aéreas. Una prueba de provocación específica da incluso una confirmación mejor del diagnóstico pero generalmente es demasiado complicada para usarse sobre el terreno. En algunos casos, el diagnóstico puede ser difícil porque la obstrucción de las vías aéreas puede persistir sin cambios en la sintomatología durante los fines de semana o las vacaciones, o incluso después de que la persona deje el empleo. El asma provocada por pequeñas moléculas químicas, tales como los diisocianatos, puede causar síntomas persistentes, cuyo origen puede ser inmunológico o no, o ambos22. Otras pruebas que pueden usarse en las encuestas epidemiológicas son las pruebas cutáneas, el recuento de granulocitos eosi-
228
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
nófilos en sangre o esputo y pruebas seroinmunológicas. Es importante probar los extractos alergénicos antes de su uso epidemiológico, con la intención de excluir las reacciones irritativas no específicas. Se recomienda el uso de pruebas de control positivas y negativas. Las pruebas seroinmunológicas son útiles pero son mucho más caras que las pruebas cutáneas. Valoración de la exposición Siempre que el diseño del estudio se base en una exposición, como en el caso de los estudios de cohortes y los transversales de la base del estudio, se asume que la exposición de interés es conocida en términos cualitativos. Por ejemplo, si el objetivo es estudiar la bronquitis en los mineros de carbón, la cohorte se forma de acuerdo con la exposición al polvo de carbón y, si es estudiar el asma entre los granjeros del visón, se supone que la exposición es el polvo del pelo o los excrementos de los visones. Sin embargo, cuando se trata de estudiar categorías más extensas (por ejemplo, soldadores o trabajadores de fundición), se requiere una caracterización más detallada de la exposición. Por ejemplo, existen muchos métodos de soldadura diferentes y estos métodos producen humos de diferente composición química, distintos tamaños de partículas y otras características. En tales situaciones, se necesita una correcta caracterización de la composición de la exposición para identificar las condiciones causales específicas de, por ejemplo, la bronquitis. El fallo en la definición de la exposición probablemente genera, al menos en parte, la confusión que existe actualmente en la literatura sobre los síntomas respiratorios entre los soldadores. También deberían medirse las intensidades de exposición, sobre todo cuando el estudio intenta establecer relaciones de exposición-respuesta y la definición de un nivel de efecto no adverso. También deberían identificarse otras exposiciones concomitantes y, a ser posible, cuantificarse, ya que pueden modificar los efectos del agente en estudio o pueden actuar como factores de confusión si se distribuyen asimétricamente entre los grupos en estudio. Por ejemplo, ciertas categorías de trabajadores de fundición están expuestas a los agentes irritantes del formaldehído y de los furanos, además del polvo de arena y del hollín. Por este motivo, cuando se
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
229
trata de valorar los efectos del polvo de la fundición como causantes de bronquitis es importante definir exactamente quién ha estado o no ha estado expuesto a alguna de estas sustancias y en qué cantidad. En los estudios sobre el asma relacionada con el trabajo, debe identificarse en el medio ambiente laboral el alérgeno causal. A veces esta identificación es sencilla, por ejemplo en panaderías, pero otras veces la exposición es mixta. A menudo los agentes causales son las impurezas o los derivados de otros productos, los cuales deben ser identificados. Esto puede ser una tarea difícil. Los aspectos cuantitativos son menos importantes para las enfermedades alérgicas que para las ERCI, pero, en el caso de algunos productos químicos que provocan asma, existe por lo menos una asociación cruda exposición-respuesta y la hiperreactividad es también dosis-dependiente. Tabaquismo
Los estudios sobre los trastornos respiratorios relacionados con el trabajo difícilmente pueden considerarse válidos si no se ha tenido en cuenta el tabaco. Generalmente, los hábitos tabáquicos no se conocen antes del estudio, o bien los datos existentes son crudos o no fiables. Por lo tanto deben recogerse, como parte del protocolo de estudio, datos detallados sobre el tabaquismo pasado y actual mediante entrevistas o cuestionarios. Cuando se está diseñando un estudio, se deberían hacer los suficientes contrastes entre las subcategorías de tabaquismo. Por ejemplo, puede ser coste-eficiente centrarse en los grandes fumadores y en los no fumadores, y excluir del estudio a los fumadores moderados y a los ex-fumadores. A menudo, la información más pertinente proviene de las comparaciones entre grandes fumadores expuestos y no expuestos, ya que la exposición en cuestión y el tabaco pueden actuar sinérgicamente. En otros casos, el efecto del tabaco sobre algunos parámetros (por ejemplo, el volumen de cierre), puede ser tan intenso que no es posible identificar un factor etiológico ocupacional más débil. La información más relevante la pueden aportar las comparaciones entre no fumadores. La clasificación de los ex-fumadores es a menudo un problema.
230
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
A veces se pueden clasificar como no fumadores (siempre que haya transcurrido cierto tiempo, 1 ó 2 años), por ejemplo, en el caso de la bronquitis. Sin embargo, otros efectos del tabaquismo son más irreversibles (por ejemplo, el enfisema). A menudo, la razón para que alguien deje de fumar es alguna causa relacionada con la salud, en cuyo caso se pueden encontrar «efectos» importantes entre los no fumadores actuales. Si el material en estudio es suficientemente grande, podría quizás excluirse totalmente a los ex-fumadores. En algunos estudios puede ser necesario incluso tener en cuenta el tabaquismo pasivo. El tabaquismo pasivo puede ser una causa de ERCI relacionada con el trabajo o puede actuar como un factor de confusión potencial en el estudio de otras causas. Otros aspectos de la validez Muchas exposiciones ocupacionales que afectan al sistema respiratorio causan distintos síntomas subjetivos que conducen a una marcada selección, basada en la salud, hacia el abandono del trabajo, en cuyo caso los trabajadores que permanecen en él representan una «población superviviente». Que esta selección ocurre ha sido intuido por los médicos durante muchos años; algunos estudios científicos incluso la han documentado como un hecho. Los trabajadores con alergia y con enfermedad pulmonar crónica obstructiva tienden a dejar los trabajos expuestos (por ejemplo, cita 10). Además, los médicos de empresa han sido muy restrictivos a la hora de permitir a los atópicos o a aquéllos con enfermedades pulmonares crónicas obstructivas desempeñar un trabajo «expuesto». Por todo ello, cualquier estudio transversal sobre enfermedades pulmonares relacionadas con el trabajo tiende a infraestimar el verdadero efecto del trabajo. Los estudios longitudinales también pueden padecer sesgos de selección. Si las revisiones médicas pre-empleo son satisfactorias, se forma un grupo expuesto más sano de lo normal, y la rotación selectiva hacia el abandono del trabajo conlleva una disminución del tiempo de exposición en aquéllos más afectados por síntomas subjetivos. En muchos protocolos de estudio, se usa un tiempo mínimo de exposición como criterio de eligibilidad con el fin de aumentar la efectividad de la investigación. En este caso, los que han
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
231
dejado el trabajo tempranamente no serán clasificados como expuestos. Los que han cumplido el criterio mínimo de exposición, pero más adelante dejan el empleo, constituyen otro tipo de problema. Estos individuos pueden ser localizados si el seguimiento es exitoso, pero habrán experimentado menos exposición que la «población superviviente» y, por este motivo, pueden incluso haberse recuperado de su patología relacionada con el trabajo. Si esta posibilidad no se tiene en cuenta, puede distorsionar severamente la valoración cuantitativa de la fracción etiológica. Otro problema difícil es el asegurar una medición basal válida en los estudios longitudinales. Generalmente los investigadores empiezan con un corte transversal de los trabajadores empleados en aquel momento que, como ya se ha mencionado, representa la «población superviviente» pero que, no obstante, puede tener ya algún decremento funcional comparado con sus propios valores (desconocidos) previos antes del inicio de la exposición. El método ideal podría ser usar como base una revisión médica pre-empleo, pero esta revisión debería requerir una estandarización y un control de calidad mejores que los usuales en las pruebas rutinarias de función pulmonar. Incluso podría ser mejor disponer de un programa ad hoc para medir los valores pre-exposición. Las revisiones seriadas, combinadas con el seguimiento de las bajas (al menos se debería registrar el motivo de la baja), podrían aportar datos más fiables que el enfoque usado habitualmente. TRANSTORNOS MUSCULOESQUELETICOS Dolor lumbar
El dolor lumbar es un síntoma y no una enfermedad. Tiene una etiología multifactorial y ocurre frecuentemente en toda la población, en todos los grupos de edad, en todos los estratos sociales y en todas las ocupaciones. En los Estados Unidos, los trastornos musculoesqueléticos son la principal causa de incapacidad en la población en edad de trabajar y afectan a 19 millones de personas cada año3. Los problemas de espalda constituyen una parte importante de este grupo. El síntoma dolor tiene muchas causas; puede
232
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
ser de origen inflamatorio, degenerativo, neoplásico, traumático e incluso psicogéno. Los problemas de espalda son más comunes en los trabajos pesados que en los ligeros. Los accidentes y los microtraumas repetidos son causas importantes de trastornos lumbares. Los trabajadores jóvenes, no especializados e inexpertos tienen una incidencia de lesiones más elevada que los trabajadores mayores, especializados y expertos44. El hecho de agacharse, sentarse y levantar pesos, sobre todo los inesperadamente pesados, son factores que contribuyen también al dolor de espalda. La vibración de todo el cuerpo (por ejemplo, al conducir un tractor o un camión) es otra causa probable44. Se han considerado como causantes o agravantes de los trastornos lumbares relacionados con el trabajo los siguientes factores ocupacionales: • Lesiones • Trabajar inclinándose y agachándose con frecuencia • Trabajar levantando pesos, sobre todo las cargas inesperadamente pesadas, y/o otros tipos de manejo físicamente pesado de materiales • Trabajo físico pesado • Trabajo que implique una carga estática • Posiciones de trabajo sentadas con exposición concomitante a vibración de todo el cuerpo • Problemas psicosociales Sin embargo, el trabajo sedentario y la inactividad física también han sido incriminados en relación con el dolor lumbar. Los factores biológicos humanos, tales como el tamaño corporal, la fuerza, la buena forma física, la movilidad, la resistencia en el trabajo y la integridad del sistema musculoesquelético juegan un papel; el dolor de espalda puede proceder de la discrepancia entre las capacidades del trabajador y las demandas del trabajo3. Estudios prospectivos recientes han mostrado que los factores psicológicos y psicosociales son causas importantes de absentismo por enfermedades relacionadas con la espalda4. Los factores negativos como la monotonía, las escasas relaciones sociales, poca satisfacción laboral, y un bajo nivel de educación se asocian con un elevado nivel de absentismo debido a enfermedades relacionadas con los problemas de espalda13. Este complejo panorama hace que el estudio epidemiológico del dolor lumbar resulte extremadamente difícil.
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
233
Trastornos del cuello y de las extremidades superiores
Los trastornos del cuello y de las extremidades superiores representan una variedad de condiciones, algunas de ellas mal definidas. Entre ellas se encuentran la espondilosis cervical, la enfermedad discal cervical, el síndrome de compresión neurovascular cervical, el síndrome de tensión cervical, la osteoartrosis de la articulación del hombro, la tendinitis del manguito de los rotadores, tenosinovitis, peritendinitis y epicondilitis. Todos estos síndromes tienen múltiples causas y, además, existen algunos factores predisponentes que aumentan las probabilidades de desarrollar dolor. Entre las causas de dolor del hombro y del cuello están las reacciones inflamatorias de la membrana sinovial y de la bursa, así como los trastornos degenerativos del cartílago, ligamentos y tendones. Además, los trastornos musculares, vasculares y neurológicos pueden causar dolor en el hombro y puede haber dolor referido de los órganos torácicos. Un meta-análisis de la literatura sobre enfermedades del hombro y del cuello en diferentes grupos ocupacionales ha mostrado algunas conexiones con las malas condiciones de trabajo o las posturas12. El trabajo con las manos a nivel de los hombros ha sido asociado a la tendinitis del manguito de los rotadores; las tareas con movimientos repetitivos de los brazos se han asociado al síndrome de compresión neurovascular cervical; y el trabajo con teclados al síndrome de tensión cervical. La prevalencia de síndrome cervical fue elevada en los trabajadores de mataderos, los que hacen de tijeras y funcionarios, en comparación con varios grupos de referencia. Los empaquetadores en cadenas de montaje mostraron una elevada prevalencia del síndrome de compresión neurovascular cervical, mientras que los soldadores de los astilleros, los planchistas y los trabajadores de la industria que trabajaban por encima de la altura del hombro mostraron una elevada prevalencia de tendinitis del manguito de los rotadores. El síndrome de tensión cervical era prevalente en muchas ocupaciones, sobre todo en los enrolladores de películas. También se ha considerado la importancia de los factores precipitantes de la lesión, pero los estudios en este sentido no son lo bastante concluyentes2. La peritendinitis y la tenosinovitis son debidas frecuentemente al sobreesfuerzo o a un cambio en la rutina diaria, tal como la rea-
234
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
sunción de nuevas tareas al volver al trabajo después de un tiempo de ausencia. Además, los traumatismos bruscos y las torceduras pueden causar estos síntomas. La epicondilitis o el síndrome del codo del tenista están provocados generalmente por el esfuerzo de los extensores de los dedos y de la muñeca26. Los trabajos manuales repetitivos también han sido incriminados como causantes del síndrome del codo del tenista, aunque apenas existen estudios que apoyen esta asunción46. Osteoartrosis La osteoartrosis es una causa frecuente de incapacitación, aunque está infradeclarada en las estadísticas de morbilidad2. Esta ausencia puede ser debida, al menos en parte, a la confusión diagnóstica. La artrosis se puede definir como la presencia de osteofitos en una articulación, radiológicamente demostrables; sin embargo, la mayoría de individuos mayores de 50 años de edad presentan este hallazgo y no obstante, no tienen síntomas. La osteoartrosis es una enfermedad de la vejez. Además de la edad, la obesidad, la herencia y la carga laboral son también factores de riesgo. El levantamiento frecuente de pesos, el trabajo en posturas incómodas, la vibración, los esfuerzos frecuentes y el trabajo pesado en general parecen ser causas de osteoartrosis relacionada con el trabajo2. Por ejemplo, los granjeros tienen un elevado riesgo de osteoartrosis de cadera, los recogedores de algodón presentan cambios degenerativos en los dedos, los mineros tienen problemas en los codos y rodillas y ciertos trabajos de las fundiciones donde se utilizan herramientas pesadas y vibratorias se relacionan con artrosis del codo. La causa no parece ser sólo el trabajo duro, sino una combinación de trabajo duro y actividad repetitiva49. Indicadores de morbilidad y su medición Como ya se ha mencionado, el dolor lumbar es un conglomerado de distintos trastornos más que una sola entidad33. El prolapso de un disco lumbar puede tener con frecuencia una etiología diferente a, por ejemplo, la espondilosis, los espasmos musculares o los procesos inflamatorios. Las técnicas diagnósticas utilizadas
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
235
para diferenciar cada síndrome son imprecisas, incluso en el caso de las exploraciones clínicas individuales a los pacientes, por no hablar de las series epidemiológicas que comprenden cientos o miles de sujetos. Por ejemplo, Kersley21 fue incapaz de clasificar a más del 60% de una serie de 404 pacientes con dolor de espalda crónico, incluso tras un examen profundo. Las encuestas epidemiológicas raramente pueden permitirse estas exploraciones. Los estudios de seguimiento, en particular, requerirían unas pruebas simples y fiables, no sólo para discriminar entre los distintos síndromes que causan dolor de espalda, sino también para aportar una valoración repetible del estado de la espalda. Estas pruebas no existen. A menudo, el uso de ciertas exploraciones en sujetos clínicamente asintomáticos se ve limitado por consideraciones éticas (por ejemplo, radiografías). En los estudios de casos y controles, donde el número de pacientes es mucho menor, se pueden usar exploraciones más elaboradas y las restricciones éticas son menores porque los «casos» están enfermos. No obstante, los grandes estudios de cohortes apenas pueden permitirse dedicar más de 10 a 15 minutos a cada sujeto y todas las pruebas deben ser completamente seguras. Un problema serio es también la falta de métodos apropiados para medir cuantitativamente una condición. Ejemplo 5. Un fisioterapeuta especialmente entrenado llevó a cabo un examen clínico detallado de la espalda de 298 trabajadores activos del hormigón armado, en la provincia de Uusimaa, en el sur de Finlandia, en 1972. Cinco años más tarde se examinó a 252 trabajadores activos del hormigón armado en la misma región. La segunda vez los exámenes se llevaron a cabo por otros dos fisioterapeutas, que fueron entrenados por el fisioterapeuta de la primera fase del estudio. Se hicieron todos los esfuerzos para conseguir que los exámenes en las dos fases fueran idénticos. El primer examinador dio a los otros instrucciones escritas, que incluían los criterios de clasificación de los hallazgos, y practicó las exploraciones de rutina con los nuevos en una muestra de voluntarios. Se usaron formularios estandarizados para registrar los hallazgos. Se observaron discrepancias considerables en las prevalencias de varios hallazgos clínicos entre las dos fases del estudio. La prevalencia de los distintos trastornos fue: escoliosis torácica, 38 contra 65% (1972 contra 1977); lordosis lumbar acentuada, 23 contra 14%; inclinación de la pelvis,
236
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
39 contra 29%; movimiento irregular en la inclinación hacia delante, 38 contra 18%; espasmos de los músculos de la espalda, 41 contra 22%; debilidad de la musculatura abdominal, 43 contra 5%; y debilidad de la musculatura de la espalda, 27 contra 3%. Las dos muestras eran similares en cuanto a edad y experiencia de trabajo. Las discrepancias indicaron una escasa fiabilidad y repetibilidad de los métodos de exploración clínica utilizados48. Desafortunadamente, los historiales de los trastornos dolorosos relacionados con la espalda también son poco fiables porque los sujetos tienden a olvidar sus síntomas y los eventos asociados, incluso los importantes como la hospitalización. Ejemplo 6. En un estudio prospectivo por cuestionario sobre problemas lumbares, 2.222 hombres que representaban a operarios de máquinas, carpinteros y oficinistas, contestaron a un cuestionario postal básico (Riihimäki, resultados no publicados)53. Tres años después se mandó un cuestionario idéntico a todos los que respondieron. La «tasa de olvido» se definió como la proporción de hombres que contestaron «no» en la fase de seguimiento a la pregunta de si habían tenido alguna vez problemas lumbares, de aquellos que habían contestado «sí» a la misma pregunta en la primera prueba. La tasa de olvido fue del 26% para el dolor ciático (dolor lumbar que irradiaba por las piernas), 40% para el lumbago (ataque súbito de dolor lumbar), 35% para otros problemas lumbares y del 34% para las hospitalizaciones debidas a enfermedades de espalda. La tasa de olvido, por ejemplo, para el dolor ciático, se relacionó con la edad y la ocupación; la tasa de olvido fue del 49% para los de edades comprendidas entre 25 y 29 años, 19% para los de 35 a 39 años y 24% para los de 45 a 49 años. Se observó una tasa del 22% para los operarios de máquinas, del 28% para los carpinteros y del 31% para los oficinistas. Estas diferencias, dependientes de la ocupación y de la edad, en la variación de las tasas de olvido conducen fácilmente a sesgos, cuando se estima el riesgo relativo de dolor ciático en diferentes grupos ocupacionales. También existen considerables diferencias constitucionales entre los sujetos, en las que cabe incluir: (1) las características macroanatómicas tales como el tamaño del canal espinal, anomalías
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
237
óseas y piernas de distinta longitud; (2) las diferencias entre los diversos colágenos —hay unos 120 tipos de colágeno— y la composición de los glucosaminoglicanos; (3) la habilidad motora natural, que varía entre los sujetos; (4) la variación de la fuerza muscular (los efectos de esta variación pueden ser beneficiosos o perjudiciales porque unos músculos demasiado fuertes pueden exponer a la columna a un esfuerzo excesivo); y (5) variaciones en las características psicológicas tales como la asunción de riesgos y el neuroticismo. Estos factores, solos o acompañados, a menudo resultan en variaciones cuyos efectos pueden ser mucho más elevados que los de los factores ocupacionales que se estudian. El estudio de los trastornos del cuello y de las extremidades superiores, sobre todo aquellos que requieren un tiempo de exposición largo o la repetición de pequeños traumas para su desarrollo, también se encuentra frente a serios problemas. Los trastornos agudos como el codo de tenista o la peritendinitis se pueden asociar a menudo con actividades ocupacionales normales. Al enfrentarnos con estas dificultades, es difícil planificar encuestas epidemiológicas y debe adoptarse un compromiso entre la validez y la factibilidad. El desarrollo de entrevistas y cuestionarios estandarizados para los síntomas es una tarea urgente. Sin embargo, el diagnóstico no puede descansar solamente en los síntomas. Las exploraciones objetivas deberían también estandarizarse (cómo valorar el dolor y la sensibilidad, cómo asegurar la repetibilidad de la medición de la movilidad, etc). Por ejemplo, aunque se han propuesto criterios aparentemente consistentes y detallados para la epicondilitis, es difícil lograr la repetibilidad de las exploraciones. Los problemas surgen porque ni las preguntas sobre los síntomas ni los métodos para llevar a cabo las pruebas aisladas (por ejemplo, posición y fuerza en la palpación, posicionamiento del brazo en las pruebas funcionales) han sido lo suficientemente estandarizados, a pesar de algunos intentos47. Ejemplo 7. Se diseñó un estudio en trabajadores de mataderos en el que un fisioterapeuta experto realizaba una exploración preplanificada a cada sujeto y también, en la misma visita, entrevistaba a los sujetos46. El diagnóstico de cribaje se realizó en relación con un conjunto de criterios preestablecidos. Según estos criterios, por ejemplo, el síndrome de epicondilitis fue definido
238
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
como «dolor local en reposo y/o en movimiento, sensibilidad local en el epicóndilo lateral/medial, dolor a la resistencia durante la flexión/extensión de los dedos y la muñeca». Si el diagnóstico era positivo, se llamaba al sujeto para unas pruebas adicionales que fueron realizadas por un médico. En el caso de dolor de codo, estas pruebas implicaban la medición del movimiento libre y sin dolor, la palpación de la bursa del olécranon, la palpación del nervio radial en el borde de músculo supinador superficial (la arcada de Frohse) y la medición de la fuerza de la extensión del dedo medio. También se preestablecieron los criterios para un diagnóstico clínico; en el caso de la epicondilitis eran los mismos que para el diagnóstico de cribaje, pero para otros trastornos fueron más elaborados. El examen físico profundo no reveló casos de trastornos que no se hubieran encontrado mediante el método epidemiológico de cribaje, con la excepción de ganglios carpianos.
En el estudio de este ejemplo, se concluyó que no se podía contrastar la validez de los métodos de cribaje usados, ya que los diagnósticos clínicos y de cribaje se basaban en parte en las mismas pruebas. Se dieron pocos casos de hallazgos objetivos en ausencia de síntomas subjetivos. Así que sólo la entrevista sobre los síntomas de los sujetos podía constituir el procedimiento de cribaje y ello reduciría esfuerzos y costes en los estudios de campo. Sin embargo, en las personas ancianas, los cambios degenerativos provocan síntomas y signos que no se pueden aislar en una exploración física. Por lo tanto, el método es más adecuado para las poblaciones jóvenes. El diagnóstico de la osteoartrosis también es difícil en los estudios epidemiológicos, porque las exploraciones radiológicas, que serían necesarias, se consideran a menudo poco éticas en el caso de los individuos «sanos». Si las exploraciones radiológicas no se pueden usar en un estudio epidemiológico, el diagnóstico dependerá de la historia de dolor, la existencia de debilidad y la limitación de la movilidad; todas ellas son medidas imprecisas y no específicas. Además, en la osteoartrosis, las medidas de la movilidad y las exploraciones radiológicas a menudo son conflictivas. Un enfoque alternativo sería un estudio de casos y controles en una base de población dinámica, en el que se compararan los historiales de trabajo de los pacientes con osteoartrosis diagnosticada de unas determi-
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
239
nadas articulaciones con los de otros sujetos sin la enfermedad. Este enfoque proporcionaría riesgos relativos para diferentes poblaciones de trabajadores y pemitiría identificar tareas peligrosas. Sin embargo, eliminar el sesgo de recuerdo en tal situación resultaría realmente difícil. Valoración de la exposición La valoración del historial de toda una vida de «exposición» es un problema difícil en los estudios del dolor de espalda. En la vida real, la exposición de la espalda a varios tipos de traumas, tensiones y estrés por lo general es larga y diversa. No se han desarrollado escalas de exposición estandarizadas e incluso, si existieran, el recuerdo de los sujetos probablemente sería poco preciso para contabilizar el historial completo de la exposición. Mientras algunas exposiciones, como el trauma, pueden causar efectos inmediatos (el traumatismo, por supuesto, también puede iniciar efectos tardíos), otras, como la vibración de todo el cuerpo, pueden causar síntomas después de un largo período de inducción. Otras exposiciones, como el levantar pesos, pueden tener o no períodos latentes antes de que originen dolor lumbar crónico. A menudo existen combinaciones de distintas exposiciones, y para complicar aun más las cosas, las exposiciones ocupacionales se confunden a menudo con las exposiciones durante el tiempo libre, tales como las lesiones por actividades deportivas y el esfuerzo excesivo en la jardinería de los días festivos. Por otro lado, tanto las actividades del trabajo como las del tiempo libre, si son fisiológicas, pueden tener efectos beneficiosos. Este patrón tan complicado hace que la valoración de la fracción etiológica ocupacional sea una tarea realmente difícil. Se hallan problemas similares en el estudio de los trastornos del cuello y de los miembros superiores, así como de la artrosis, sobre todo en los trastornos que requieren un período de exposición largo o pequeños traumas para su desarrollo. Trastornos más agudos, como la peritendinitis y el síndrome del codo de tenista, se relacionan más fácilmente con las actividades ocupacionales actuales. Las descripciones detalladas y completas del trabajo son una gran ayuda en los estudios de tales trastornos. Se han utilizado varios métodos
240
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
para la valoración de la exposición; ninguno de ellos es completamente satisfactorio13. Son los siguientes: • • • • • • • • • • •
Modelos biomecánicos estáticos Modelos biomecánicos dinámicos Medidas del consumo de energía Cuestionarios Valoraciones ergonómicas Registro de la carga de trabajo Método ARBAN multimomento Sistema Ovako de análisis de la postura de trabajo (OWAS) Estudio de la postura Mala postura en el trabajo (PWP) Método AET39 de valoración de la carga de trabajo
El problema de estos métodos es que miden la exposición actual, pero no la pasada y la mayoría de ellos requieren mucho tiempo. Aunque se han desarrollado muchos métodos para describir sistemáticamente el trabajo manual, el análisis de los métodos de trabajo es difícil y laborioso. Los movimientos durante el trabajo son muchos y complejos, incluso en las tareas manuales monótonas. Así que el estudio de tal exposición lleva mucho tiempo y es difícil de estandarizar y de asociar con las medidas de enfermedad. Otros aspectos de la validez El estudio de los trastornos musculoesqueléticos, en especial el dolor lumbar, plantea otros problemas de validez. Como estos trastornos son dolorosos, causan una rotación altamente selectiva hacia el abandono de trabajos con exigencias sobre el sistema musculoesquelético. Tal selección invalida la mayoría o todos los estudios transversales, sobre todo debido a que las tareas con menos demanda, usadas generalmente como contraste, no ejercen en absoluto una selección similar. En un estudio transversal, la mera selección (y la falta de ella o una selección en dirección contraria en el grupo de referencia) puede enmascarar total o parcialmente el dolor lumbar relacionado con el trabajo y otros trastornos musculoesqueléticos. No obstante, es cierto que muchos investigadores han
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
241
demostrado un nivel excepcionalmente elevado de, por ejemplo, dolor lumbar en los trabajos pesados, pero tales hallazgos reflejan trastornos soportables y no las manifestaciones más severas y, en especial, no aquellas que llevan a la incapacidad. La selección también es un problema en los estudios longitudinales porque aquéllos con las manifestaciones más severas tienden a abandonar el trabajo demasiado tempranamente como para considerar que han tenido una exposición «intensa» o «a largo plazo». Desde el punto de vista práctico, una rotación elevada provoca dificultades a la hora de efectuar el seguimiento de todos los miembros de la población en estudio. Sin embargo, los estudios de cohortes prospectivos, si están bien diseñados, pueden ser tan válidos como informativos en la valoración de los trastornos con un corto período de latencia, como los traumas, la tenosinovitis y el síndrome del codo de tenista. Finalmente, es casi imposible diferenciar los factores causales de los que condicionan el agravamiento; este es un problema que de forma particular dificulta la investigación etiológica. En conjunto, puede ser que nos equivoquemos al considerar el dolor lumbar como un tema de investigación, como si se tratara de una enfermedad. De hecho, es una molestia con un gran número de causas diferentes y no una enfermedad. Así que la validez de la investigación mejoraría si se llegara a un diagnóstico definitivo de la anomalía de interés31. Este requisito presupondría otro enfoque de la epidemiología del dolor lumbar, requeriría muchos más datos clínicos y también consumiría mucho tiempo en cuanto a procedimientos diagnósticos. En esta situación, por razones prácticas, la única opción posible vendría a ser un diseño de casos y controles. Sin embargo, dichos comentarios críticos no deberían impedir la planificación y ejecución de buenos estudios; la discusión anterior pretende señalar lo difícil que puede llegar a ser el problema y el conjunto de aspectos que se deben tener en cuenta. Intenta, además, prevenir al lector en contra de llevar demasiado lejos conclusiones derivadas de estudios mal ejecutados. Además debería, quizás, hacer desistir del inicio de estudios que desde el principio están predestinados al fracaso.
242
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
ENFERMEDAD CORONARIA Factores de riesgo relacionados con el trabajo
La enfermedad coronaria (EC) es el principal contribuidor a la mortalidad cardiovascular, e incluso a la mortalidad general, en los países más industrializados. Algunos factores de riesgo bien conocidos explican cerca de la mitad de su ocurrencia. Entre ellos se incluyen la edad, el sexo, el colesterol sérico, la presión arterial y el tabaquismo. La otra mitad del riesgo se atribuye a factores no tan bien establecidos, tales como las variables del estilo de vida, la inactividad física, el tipo de personalidad, la diabetes y el apoyo social19. Incluso así, no queda explicada toda la etiología y los factores relacionados con el trabajo pueden jugar un papel importante. Algunos son conocidos y otros esperan ser identificados. Las diversas exposiciones químicas que se han relacionado con la morbilidad cardiovascular han sido revisadas recientemente24. Estas incluyen el disulfuro de carbono, que es aterogénico y además causa muerte súbita; los nitratos orgánicos, que causan EC y muerte súbita al cesar la exposición; el arsénico, que ha mostrado causar un aumento dosis-dependiente de la mortalidad cardiovascular, y los disolventes orgánicos, que pueden causar arritmias. El monóxido de carbono como mínimo agrava la angina de pecho; su papel en el origen de la EC probablemente es insignificante. Se ha acusado al cadmio y al plomo de causar hipertensión; los datos, sin embargo, no son concluyentes. El estrés por el calor y la exposición al frío se han relacionado con la morbilidad cardiovascular25. Las situaciones extremas de calor y humedad pueden tener fuertes efectos en el sistema cardiovascular, especialmente en los sujetos con enfermedades orgánicas subyacentes. La aclimatación a los ambientes cálidos generalmente tarda unos 10 días en los sujetos sanos, pero aquellos que tienen la función miocárdica deteriorada pueden no ser capaces de soportar la exposición al calor mediante un aumento del gasto cardíaco. A pesar de los evidentes efectos del calor en el rendimiento cardiovascular, especialmente en las personas con enfermedad cardiovascular, hay poca o ninguna evidencia que sugiera un incremento de la mortalidad cardiovascular en las poblaciones expuestas a elevadas temperaturas en el
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
243
trabajo. Es posible que las personas con enfermedad cardiovascular tengan un riesgo más alto de complicaciones, pero no se han demostrado los efectos causales del calor. La exposición al frío también provoca respuestas cardiovasculares. Estas incluyen anoxia y vasoconstricción, que dan lugar a un aumento de la carga de trabajo. Muchos pacientes con enfermedad coronaria son sensibles al frío. Responden con un aumento del ritmo cardíaco y de la presión arterial. El umbral para los ataques de angina es menor. Se ha demostrado muchas veces que el tiempo frío incrementa la mortalidad coronaria. Por ejemplo, en el norte de Finlandia la mortalidad por infarto de miocardio dependía tanto del mes como de la temperatura media34. La mortalidad era más de un 20% superior en los meses de diciembre, enero y febrero que en julio y agosto. El efecto era especialmente marcado en las personas mayores de 50 años. Sin embargo, no se dispone de estudios de cohortes desarrollados en trabajadores expuestos al frío en el trabajo. Actividad física y estrés laboral Recientemente se ha revisado la morbilidad cardiovascular en relación con la actividad física19'25. Se ha demostrado que la actividad física tiene un efecto beneficioso sobre varios parámetros bioquímicos y circulatorios que se hallan implicados en la patogénesis de la EC. Muchos estudios han indicado también que la actividad física protege contra la enfermedad misma19,25. Cerca de dos tercios de los estudios publicados muestran una relación positiva entre la inactividad física y el riesgo de EC. Cuanto mejor sea la calidad del estudio, más clara será esta relación. El riesgo relativo mediano de EC es 1,9 para las personas inactivas cuando se tienen en consideración todos los estudios, y un 2,4 si sólo se tienen en cuenta los mejores estudios25. Sin embargo, otros factores de estilo de vida asociados con la actividad física pueden explicar en parte esta diferencia19. Por otro lado, el riesgo de morir de EC es muy elevado durante y justo después del ejercicio enérgico. Estudios correctamente desarrollados han mostrado un aumento del riesgo de EC en determinados tipos de trabajadores por turnos al compararlos con trabajadores de jornada regular. Otros
244
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
estudios no han podido demostrar tal efecto25. Gran parte de la confusión se debe probablemente al sesgo de selección y a otros errores no controlados en el diseño de los peores estudios1. Tales errores tienden a enmascarar el verdadero efecto. Los estudios negativos no han tenido en cuenta de forma correcta a toda la población o han diferenciado la morbilidad en relación con el total de exposición1,25. Cuanto mejor sea el diseño del estudio, más elevado será el riesgo relativo. Uno de los mejores estudios publicados mostró una razón de tasas global de 1,4 con un claro gradiente con el tiempo de exposición23. Este resultado es consistente con otros estudios de alta calidad25. El efecto del trabajo por turnos sobre la EC podría hallarse mediado de forma directa por el sistema neuroendocrino e indirectamente por los hábitos adversos del consumo de tabaco y de la comida, inducidos por un estilo de vida irregular. Aún se necesitan estudios prospectivos bien diseñados para aportar una respuesta más convincente a esta cuestión. La literatura sobre el papel del estrés en el trabajo en la patogenia de la EC es también conflictiva. El estrés en el trabajo generalmente se asocia a un estrés en la vida privada del individuo. Además diferentes individuos experimentan el estrés de maneras distintas y por ello, es difícil establecer mediciones objetivas de la «exposición» al estrés. El trabajo clásico de Karasek18 significó un gran paso hacia adelante en la aclaración de conceptos. Según él, son «estresantes» las condiciones del entorno que pueden causar estrés. Sus características comunes son (1) la falta de control, (2) la falta de sentido, (3) la falta de previsibilidad, (4) la sobre o infraestimulación y (5) el conflicto. El estrés puede influir en el sistema cardiovascular directamente a través de procesos psicofisiológicos o indirectamente por la inducción de conductas relacionadas con el estrés, tales como un exceso en el consumo de tabaco y en la comida. En general, los estudios que examinan el modelo de Karasek han encontrado una relación entre el estrés y la enfermedad cardiovascular. El riesgo relativo de este grupo de enfermos variaba según los distintos estudios desde 1,3 hasta cerca de 4; los RR más elevados han sido documentados en los mejores estudios25. Otros tipos de estudios también han mostrado una conexión entre el estrés y una elevada incidencia de enfermedad cardiovascular. Ejemplos de condiciones que implican un riesgo elevado son la inseguridad, la frustración, la competitividad, un horario de trabajo irregular, el
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
245
esfuerzo físico intenso y repetitivo y una urgencia puntual o fija en el tiempo25. Indicadores de morbilidad y su medición
Epidemiológicamente, la EC seguramente ha sido estudiada más que ninguna otra enfermedad. Por ello, la epidemiología cardiovascular ha servido como modelo para el estudio epidemiológico de las enfermedades crónicas en general. Sin embargo, la mayor parte del trabajo realizado concierne a la historia natural y a los factores de riesgo generales de la EC; el impacto de los factores ocupacionales no siempre ha sido considerado de forma suficiente. La relación de las enfermedades cardiovasculares con el trabajo puede estudiarse epidemiológicamente en los siguientes tres niveles: 1. Mortalidad. 2. Morbilidad (con infartos, apoplejías, incapacidad, cambios electrocardiográficos en reposo y después de ejercicio, angina e hipertensión como punto final o resultado del estudio). 3. Factores de riesgo (lípidos sanguíneos, diabetes, obesidad, hipertensión como un precursor de la apoplejía y la EC, inactividad física, etc.). En los estudios sobre la relación entre los factores de riesgo relacionados con el trabajo y la morbilidad cardiovascular, los factores de riesgo que son extrínsecos a la posible relación con el trabajo, tales como la edad o el tabaquismo, deben también medirse y controlarse como potenciales factores de confusión. La mortalidad cardiovascular ocupacional se puede estudiar a través de los registros nacionales en los países con registros de defunción satisfactorios. El método más crudo consiste en comparar la mortalidad según categorías ocupacionales amplias. Este problema se sigue rutinariamente en el Reino Unido; las estadísticas de mortalidad ocupacional publicadas por el Registrador General son sobradamente conocidas desde hace más de 100 años. Actualmente, dichas estadísticas se analizan en relación con la información ocupacional de los censos de decenios anteriores11. Un estudio realizado en Finlandia ha mostrado variaciones relativamente ex-
246
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
tensas (RME 67--131) de la mortalidad cardiovascular en un amplio abanico de categorías ocupacionales40. Sin embargo, como se entremezclan los factores sociales y los de estilo de vida con los factores ocupacionales y como que las categorías ocupacionales registradas son muy amplias, tales estudios no aportan grandes conclusiones. Como mucho, pueden sugerir asociaciones. Sin embargo, debido a su crudeza probablemente encubren diferencias existentes entre subcategorías menos extensas de trabajadores. Así pues, se necesitan estudios de cohortes ad hoc para conseguir datos más precisos. Primero, se debería definir una cohorte ocupacional con una exposición específica, como por ejemplo el disulfuro de carbono, el trabajo por turnos, el trabajo en una fundición, cierto nivel de actividad (o inactividad) física. A continuación, se puede comprobar la mortalidad de esta cohorte en los registros de mortalidad nacionales y compararla con los datos nacionales o preferiblemente con los derivados de una cohorte de referencia correctamente seleccionada. Si el estudio de cohortes es prospectivo, el investigador puede estudiar otros indicadores de morbilidad al mismo tiempo, tales como infartos no fatales, hallazgos electrocardiográficos o angina. Ejemplo 8. En el estudio finlandés sobre los efectos de la exposición al disulfuro de carbono en la morbilidad por EC, el riesgo relativo durante los primeros cinco años de seguimiento fue de 4,8 para los infartos fatales, de 3,7 para todos los infartos y de 2,8 para los infartos no fatales. Al final del período, la prevalencia de angina era de 2,2 y la de electrocardiogramas «coronarios» era 1,4 veces más elevada que en un grupo de referencia de trabajadores de una fábrica cercana de papel y pulpa. El uso de indicadores de distintos niveles de gravedad de la enfermedad añadió información a la aportada por los simples datos de mortalidad. Se pudo mostrar, por ejemplo, que el disulfuro de carbono no sólo incrementaba la incidencia de EC, sino que también empeoraba su pronóstico.
Los estudios prospectivos (por ejemplo, sobre los efectos del trabajo por turnos en la morbilidad cardiovascular) podrían utilizar un enfoque similar. Los registros de mortalidad son fuentes de información especialmente importantes cuando se trata de una cohorte extensa, el seguimiento es largo y hay una gran rotación, por-
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
247
que es difícil o imposible seguir a todos los fallecidos a través de otros medios. En los países con otros registros de morbilidad, la morbilidad «fuerte», como los infartos y las patologías que condicionan pensiones por incapacidad se pueden estudiar de manera similar. De los indicadores leves de EC, la angina y los cambios electrocardiográficos han sido los más estudiados. El cuestionario sobre la angina, llevado a cabo por la OMS, se ha usado ampliamente52. Del mismo modo, apenas ningún estudio de morbilidad consideraría abandonar la electrocardiografía en reposo o después de un ejercicio estándar. La codificación «a ciegas» de los cambios electrocardiográficos, especialmente los que indican infartos anteriores o isquemia, según el llamado código de Minnesota y sus últimas revisiones5, se ha recomendado durante las dos últimas décadas. A pesar de que no se puede hacer un diagnóstico individual basado sólo en los hallazgos electrocardiográficos aislados, este método —que emplea técnicos como codificadores— tiene en cuenta el sesgo del observador y asegura una lectura objetiva mediante la eliminación de las más o menos bien fundamentadas «impresiones clínicas». Más recientemente, se han desarrollado e introducido técnicas informatizadas para la codificación de electrocardiogramas; este avance ha mejorado la calidad de las lecturas. La medición de la presión arterial se incluye a menudo en las encuestas de morbilidad cardiovascular. Aunque la propia medición es simple, hay unos requisitos metodológicos que se deberían tener en cuenta. El manómetro debe estar bien calibrado y el manguito debe ser ancho y largo. La posición del sujeto debería ser siempre la misma (sentada o supina) y la medición debe ir precedida por un descanso de unos 15 ó 20 minutos. La lectura de la presión diastólica debe estandarizarse (por ejemplo, la desaparición de los ruidos de Korotkoff). La presión arterial generalmente fluctúa durante el día y la propia exploración puede que la haga aumentar. Por ello es necesario repetir las mediciones. La selección de parámetros de morbilidad en las encuestas cardiovasculares no se guía sólo por consideraciones científicas. La gran cantidad de métodos de examen cardiológico disponibles puede tentar al investigador a utilizar varias pruebas, preferentemente las modernas y sofisticadas, por una parte, mientras que por otra, las restricciones en los fondos y la limitada disponibilidad de los espe-
248
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
cialistas actúan de forma inhibitoria. Un requisito absoluto en los informes epidemiológicos es que no se imponga riesgo alguno al sujeto. Este requisito es más estricto que en el ámbito clínico, en el que el paciente se beneficia de las investigaciones y en el que las consideraciones de riesgo son, por lo tanto, diferentes. El requisito de una seguridad total limita las pruebas que pueden recomendarse para los estudios epidemiológicos; se puede cuestionar si, por ejemplo, la electrocardiografía de esfuerzo y la provocación mediante el frío son justificables. Cuando se seleccionan pruebas para una encuesta es crucial saber con profundidad la información que nos aportará cada una de las nuevas pruebas alternativas. Por ejemplo, incrementar la sensibilidad de las pruebas electrocardiográficas mediante el uso de pruebas de esfuerzo puede en algunos casos aportar información, pero en otros, en cambio, puede no aportar ninguna información nueva. Una prueba de ejercicio provoca mucho más trabajo extra e implica posiblemente un ligero riesgo para algunos sujetos. En el estudio finlandés sobre el disulfuro de carbono, la inclusión de la electrocardiografía de ejercicio no aportó ninguna información adicional14. No obstante, desde la perspectiva de una conclusión, no es tan simple saber de antemano la información exacta que aportará cada exploración. Valoración de la exposición Por lo que se refiere a los factores químicos o físicos, la valoración de la exposición es un tema relacionado con la correcta realización de las mediciones higiénicas ocupacionales convencionales. Como siempre, el problema principal reside en cómo asegurar los datos retrospectivos de exposición, porque el proceso aterogénico que precede a los ataques cardiovasculares es un hecho crónico y lento que debería estar relacionado con la exposición durante un largo intervalo de tiempo. Cuando se trata del trabajo por turnos es importante describir exactamente el tipo específico de trabajo a que se refiere y no mezclar demasiados sistemas distintos en la «exposición». Cualquier estudio del efecto de los factores relacionados con el trabajo en la morbilidad cardiovascular, debería, claro está, medir los factores de
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
249
riesgo más conocidos en este grupo de enfermos, de manera que puedan ser controlados estadísticamente. Estas mediciones provocarán mucha demanda extra en términos de recursos humanos y recursos económicos, pero de ningún modo pueden evitarse si se desea asegurar la validez del estudio. Como ya se ha dicho antes, los factores ocupacionales pueden ser causas directas o indirectas de enfermedad cardiovascular. Cuando se planifica un estudio, el investigador debe saber con certeza el mecanismo que está actuando, porque el diseño del estudio se halla influido por el mismo. Ejemplo 9. Si el objetivo es estudiar si el trabajo por turnos causa o no EC, el estrés mental es un posible factor etiológico. Por lo tanto, si se controla el estrés estadísticamente se podría bloquear el efecto. Así que el grupo control no debería presentar un nivel de estrés excepcional. Ejemplo 10. Si, por otra parte, la cuestión es si la exposición al disulfuro de carbono causa EC, el estrés mental es un factor extrínseco (probablemente) no relacionado con la cadena causal. En esta situación, el estrés mental debería controlarse como un factor de confusión potencial. En otras palabras, el grupo control debe exponerse a la misma cantidad de estrés (por ejemplo, en forma de trabajo por turnos) que el grupo expuesto, o bien deberían analizarse por separado los diferentes niveles de estrés.
Otros aspectos de la validez La gran experiencia aportada por la epidemiología de la enfermedad coronaria, en general, también debería utilizarse en el diseño de estudios válidos sobre problemas relacionados con el trabajo. El conocimiento acumulado de la importancia relativa de los factores de riesgo «fuertes», como el tabaquismo, la hipertensión y la hiperlipemia, así como otros como la diabetes, la inactividad física o la gota, ayuda a identificar y controlar los factores de confusión potenciales en un estudio sobre la morbilidad relacionada con el trabajo. Cuanto mejor sea el control de los factores no ocupacionales, mayor será la sensibilidad de un estudio para detectar los factores relacionados con el trabajo. Sin embargo, como ya hemos
250
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
mencionado antes, parear en base a los factores intermediarios en una cadena etiológica lleva al enmascaramiento de un verdadero efecto y por eso no debería realizarse. Por ejemplo, en el estudio finlandés sobre el disulfuro de carbono, los niveles de la presión arterial y del colesterol se midieron pero no se controlaron estadísticamente. El motivo fueron suposiciones anteriores de que algunos de los mecanismos por los que el disulfuro de carbono podía incrementar la morbilidad coronaria podrían ser un paso intermedio entre la hipertensión y la hiperlipemia14. La selección es otro problema. Se cree que la EC causa un fuerte efecto del trabajador sano30, en parte porque los síntomas tempranos fuerzan al trabajador a dejar el trabajo o a buscar un trabajo más ligero y en parte porque se puede identificar a los individuos con un elevado riesgo en una etapa inicial. Puede que a tales personas no se les contrate o que de forma selectiva se queden sin empleo, sobre todo durante los períodos de depresión económica. Esta posibilidad lleva a una disminución de la mortalidad de los trabajadores que permanecen en su puesto; las manifestaciones leves, especialmente la angina, también quedan infrarrepresentadas. Por ello es importante definir y utilizar un grupo control en el que operen los mismos tipos de fuerzas de selección. Los estudios sobre el trabajo por turnos, la morbilidad coronaria y otra morbilidad cardiovascular se dice que son especialmente vulnerables al sesgo de selección. Una rotación rápida de trabajadores puede deberse a una selección según la salud; además, esta rotación causa cortos períodos de exposición para la mayoría de la cohorte y por ello diluye los resultados1. La selección en el trabajo por turnos también es difícil de controlar. Para remediar este problema, deberían favorecerse los sitios de trabajo donde haya pocas posibilidades de traslado. Además, los análisis deberían hacerse por separado para las distintas duraciones de los empleos en el trabajo por turnos y este requisito aumenta la demanda del tamaño de la cohorte. Las grandes compañías, situadas en áreas remotas, tales como algunas fábricas de papel en los países nórdicos o en Columbia Británica, aportarían grandes posibilidades para la investigación porque generalmente en estos sitios hay escasas oportunidades de cambiar de empleo. El diseño de casos y controles quizás no ha recibido suficiente atención en la epidemiología cardiovascular. Este diseño no es óptimo para todos los indicadores (por ejemplo, la
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
251
muerte súbita, en la que el historial laboral debe obtenerse del pariente más cercano). Sin embargo, sería útil si los casos fueran, por ejemplo, supervivientes de infartos de miocardio. Especialmente cuando se tienen que estudiar o controlar muchos factores etiológicos a la vez, este enfoque hace que el estudio resulte menos costoso, ya que los datos de exposición sólo se tienen que buscar en los casos y sus controles y no para toda la base del estudio. Así, puede profundizarse más en el tema. Por ejemplo, se podría obtener información sobre los factores psicosociales de forma muy detallada. Sin embargo, el gran problema de este enfoque es cómo controlar el sesgo de recuerdo, lo cual puede ser difícil cuando la entrevista se refiere al estrés mental. Otro problema es que los datos de algunos factores de riesgo coronarios, tales como los lípidos en sangre antes de la enfermedad y la presión arterial, podrían no obtenerse, con lo que su control como factores de confusión potenciales sería imposible. RESPUESTAS CONDUCTUALES Y SÍNTOMAS PSICOSOMATICOS Fuentes de estrés en el trabajo Varios factores relacionados con el trabajo pueden provocar estrés mental. Los estresantes importantes son las condiciones ergonómicas adversas, el trabajo por turnos, una sobrecarga de trabajo, poca carga de trabajo junto con aburrimiento, infrautilización de las habilidades psicológicas, discrepancia entre expectativas y capacidades, por un lado, y el papel en la organización por otro, junto a un desarrollo insatisfactorio de la carrera, peligro físico, malas relaciones personales en el trabajo y mala estructura organizativa y atmósfera8,50. Los factores físicos, como la exposición al ruido, a menudo actúan como estresantes; algunas exposiciones químicas, tales como los metales pesados y disolventes orgánicos, pueden causar síntomas neurotóxicos que pueden confundirse con los síntomas del estrés. Es importante darse cuenta de que el estrés relacionado con el trabajo y los problemas psicosociales en el terreno doméstico a me-
252
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
nudo se hallan entrelazados y se agravan unos a otros. Juntos pueden llevar a una conducta poco saludable y esto aumenta la morbilidad, tanto directa como indirectamente. Por eso se debe adoptar un enfoque holístico en los estudios epidemiológicos sobre los problemas psicosociales relacionados con el trabajo. Los rápidos cambios que están teniendo lugar hoy en día en la vida laboral en todo el mundo (por ejemplo, la industrialización, urbanización, emigración, automatización e informatización), junto con el envejecimiento de la mano de obra, al menos en los países industrializados, acentúan muchos problemas psicosociales e incrementan el peso relativo de los factores psicosociales de la salud ocupacional. Sintomatología psicosomática y conductual como consecuencia del estrés relacionado con el trabajo En todo el mundo es muy frecuente encontrar síntomas psicosomáticos y de conducta en las poblaciones trabajadoras17,27. Por ejemplo, en Suecia, uno de cada tres adultos sufre de síntomas como malestar, trastornos del sueño, fatiga, abatimiento o ansiedad; uno de cada siete está exhausto al final de la jornada de trabajo; y la mitad de los hombres y las tres cuartas partes de las mujeres sufren crisis nerviosas una o más veces antes de los 60 años. Un 10% de los hombres tienen problemas relacionados con el alcohol y el índice de suicidios es del 2,03 por 10.00027. Según varios informes de distintos países, aproximadamente la mitad de la población no está satisfecha con su trabajo y las tres cuartas partes de los que consultan a psiquiatras relacionan sus problemas con la falta de satisfacción en el trabajo o la incapacidad de relajarse27. El estrés relacionado con el trabajo puede influir en la salud directamente o a través de la inducción de un estilo de vida poco saludable. El fumar se ha asociado a la tensión y la ansiedad y también a altos niveles de carga en el trabajo29,50. El abuso del alcohol también puede estar relacionado con el estrés en el trabajo y a un sentimiento de insuficiencia; puede ser un método de escaparse del estrés. El comer demasiado con frecuencia se ha relacionado con la ansiedad y la falta de ejercicio físico puede estar relacionada con el agotamiento psiconeurótico o con una carga de trabajo demasiado pesada (por ejemplo, tener dos empleos). Todos estos hábitos influ-
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
253
yen en la salud de manera negativa; por ejemplo, la relación entre fumar y ciertas enfermedades, tales como la enfermedad coronaria, varias formas de cáncer y trastornos gastrointestinales es bien conocida. El abuso del alcohol causa muchos trastornos, entre los que están un exceso de mortalidad en general, cirrosis hepática, trastornos cardiovasculares, daños en el sistema nervioso, accidentes y suicidios. Los efectos directos psicosomáticos del estrés relacionado con el trabajo incluyen trastornos mentales, enfermedad psicógena de masas, síntomas gastrointestinales (por ejemplo, dispepsia indigestión y ardores), síntomas cardiovasculares (por ejemplo, palpitaciones, arritmia y dolor torácico, así como hipertensión y enfermedad coronaria), síntomas respiratorios (hiperventilación), síntomas del sistema nervioso central, reaccciones neuróticas, insomnio, debilidad, desfallecimiento y dolor de cabeza) y síntomas genitales (frigidez e impotencia)27. Todas estas manifestaciones pueden servir como indicadores de efectos en los estudios sobre el estrés relacionado con el trabajo. Los mecanismos patogénicos de estas reacciones son ciertamente complicados y de diversos tipos. Se han considerado como más destacados dos tipos de mecanismos, las reacciones neuroendocrinas, que involucran a los ejes hipotálamo-adrenomedular e hipófiso-adrenocortical, y las reacciones del sistema inmune27,50. En este sentido, se ha utilizado el nivel de catecolaminas en sangre o en orina para valorar el estrés. En los estudios epidemiológicos, se podrían desarrollar otras medidas bioquímicas para indicar alteraciones en estos sistemas, como marcadores del estrés. Problemas en el diseño del estudio
Muchos estudios han buscado asociaciones entre los factores psicosociales en el trabajo y la salud. La mayoría han sido exploratorios y de diseño transversal; es difícil obtener inferencias causales de tales estudios. Por contra, es raro encontrar estudios etiológicos longitudinales con una buena validez y lo mismo podemos decir de las intervenciones. El escaso número de tales estudios etiológicos tiene que ver seguramente con la gran demanda de recursos necesarios; otra de las razones que hace que el diseño de un estudio válido resulte extremadamente difícil y caro es la complejidad de la situación.
254
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
La investigación sobre las respuestas de conducta y la sintomatología psicosomática generalmente recae en el uso de entrevistas y cuestionarios. Estas técnicas pueden aportar resultados válidos sólo si se dejan en manos de investigadores expertos y especializados, pero parecen tan sencillas que tienen el peligro de ser utilizadas por investigadores sin la experiencia suficiente. La mayoría de las situaciones que dan lugar a sintomatología psicosomática y de conducta, como pueden ser la agresividad, la depresión, el insomnio o enfermedades psicosomáticas como la hipertensión o la úlcera péptica, están tan llenas de conflictos emocionales que es difícil encontrar respuestas no sesgadas a las preguntas. Como el ambiente social general tiene también un gran impacto en el individuo, siempre es necesario incorporar muchas preguntas relacionadas con la situación general de la vida en todas las encuestas sobre los riesgos ocupacionales. Esta necesidad añade más exigencias en las cualificaciones del investigador; aumenta considerablemente el número de variables y por ello los cuestionarios/entrevistas son laboriosos de administrar y engorrosos de analizar. Las variables de los efectos a menudo son difusas e inespecíficas, y por ello, se requieren criterios diagnósticos estandarizados y validados de forma estricta. Se pueden obtener diagnósticos fiables de los resultados «fuertes» tales como los infartos de miocardio, los suicidos o la úlcera péptica, pero las manifestaciones leves como el insomnio, el dolor de cabeza o el vértigo son difíciles o imposibles de definir de manera válida y concisa. Además, la cadena causal de la exposición al efecto no es siempre tan simple. Por ejemplo, cuando el estrés del trabajo provoca antes que nada un consumo excesivo de tabaco y alcohol, esta reacción puede considerarse un «efecto» como tal. Sin embargo, este abuso también puede producir de forma indirecta (desde el punto de vista del estrés) un aumento de la morbilidad, como ya se ha dicho. Estas complicadas interacciones deben conocerse a fondo antes de iniciar cualquier estudio y deben tenerse en cuenta tanto en la fase de planificación (recogida de la información necesaria y previsión de los contrastes entre subgrupos) como en el análisis de datos (uso de métodos estadísticos sofisticados y multivariados). Cuando se dispone de métodos objetivos de valoración de la carga psicológica del trabajo, como, por ejemplo, el método alemán llamado AET39, deberían ser utilizados. Por otro lado, factores como el nivel de exigencia del
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
255
trabajo, la cantidad de estímulos, la repetitividad de las tareas y el grado de control sobre la situación de trabajo se pueden valorar objetivamente. Sin embargo, las evaluaciones subjetivas sobre cómo se perciben a sí mismos los sujetos en relación con la situación del trabajo generalmente constituyen la principal fuente de información, porque muchas «exposiciones» del trabajo, tales como la interacción social, no se pueden medir de ningún modo desde un punto de vista objetivo. La selección de un grupo de control válido es muy difícil, sobre todo en epidemiología psicosocial, donde se deben controlar muchas variables de fondo, externas a la situación laboral. Existen muchos cambios sociales imprevisibles en la vida humana que afectan al grupo en estudio y a los controles de forma distinta; ello comportará una distorsión en una comparación que inicialmente era correcta, especialmente en los estudios de diseño longitudinal. Desde un punto de vista práctico, es imposible recoger todos los datos de fondo relevantes antes de formar los grupos, por lo que el control de los factores de confusión y de intervención será un problema del análisis de datos. Este tipo de control es imposible de llevar a cabo sin una información detallada sobre los factores de confusión potenciales. La selección es particularmente difícil de controlar en los estudios psicosociales. La mayoría de la gente elige su ocupación, al menos en parte, por motivos psicológicos y los factores como la motivación, la personalidad y la capacidad intelectual o psicomotora tienen al inicio un papel importante. Es probable que estos factores sean mucho más relevantes en el momento de la incorporación al trabajo que los factores relacionados con la salud. Del mismo modo, la selección hacia el abandono del trabajo depende a menudo de factores psicológicos, aunque la importancia de los aspectos médicos es probable que sea mayor que en la incorporación al trabajo. Hallar un grupo control en el que las fuerzas iniciales de selección que inclinan hacia un trabajo, las características relevantes del trabajo y las fuerzas que determinan la selección hacia el abandono del trabajo sean similares, puede ser una tarea imposible. La realización de comparaciones intraindividuales permite vencer algunas de estas dificultades, pero este enfoque requiere un diseño longitudinal, con o sin intervención. Además, una evaluación antes-después puede introducir otros sesgos y por ello es necesario
256
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
un grupo control. Los estudios longitudinales prospectivos, a pesar de luchar también contra los sesgos incontrolables, aportan ciertamente datos más fiables que los estudios transversales, pero los costes fácilmente pueden ser formidables, porque se requiere la repetición de las mediciones de muchas variables. Además, debido a la previsible pérdida de sujetos por bajas, los grupos iniciales en estudio deben ser mucho más extensos de lo que realmente era necesario para medir un efecto. Por ello, a menudo el coste limita el uso de un diseño prospectivo.
BIBLIOGRAFÍA 1. Ákerstedt, T., A. Knutsson, L. Alfredsson y T. Theorell. «Shift work and cardiovascular disease», Scand. J. Work Environ. Health 10:409-14 (1984). 2. Anderson, J.A.D. «Arthrosis and its relation to work», Scand. J. Work Environ. Health 10:429-3 (1984). 3. Association of Schools of Public Health. «Proposed National Strategies for the Prevention of Leading Work-Related Diseases and Injuries», Association of Schools of Public Health (1986). 4. Bigos, S., M. Battié, D. Spengler, L. Fisher y A. Nachemson. «Back injuries in industry: a retrospective study. III. Employee-related factors». Spine 3:252-6(1986). 5. Blackburn, H., A. Keys, E. Simonson, P. Rautaharju y S. Punsar. «The electrocardiogram in population studies: a clasification study», Circulation 21:1160-75 (1960). 6. Brooks, S. M. «Bronchial asthma of occupational origin», Scand. J. Work. Environ. Health 3:53-72 (1977). 7. Brooks, S. M. «Bronchial asthma of occupational origin», en Environmental and Occupational Medicine, V.N. Rom, Ed. (Boston, MA: Little, Brown, 1983) pp. 233-50. 8. Cooper, C. L. y M. Davidson. «Sources of stress at work and their relation to stressors in non-working environments», en Psychosocial Factors at Work and Their Relation to Health, Kalimo, R., M. A. El-Batawi y C. L. Cooper, Eds. (Ginebra: OMS, 1987) pp. 99-111. 9. Eisen, A. E., D. H. Wegman y T. A. Louis. «Effects of selection in a prospective study of forced expiratory volume in Vermont granite workers», Am. Rev. Respir. Dis. 128:587-91 (1983). 10. El-Batawi, M. A. «Work-related diseases: a new program of the World Health Organization», Scand. J. Work. Environ. Health 10:341-6 (1984).
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
257
11. Fox, A. J. y A. M. Adelstein «Occupational mortality: work or way of life?», J. Epidemiol. Community Health 32:73-8 (1978). 12. Hagberg M. y D. H. Wegman. «Prevalence rates and odds ratios of shoulder-neck diseases in different occupational groups», Br. J. Ind. Med. 44:602-10(1987). 13. Hansson, T. Landryggsbesvar och arbete (Stockholm: Swedish Work Environment Fund, 1989). 14. Hernberg, S., T. Partanen, C.-H. Nordman y P.Sumari «Coronary heart diseases among workers exposed to carbón disulphide», Br. J. Ind. Med. 27:313-325(1970). 15. IARC «Monographs on the evaluation of carcinogenic risks to humans, Suppl.7», Overall evaluations of carcinogenity: an updating of IARC monographs volumes 1 to 42 (Lyon; IARC, 1987). 16. ILO. «Guidelines for the Use of ILO International Classification of Radiographs of Pneumoconioses», Ginebra; ILO. 1980 (Occupational Safety and Health Ser., No. 22). 17. Kalimo R, M. A. El-Batawi y C. L. Cooper, Eds. Psychological factors at work and their relation to health (Ginebra: OMS, 1987). 18. Karasek, R. A. «Job demands, job decisión latitude and mental strain: implications for job redesign» Adm. Sci. Q. 24:285-308 (1979). 19. Karvonen, M. J. «Physical activity and cardiovascular morbidiy», Scand. J. Work. Environ. Health 10:389-95 (1984). 20. Keimig, D. G., P. R. Pomrehn y L. F. Burmeister «Respiratory symptoms and pulmonary function in welders of mild steel: a cross-sectional study», Am. J. Ind. Med. 4:489-99 (1983). 21. Kersley, G. D. «Back pain: its problems and treatments», Curr. Med. Resp. Opin. 6:27-32(1979). 22. Keskinen, H., O. Túpasela, U. Tiikainen y C. H. Nordman. «Experiences of specific IGE in asthma due to isocyanates», Clin. Allergy 18:547-604 (1988). 23. Knutsson, A., T. Akerstedt, B. G. Johnsson y K. Orth-Gomer «Increased risk of ischaemic heart disease in shift workers», Lancet 2:89-92 (1986). 24. Kristensen, T. J. «Cardiovascular diseases and the work environment. A critical review of the epidemiologic literature on chemical factors», Scand. J. Work. Environ. Health 15:245-64 (1989). 25. Kristensen, T. J. «Cardiovascular disease and the work environment. A critical review of the epidemiologic literature on nonchemical factors», Scand. J. Work. Environ. Health 15; 165-79 (1989b). 26. Kurppa, K., P. Waris y P. Rokkanen. «Tennis elbow: lateral elbow pain syndrome», Scand. J. Work. Environ. Health 6 (Suppl.3): 15-8 (1979). 27. Levi, L. «Psychosomatic disease as a consequence of occupational stress», en Psychosocial Factors at Work and Their Relation to Health, Kalimo,
258
28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43.
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
R., M. A. El-Batawi y C. L. Cooper, Eds. (Ginebra: OMS, 1987), pp. 7891. Malker, H. S. R., J. K. McLaughin, B. K. Malker, B. J. Stone, J. A. Weiner, J. L. E. Erickson y W. J. Blot. «Occupational risk for pleural mesothelioma in Sweden, 1961-79», J. Nati. Cancer Inst. 74:61 (1985). McCrae, R.R., P. T. Costa y R. Bossé «Anxiety, extroversion and smoking», Br. J. Soc. Clin. Psychol. 17:269-73 (1978). McMichael, A. J. «Standardized mortality ratios and the "healthy worker effect": scratching beneath the surface», J. Occup. Med. 18:165 (1976). Miettinen, O. S. y J. J. Caro. «Medical research on a complaint: orientation and priorities», Ann. Intern. Med. 21:399-401 (1989). Murphy, R. L. H., Jr. «Industrial disease with asthma», en Bronchial Asthma: Mechanisms and Therapentics, Weiss, E. B. y M. S. Segal, Eds. (Boston, MA: Little, Brown, 1976) pp. 517-536. Nachemson, A. «A critical look at conservative treatment for low back pain», EularBull. ll(4):234-38 (1982). Náyhá, S. «Short and medium-term variations in mortality in Finland», Scand. J. Soc. Med. Suppl. 21 (1981). NIOSH «Criteria for a recommended standard... Occupational exposure to Diisocyanates.» Washington, D. C. US Governmental Printing Office, 1978. DHEW (NIOSH) Publ. No. 78-215. Nordman, C. H. «Atopy and work», Scand. J. Work Environ. Health 10:481-5(1984). Pepys, J. y B. J. Hatchcroft. «Bronchial provokation tests in etiological diagnosis of asthma», Am. Rev. Respir. Dis. 112:829-36 (1975). Pukkala, E., L. Teppo y T. Hakulinen «Keuhkosyöpäsairastavuus eri ammattialoilla Suomessa», Sos lääket aikak 1:363 (1979). Rohmert, W. y K. Landau «Das Arbeitswissenshaftliche Erhebungsverfahren zur Tätigkeitsanalyse (AET)», Handbuch und Merkmalheft (Bern: Huber, 1979). Sauli, H. «Occupational Mortality in 1971-75», Helsinki: Central Statistical Office of Finland, 1979. Sjógren, B. y U. Ulfvarson «Respiratory symptoms and pulmonary function among welders working with aluminium, stainless steel and raiload trucks». Scand. J. Environ. Health 11:27-32 (1985). Sweetnam, P. M., S. W. Taylor y P. C. Elwood. «Exposure to carbón disulphide and ischaemic heart disease in a viseóse rayón factory». Br. J. Ind. Med. 44:220-7 (1987). Tolonen, M. S. Hernberg, C-H. Nordman, S. Goto, K. Sugimoto y T. Baba. «Angina pectoris, electrocardiographic findings and blood pressure in Finnish and Japaneses workers exposed to carbón disulphide». Int. Arch. Occup. Environm. Health 37:249-61 (1976).
PROBLEMAS ESPECÍFICOS EN EL ESTUDIO DE ALGUNAS PATOLOGÍAS...
259
44. Troup, J. D. G. «Causes, prediction and prevention of back pain at work». Scand. J. Work. Environ. Health 10:419-28 (1984). 45. Vainio, H. «Occupational cancer prevention». J. Cancer Res. Clin. Oncol. 113:403-412(1987). 46. Viikari-Juntura, E. «Neck and upper limb disorders among slaughterhouse workers: an epidemiologic and clinical study». Scand. J. Work Environ. Health 9:283-90 (1983). 47. Viikari-Juntura, E. «Tenosynovitis, peritendinitis and the tennis elbow syndrome», Scand. J. Work Environ. Health 10:443-9 (1984). 48. Wickström, G., J. Nummi, M. Wiikeri y H. Riihimki. Betoniraudoittajat. Osa 2.Kliininen tutkimus. Helsinki: 1975. Työterveyslaitos, Työterveyslaitoksen tutkimuskia 98 (resumen en inglés). 49. Williams, H.J. y J. R. Ward «Musculoskeletal occupational syndrome», en Environmental and Occupational Medicine, W.N. Rom. Ed. (Boston, MA: Little, Brown, 1983), pp. 351-7. 50. OMS Expert Committee. «Identification and Control of Work-Related Diseases: Report of a WHO Expert Committee», OMS, Ginebra, 1985 (WHO, Tech. Rept. Ser. No. 714). 51. OMS. «Sixth Report on the World Health Situation», OMS, Ginebra, 1980, p. 111. 52. OMS «Cardiovascular survey methods», 2.a ed. OMS, Ginebra, 1982. 53. Riihimäki, H. Resultados no publicados.
4
7 Planificación de un estudio: el protocolo
¿POR QUÉ SE NECESITA UN PROTOCOLO DEL ESTUDIO? Un estudio epidemiológico por lo general es una tarea compleja y de larga duración, que requiere recursos humanos, organizativos y materiales. Tal esfuerzo no puede tener éxito sin una planificación cuidadosa y detallada. En los grandes proyectos, los planes de estudio no pueden permanecer almacenados en las mentes de los investigadores; deben proyectarse de manera sistemática en el marco de un protocolo del estudio. El protocolo del estudio comprende no sólo una detallada explicación del plan del estudio, sino también un minucioso diario de su ejecución, es decir, como progresa el proyecto. Debería ser evidente que, en un proyecto que puede costar cientos de miles e incluso millones de dólares, es esencial un protocolo detallado y completo; sin embargo, muchos investigadores sorprendentemente perciben el protocolo como una carga burocrática innecesaria. Miettinen2 ha destacado cinco objetivos principales del protocolo del estudio: 1. Cristalizar el proyecto para los propios investigadores. Si se fuerza a escribir las ideas que uno tiene, por lo general éstas mejoran. Este trámite requiere claridad de pensamiento pues unas ideas confusas no dejarán de pasar desapercibidas. 2. Dar a consultores externos la posibilidad de examinar el proyecto. Ello es particularmente pertinente cuando el investigador solicita fondos al exterior y cuando el inicio del proyecto requiere un permiso formal del propio instituto. 261
262
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
3. Informar y educar a todos aquellos que tomen parte en el proyecto, tales como técnicos y especialistas. 4. Asegurar que en el transcurso del estudio los investigadores principales no se olvidan de ningún detalle del plan y asegurar la continuidad del estudio en el caso de que algún miembro clave del equipo cambiara a otro trabajo o falleciera. 5. Documentar los procedimientos del proyecto de cara al futuro. EL PLAN DEL ESTUDIO
El plan del estudio es una relación detallada de lo que los investigadores intentan llevar a cabo. Es un documento importante porque de él depende el destino bueno o malo del estudio. (¿Recibirá financiación? ¿Cuál será la decisión del comité de investigación o del director?) Así que vale la pena emplear el tiempo suficiente en la planificación, en consultar a expertos, estadísticos y otros especialistas, y en discutir todos los detalles con los miembros del equipo. Los resultados de estos esfuerzos deberían registrarse cuidadosamente y rediscutirse, y quizás revisarlos de nuevo otra vez. El plan escrito ha de ser tan completo y detallado que otro investigador competente debería ser capaz de llevar a cabo el proyecto basándose en él. El plan de estudio debe contener los siguientes elementos: 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12.
Resumen Fundamentos Objetivos Diseño del estudio Métodos y procedimientos Control del sesgo de confusión Preparación de los datos e informatización Métodos estadísticos Consideraciones éticas Publicaciones e información Calendario Organización del proyecto Presupuesto
El primer punto son los fundamentos del proyecto. Resume lo que ya se conoce del problema, lo que no se sabe y si existen pun-
PLANIFICACIÓN DE UN ESTUDIO: EL PROTOCOLO
263
tos de vista conflictivos. Para esta etapa, los investigadores deben estar muy familiarizados con la literatura científica sobre el tema del estudio y también deben dominar la metodología. La «metodología» implica mucho más que el proceso de datos y el análisis estadístico; puede abarcar todo, desde las pruebas de función pulmonar o las mediciones de velocidad de conducción nerviosa hasta el análisis de los «adducts» del ADN. Sería frustrante darse cuenta, cuando el proyecto se halla muy avanzado, de que el problema ya había sido resuelto anteriormente o que la metodología es anticuada. Un plan de estudio en el que el primer paso se etiquete de «revisión de la literatura», revela que los investigadores ignoran el tema en estudio. Es imperativo que conozcan toda la literatura antes de empezar a planificar el proyecto. Finalmente, si el proyecto tiene un fin práctico y el propósito de hallar solución a un problema, se recomienda concluir la sección de fundamentos con una valoración de la relevancia social del estudio y de las medidas preventivas en que puede derivar. A continuación deberían definirse los objetivos del estudio. Es prudente no referir demasiados objetivos, porque podrían hacer borroso nuestro propio pensamiento y dificultar la comprensión del lector. No deberían definirse más de tres o cuatro objetivos primarios. Si fuese necesario, más adelante se pueden dividir en subtítulos o en objetivos secundarios. Los objetivos del estudio deben definirse convenientemente, deben ser concisos y su número limitado.
Los objetivos deberían definirse de forma inequívoca e inteligible, para que otras personas puedan entender exactamente lo que los investigadores intentan decir. A la hora de formular los objetivos, es importante que los investigadores se den cuenta de si el problema es descriptivo (por ejemplo, la prevalencia del dolor de espalda entre los conductores de autobús) o etiológico. Si es etiológico, deberán decidir si el objetivo es cualitativo (por ejemplo, si el óxido de etileno causa leucemia) o cuantitativo (por ejemplo, cuan elevado es el riesgo de cáncer de pulmón en los no fumadores que han sido expuestos a asbesto amosita, a concentraciones de
264
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
cinco veces el estándar higiénico durante más de 20 años). Este último ejemplo, además de ser cuantitativo, restringe el problema a una sola categoría (hombres no fumadores). Si la financiación y la provisión de material lo permiten, se podrían formular otras subcategorías de objetivos, tales como el riesgo de los fumadores, de las mujeres (probablemente no sería posible hallar el número suficiente de sujetos para esta categoría), para los niveles bajos de exposición, para períodos de exposición cortos, etc. La estricta definición de tales objetivos no solamente es un ejercicio intelectual, sino también crucial para la determinación del tamaño del material requerido y para planificar la estrategia de la investigación. Por ejemplo, los datos detallados de exposición deben hallarse disponibles para un estudio cuantitativo, mientras que un estudio cualitativo puede utilizar datos más crudos, tales como la clasificación entre personas expuestas y no expuestas. A veces un estudio puramente descriptivo puede no necesitar datos de exposición en absoluto. La distinción entre un estudio cualitativo y otro cuantitativo es importante.
Dentro del llamado «material del estudio», primero se debería definir la base del estudio y luego el tipo de estudio. La base del estudio podría, por ejemplo, definirse como «el seguimiento durante 20 años de todos los hombres que han trabajado durante al menos 3 años, en el período de 1951 a 1975, en las fundiciones holandesas», o «un seguimiento de 20 años de trabajadores fuertemente expuestos en una fábrica de procesado de lana durante un cierto período de tiempo (debe ser definido el término «fuertemente»). Luego, se debe decidir si se incluirá a todos los que pertenezcan a la base del estudio (censo), es decir, el diseño será de tipo cohorte, o si sólo se estudiarán los casos de la enfermedad de interés y una muestra de los no casos; entonces el estudio será del tipo casos y controles. Se puede emplear un diseño de casos y controles a partir de una base de cohortes, o bien la base del estudio puede ser el seguimiento de una población dinámica durante un determinado período de tiempo, por ejemplo, todo un país durante 3
PLANIFICACIÓN DE UN ESTUDIO: EL PROTOCOLO
265
años. Los casos pueden definirse, por ejemplo, como «todos los casos de cáncer hepático primario (o solamente los casos en las mujeres) diagnosticados en todo el país y recogidos en el registro de cáncer desde el año 1988 al 1990». Posteriormente la definición de caso puede perfeccionarse, añadiendo la mención de: los casos que siguen vivos (o muertos), los que han sido autopsiados, los que tienen carcinoma hepatocelular solamente, los que tenían más de 75 años cuando fallecieron y otros aspectos. La base de la población también se puede restringir a una región geográfica más pequeña, como el municipio de Lille, la isla de Guernsey o el área de influencia del Hospital de la Universidad de Linköping. Los controles deben pertenecer a la misma base de estudio o ser comparables al grupo de estudio y deben definirse igualmente bien, además de ser comparables con los casos (ver el Capítulo 5). La base del estudio debe definirse explícitamente.
En esta etapa es difícil escapar a la delicada pregunta sobre el tamaño requerido del estudio. A menudo ello viene determinado por la disponibilidad de sujetos; si la provisión es amplia, éste será el momento y lugar para los cálculos formales de la potencia (ver el Capítulo 5). Un estudio cualitativo requiere una muestra más pequeña que uno cuantitativo. La necesidad de subagrupar, basada en las categorías de las variables de exposición o en los factores de confusión, es importante cuando se considera el tamaño de la muestra. Un estudio cualitativo requiere una muestra más pequeña que uno cuantitativo.
La frecuencia del fenómeno de interés en la base del estudio es igualmente importante cuando se juzga el tamaño requerido del estudio. Si varios métodos de valoración previa, tanto formal como intuitiva, o ambas, sugieren que el estudio, como ya se preveía originalmente, será demasiado pequeño para ser informativo, todavía no está todo perdido. Se puede, por ejemplo, disminuir el nivel de
266
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
las pretensiones (en un estudio cuantitativo). Un diseño de dos puntos, centrado en los extremos y desestimando categorías de exposición intermedias, es coste-eficiente y debería tenerse en consideración, sobre todo cuando los fondos económicos son limitados. También se puede crear un sistema con un largo período de seguimiento o se puede intentar organizar un estudio multicéntrico, tanto nacional como internacional o un programa mixto (no se recomienda a los investigadores jóvenes; los expertos pueden tener éxito en esta difícil tarea si son pacientes y buenos diplomáticos). Cuando todo falla, la única opción que queda es abandonar el proyecto (por mucho que duela). Los estudios multicéntricos son difíciles y se recomiendan sólo si un centro no puede, él sólo, llevar a cabo el estudio, por ejemplo, debido a insuficiencia de material o de pericia.
La selección del material que estudiar debe describirse con gran detalle. ¿Qué compañías, qué tipo de trabajo, qué períodos, qué fuentes de información se usarán, habrá problemas con las normas de confidencialidad? ¿Las compañías desean participar? ¿Qué ocurre con los sindicatos? El grupo de control debería describirse con un detalle similar. ¿Cuáles son los criterios para la inclusión o exclusión en los grupos? Por ejemplo, en un estudio sobre neurotoxicidad, ¿se excluirá a los diabéticos, y si es así, cómo se definirá y diagnosticará la diabetes? El trauma craneal, ¿cómo se considerará en un estudio sobre los efectos de los disolventes en el sistema nervioso central? En los estudios de cohortes, los criterios de admisión se deben definir en términos de exposición mínima, calendario de exposición, si se permiten o no otras exposiciones, etc. Si se adopta un diseño de casos y controles, el criterio de admisión para ambos, casos y controles, debe hallarse bien definido. Por ejemplo, ¿qué tipos histológicos de cáncer se incluirán? ¿Cómo se confirmará el diagnóstico? Cuáles son los criterios para la «bronquitis crónica», «neuropatía», «asma», «prolapso de disco lumbar», etc.? ¿Cuál es el diagnóstico de los controles? ¿Los controles son realmente representativos de la base del estudio? Y muchas otras preguntas. ¿El es-
PLANIFICACIÓN DE UN ESTUDIO: EL PROTOCOLO
267
tudio será un trabajo de campo, un estudio de base hospitalaria o un estudio de enlace de registros? ¿Quién recogerá los datos, por ejemplo, de qué registros, fábricas, hospitales, y quién realizará las mediciones clínicas? ¿Cómo se calcularán las personas-año? ¿Cómo se calcularán los valores esperados? ¿Por qué motivos se usa la población general como grupo de referencia (a pesar de lo dicho en el Capítulo 5 de este libro y otra literatura moderna)? Un plan de estudio tiene que ser tan detallado que un investigador independiente debería ser capaz de llevar a cabo el estudio basándose en el plan.
Estas preguntas son sólo ejemplos de lo detallada que debe ser la descripción de la adquisición de los datos. Cada proyecto tiene su propia lista de preguntas, así que aquí no es posible ilustrar todos los problemas que puedan surgir. Como norma general, diremos que se deben proporcionar los detalles suficientes para que alguien de fuera sea capaz de llevar a cabo el estudio basándose en el plan del estudio. No hace falta decir que una descripción detallada y completa también impresionará a los de la agencia de financiación que se encarguen de la revisión del proyecto. Los métodos de medición y los procedimientos deberían describirse en detalle. Primero, se debería definir aquello que concierne al estudio a nivel conceptual (por ejemplo, exposiciones, enfermedades, síntomas, síndromes), y luego describir los métodos que se usarán para medir los indicadores de estas entidades. ¿Los indicadores describirán las entidades suficientemente bien? Por ejemplo, ¿el nivel actual de plomo en la sangre es una buena medida para la exposición a largo plazo? ¿Un cuestionario diseñado especialmente para los síntomas es suficientemente sensible y específico para medir, por ejemplo, los efectos neurotóxicos de los solventes? Los objetivos principales de los métodos de medición, por ejemplo, de los cuestionarios, deberían resumirse en el mismo plan y el método detallado se puede añadir como un apéndice. Se deben describir los métodos del control de calidad. ¿La institución ha tomado parte en algún programa externo, por ejemplo, en la realización de análisis del plomo en sangre, y cuáles han sido los resultados?
268
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Si hay varios observadores, por ejemplo, entrevistadores, debería explicarse cómo serán entrenados y cómo se medirá el error intra e interobservador. ¿Se aplicarán ciegos? Los métodos de rutina de laboratorio no necesariamente deben ser descritos en detalle, pero se deberían dar referencias sobre los métodos utilizados. Si los exámenes radiográficos forman parte del estudio, se debería describir la forma en que se leerán y el criterio para los hallazgos «positivos». ¿Habrá un panel? ¿Cómo se solucionarán los desacuerdos? ¿Se leerán las radiografías en secuencia sin mostrar su ordenación? Siempre que los exámenes requieran estandarización (por ejemplo, temperatura de la habitación, ayuno, reposo en posición supina), debe mencionarse. Si ya se ha realizado un estudio piloto, se deberían resumir las experiencias si se relacionan con los métodos seleccionados o con el modo en que se llevarán a cabo las mediciones. Diremos de nuevo que los detalles son cruciales. Seguidamente se deberá discutir el control del sesgo de confusión. Siempre deben medirse los potenciales factores de confusión, pues de lo contrario no será posible su control. La identificación de tales factores requiere una gran profundización en el tema. Debemos recordar que la posibilidad de sesgo de confusión puede ocurrir incluso en grupos randomizados (pequeños). También debemos describir cómo se clasificará y reducirá la información, cómo se tratará la información que falta (por ejemplo, los que no responden) y qué criterios se seguirán para omitir datos, por ejemplo, mediciones ilógicas o claramente incorrectas. La omisión de datos es peligrosa y en general debería evitarse, pero a veces es evidente que algo ha ido mal; por ejemplo, puede haber evidencias claras de que unos sujetos han proporcionado una historia falsa, una serie de pruebas puede haber ido mal debido a fallos técnicos, etc. Existe el pleno derecho de omitir estos resultados, pero sólo según criterios preestablecidos. Esto no es lo mismo que sucumbir a la tentación de «modifican» los resultados para que cuadren mejor con la hipótesis previa del investigador. La clasificación de los datos generalmente significa la agrupación de una variable continua en categorías, tales como alta, media y baja, en cuyo caso se deberían dar criterios tentativos y puntos de corte. La clasificación también implica la definición de la dicotomía entre «normal» y «patológico». Este criterio debería preestablecerse de antemano, al menos en un sentido amplio.
PLANIFICACIÓN DE UN ESTUDIO: EL PROTOCOLO
269
Durante el proceso de datos pueden aparecer errores y debe describirse cómo se controlarán. Si hay un gran número de variables, es fácil acabar con demasiadas tablas y esto derivaría en un artículo ilegible. Debería destacarse la reducción de datos y la formación de variables de resumen. En las tablas sólo deberían mostrarse los hallazgos más importantes; de lo contrario, el autor se encontrará con dificultades para que le acepten el trabajo para su publicación. En la etapa de planificación debe restringirse la cantidad de datos que recoger. Demasiados detalles y demasiadas variables distintas midiendo la misma entidad conceptual comportan una pérdida de tiempo y de dinero sin contribuir al rendimiento del estudio. Es importante asegurarnos de que existan instalaciones de cálculo cuando se necesiten y de que existan los programas necesarios. Todo ello debería documentarse. Una consulta previa con un experto en informática permitirá asegurarnos de que los formularios empleados son adecuados para el proceso de los datos. Se deberían mencionar los métodos estadísticos que se usarán, aunque no es necesario entrar en detalles sobre los métodos de rutina utilizados. Se recomienda destacar cómo se controlará el sesgo de confusión y cómo se tratarán los errores de medición. El siguiente paso será escribir una breve discusión de los aspectos éticos (ver el Capítulo 8). Por ejemplo, ¿cómo se obtendrá el consentimiento de los sujetos y cómo se les informará? ¿Todos los exámenes son éticamente aceptables? ¿Como se garantizará la confidencialidad y cómo se almacenarán los datos de forma segura? En la etapa de planificación debe hacerse un borrador del esquema de las publicaciones y de la información que facilitar. La investigación epidemiológica no sólo interesa a los epidemiólogos y a otros profesionales, sino también a los directivos, sindicatos, empresas, fabricantes, agencias de financiación y, a veces, incluso al público en general. La información que se proporciona a los distintos grupos diana debe ajustarse para que encaje con los intereses y la capacidad de comprensión de cada uno. Vale la pena planificar de antemano cómo se difundirá la información. Los que forman parte de un estudio (los llamados «sujetos») tienen el derecho a saber, sobre todo cuando se hallan implicados exámenes médicos, no sólo sus resultados personales, sino también, al menos en términos generales, el resultado de todo el estudio. Es importante secuenciar adecuadamente en el tiempo la información. En primer lugar, a
270
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
aquellos que hayan sido examinados se les debería informar de sus propios resultados y después se debería facilitar a las empresas los resultados resumidos (sin identificación personal), así como a los sindicatos y a la agencia de financiación, y sólo después a los medios de información. Lo ideal sería que hubiera aparecido un artículo científico en una revista que dispusiera de un sistema de revisión por expertos, o al menos que hubiera sido aceptado para su publicación antes de informar a los medios de comunicación. Sin embargo, por desgracia, el procedimiento de las publicaciones científicas es tan lento que a veces resulta poco ético ocultar al público resultados urgentes durante tan largo tiempo. A pesar de ello, es importante darse cuenta de que la reputación científica de un investigador enseguida resulta cuestionable si elige la televisión como primer foro de «publicación». Se debería considerar de antemano la adecuada secuencia de información para los distintos grupos de interés.
Un gran proyecto generalmente da lugar a diferentes publicaciones científicas y puede ser útil esbozar sus contenidos previamente. En la etapa de planificación es aconsejable llegar a un acuerdo en el equipo sobre quién será el responsable, por ejemplo, el primer autor, y quiénes deberían aparecer como coautores. Por lo general es casi imposible decidir el orden de los nombres en esta etapa, porque la aportación de cada miembro del equipo en el proceso intelectual sólo puede juzgarse después de que el proyecto haya sido completado con éxito. El calendario de ejecución del proyecto debe elaborarse de forma completa, con suficiente detalle y de manera realista. El calendario se refiere a las distintas tareas y recursos —humanos, organizativos y materiales—. Se recomienda resumir las tareas y subtareas y planificar su curso en relación con tiempo, así como los recursos necesarios requeridos para cada una. Cuanto mejor se hayan elaborado los detalles del proyecto, más fácil será desarrollar el calendario previsto. Una vez que se ha decidido el número de sujetos que incluir y los métodos de examen que usar, se puede estimar de manera precisa el tiempo necesario. En la etapa de planificación de-
PLANIFICACIÓN DE UN ESTUDIO: EL PROTOCOLO
271
bemos asegurarnos de que se dispondrá de asistencia estadística e informática cuando sea necesaria, no simplemente en algún momento indefinido del futuro. El investigador además debe ceñirse a su plan original, para evitar alterar los planes de dedicación de los especialistas consultores, circunstancia que posiblemente podría afectar en cadena a otros proyectos. Ello puede significar el tener que pelear con los superiores o rechazar atractivas invitaciones a congresos. Deberíamos darnos cuenta de que el primer análisis de datos casi siempre concluye con la necesidad de realizar posteriores análisis, y éstos de nuevo concluyen en otros cálculos. Debe reservarse suficiente tiempo para todas estas consideraciones. La redacción de textos es una tarea difícil para muchos investigadores, incluso para los veteranos, así que debe reservarse el tiempo necesario para este engorroso ejercicio. También es importante asegurar de antemano que todos los miembros clave del equipo están libres y disponibles para escribir su contribución y para revisar los manuscritos, una vez que el proyecto ha avanzado hasta este punto. Cuando se redacta el calendario del proyecto siempre es prudente prever las complicaciones, cuya exacta naturaleza se suele desconocer en esta etapa. Tienden más bien a ser una regla que una excepción. Un técnico puede dejar el proyecto justo cuando se halla bien formado y cuando acababa de valorarse el error intraobservador, la entrevistadora tiene un embarazo en la mitad del proyecto cuando todo se desarrollaba de acuerdo con el esquema de tiempos previsto, el estadístico padece un ataque cardíaco dos semanas antes del análisis, el patólogo que estuvo de acuerdo en efectuar la comprobación de los diagnósticos de cáncer de repente se va durante un año, al ser destinado a la Agencia Internacional para la Investigación sobre el Cáncer en Lyon, la entrega del equipamiento indispensable se retrasa tres meses (e incluso después no funciona), etc. Justo cuando se debe redactar el informe, porque la fecha límite fijada por la agencia de financiación acaba dentro de un mes, el director del instituto decide tomarse un período sabático y el investigador principal debe actuar en su lugar. Ciertamente, no ocurrirá todo esto en cada proyecto, pero es muy frecuente que algo similar o que incluso algo más inesperado suceda en todo proyecto importante que abarque varios años. Por ello, siempre debería hacerse una previsión de medio año o más para complicaciones inesperadas.
272
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Aspectos inesperados de tipo práctico estropean casi siempre la previsión original de calendario.
La organización del proyecto debería decidirse en la etapa de planificación. ¿Quién es responsable de qué? ¿Los superiores de todos los miembros del equipo se ha comprometido realmente? ¿Todos los especialistas consultores (higienistas, estadísticos, clínicos, etc.) han acordado participar realmente? Las funciones y responsabilidades de las diversas organizaciones y personas deberían ponerse todas de acuerdo y ser descritas con suficiente detalle. El último punto del plan del estudio, aunque no el menos importante, es el del presupuesto. La comprobación de lo caro que sería el proyecto ideal a menudo viene a ser el momento de la verdad para los investigadores más optimistas. Si consideramos todos los costes reales, incluidos los salarios del personal, es sorprendente ver lo caro que resulta el proyecto que se había planeado. Se debe aceptar el hecho de que la propia institución, y no sólo la agencia que lo financia, debe aceptar el presupuesto. En esta etapa, si no antes, el investigador debe aprender a fijar prioridades. Muchas veces se pueden (o deben) evitar muchas mediciones y el investigador debe valorar atentamente la muestra que se proyecta estudiar y decidir si es demasiado extensa. En esta etapa a menudo es necesario disminuir el nivel de las pretensiones (los epidemiólogos experimentados han aprendido a hacer esto en una fase más precoz). Las evaluaciones en una etapa tardía, dictadas por severas realidades económicas, cambian con frecuencia el plan inicial del estudio, que entonces debe ser revisado a la baja. Las restricciones económicas pueden obligar a rebajar el nivel de pretensiones del proyecto. Ello debería haberse considerado ya en una etapa precoz del proceso de planificación.
Técnicamente, los gastos deben especificarse como salarios regulares (pagados por la organización central), salarios del personal temporal, costes de formación del personal, honorarios de los es-
PLANIFICACIÓN DE UN ESTUDIO: EL PROTOCOLO
273
pecialistas consultores, pagos a la seguridad social, posibles honorarios a los examinados, costes de los servicios estadísticos y de informática, costes del equipamiento, laboratorio, suministros de oficina y otros, costes del seguimiento de los sujetos perdidos, costes de correos, costes del trabajo de campo, costes de los viajes nacionales e internacionales y costes de las publicaciones. A veces también se debe incluir un presupuesto para espacios de oficina y servicios. También es importante ajustar el ritmo de los pagos de acuerdo con las correspondientes etapas del proyecto. Si los fondos proceden de una gran variedad de fuentes, se debe especificar la contribución tentativa de cada una. La experiencia nos ha enseñado que la situación resulta más sencilla si solamente hay una agencia de financiación implicada, pero los proyectos muy extensos requerirán más de una fuente de fondos. EL ESTUDIO PILOTO
A veces se implican tantas incertidumbres en la planificación de un gran proyecto que es imposible imaginarlo todo de antemano. Por ejemplo, puede ser imposible prever hasta qué punto los sujetos expuestos y sobre todo los controles se hallan dispuestos a someterse a pruebas médicas. También es difícil de predecir si el cuestionario elaborado se halla libre de ambigüedad y es comprensible para todos. Si en la población en estudio se hallan representados varios grupos lingüísticos, como es el caso de los que hablan inglés y español en los Estados Unidos, o si existe un alto porcentaje de trabajadores procedentes de varias nacionalidades como en Europa, o si hay docenas de lenguajes nativos, como en la India; en estos casos, ¿cómo se administrarán los cuestionarios? ¿Las traducciones son completamente idénticas y cómo se tratará a los analfabetos? ¿Después de todo, la entrevista es una alternativa más aconsejable (aunque más cara)? ¿Si se prevé una intervención, con cuántos sujetos voluntarios se podrá contar y cuántos de ellos permanecerán en el estudio después de un cierto período de tiempo? ¿Cuál es la mejor manera de motivar a los participantes? Es imposible contestar a éstas y otras preguntas antes de conocer cómo funciona el programa en la práctica. En tales situaciones, un estudio piloto puede determinar si el proyecto tendrá éxito o no. El prin-
274
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
cipal objetivo del estudio piloto será probar la factibilidad del proceso del estudio y de los métodos propuestos —no un adelanto de la prueba de la hipótesis del estudio en un minimaterial. Un estudio piloto ensaya la factibilidad del proyecto e intenta mejorar sus métodos; no pretende avanzar la prueba de la hipótesis del estudio en un minimaterial. Como resultado del estudio piloto, pueden cambiar los métodos elegidos, los procedimientos para la selección de sujetos pueden resultar distintos de los previstos al inicio e incluso a veces puede modificarse el objetivo del estudio. Si éste es el caso, los «resultados» obtenidos a partir del estudio piloto no se pueden combinar con los del estudio en sí, pero como ya hemos señalado, el hecho de obtener «resultados» no es de ningún modo el objetivo del estudio piloto. Su propósito es resolver problemas prácticos relacionados con la factibilidad del proyecto principal, así como mejorar su calidad. El estudio piloto puede haberse completado cuando el plan del estudio se someta a la agencia de financiación o puede constituir la primera fase del plan, en cuyo caso debe preverse llevar a cabo una posterior revisión del plan del estudio. Si el estudio piloto debe formar parte del propio plan de estudio o no, depende de si para el mismo se requieren fondos especiales. Si hay alguna duda sobre la factibilidad de un gran proyecto, por ejemplo, una intervención, la mayoría de los que revisan las solicitudes de subvenciones prefieren ver los resultados de un estudio piloto antes de recomendar la asignación de fondos. EL DIARIO DEL PROYECTO Cuando el plan del estudio ha sido aprobado por la institución tutora o se han garantizado los fondos económicos, el proyecto ya está listo para empezar. Ello no significa que el plan de estudio ya pueda ser archivado y olvidado ni que a partir de este punto lo que ocurra se resolverá intuitivamente. El plan original, en principio,
PLANIFICACIÓN DE UN ESTUDIO: EL PROTOCOLO
275
debe ser seguido (en caso contrario sería un fraude), pero como muchas cosas no suceden según se había planificado, es necesario modificar algunos puntos. Todo lo que suceda durante el transcurso del proyecto debe anotarse en el diario del proyecto. Este diario, junto con el plan aprobado, en la actualidad se puede disponer fácilmente en forma de un archivo informático. Este archivo no sólo ayuda al investigador principal a seguir la plasmación científica del plan operativo del proyecto, sino también la de sus aspectos administrativos y económicos. Antes ya nos hemos referido a los cambios en el plan original; también es importante explicar por qué se hicieron. Puede haber problemas con el acceso a los sujetos, con la recogida de datos, con la calibración de los instrumentos, con la realización de los análisis e incluso con la incompetencia de algunos miembros del equipo de investigación y los técnicos. Por ejemplo, las fechas de uso de nuevas series de reactivos, la fecha de suministro del equipamiento y las bajas por enfermedad del personal y otras ausencias, deberían ser todas registradas. Si se llevan a cabo lecturas «a ciegas», es crucial el código de identificación. Este debería hacerse secreto mediante un sistema de codificación, de manera que los miembros del equipo que actúan «a ciegas» no tengan acceso al mismo. Puede haber cambios en el programa original de proceso de datos; los resultados de algunas mediciones pueden ser tan absurdos que tengan que juzgarse como erróneos. Todo ello debe documentarse. Naturalmente, todas las mediciones crudas deberían quedar registradas y las tablas preliminares, incluso las que no se tiene intención de publicar, deben ser elaboradas y depositadas en archivos del ordenador o en un diario más convencional. Lo mismo ocurre con los registros de los métodos de control de calidad y con todos los datos científicamente menos relevantes que no vayan a ser incluidos en la publicación. Las notas detalladas son de gran ayuda cuando se prepara el borrador del informe de la investigación o cuando se tienen que contestar las difíciles cartas de algunos colegas y cuando los científicos que visitan la institución solicitan datos específicos sobre aspectos de procedimiento.
276
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
LA PUBLICACIÓN
Ningún trabajo de investigación ha finalizado hasta que no ha sido publicado. La redacción del informe es una tarea difícil para muchos investigadores, quienes preferirían iniciar su próximo estudio inmediatamente. Sin embargo, la redacción no siempre tiene que ser engorrosa. Si el plan de estudio es detallado y, por lo tanto, bueno, casi la mitad del informe ya está escrita. Si se trabaja de manera organizada, se evitan las fases caóticas típicas de los últimos meses de muchos proyectos, cuando los investigadores emplean semanas o meses para decidir qué tienen que hacer con centenares de metros de listados de ordenador, cuando no recuerdan el motivo de que sólo acudieran la mitad de los sujetos hace dos años o cuando no hallan la manera de saber cuáles eran los criterios radiológicos para el diagnóstico de fibrosis pulmonar, olvidados hace ya mucho tiempo por el radiólogo, quien, además, se ha trasladado recientemente a Hawai y no contesta a las cartas. Generalmente durante un proyecto de larga duración aumenta de forma importante la literatura sobre el tema de referencia. Ello puede influir en la interpretación de los resultados del proyecto. Si la vigilancia de la literatura ha sido sistemática y continua, el investigador estará al día y no existe el temor de que pasen desapercibidos descubrimientos de última hora que revelarían que el estudio se ha llevado a cabo según premisas erróneas. Todo ello debería haberse documentado en el protocolo del estudio. Si éste ha sido el caso, el investigador puede concentrarse en la redacción de un buen artículo sin verse entorpecido por problemas logísticos. A veces resulta difícil extraer los hallazgos realmente esenciales de un vasto montón de datos. Esta es una prueba de madurez. Aquí de nuevo vale la pena retroceder al plan de estudio y recordar cuáles eran exactamente los objetivos. Los resultados que aportan respuestas a las preguntas principales son los más vitales. Los resultados menos importantes deben suprimirse del informe principal porque solamente confunden el mensaje; a veces es justificable publicarlos posteriormente como productos derivados. Las observaciones importantes y las conclusiones no deben quedar escondidas en una jungla de información menos relevante.
PLANIFICACIÓN DE UN ESTUDIO: EL PROTOCOLO
277
Concéntrese en los resultados relevantes; no lo publique todo, ello sólo revelaría su falta de discriminación.
La sección de la «discusión» es la prueba final de madurez que demuestra la profundización y competencia del investigador. Es aquí donde los hallazgos más importantes deberían ponerse en perspectiva, donde se expone la evidencia que apoya y que contradice la literatura sobre el tema y donde se analizan todas las posibles fuentes de error capaces de haber distorsionado el propio estudio del autor (y estudios anteriores del tema). Finalmente, la «discusión» debería referir la interpretación del autor sobre el significado de los resultados presentados. Se han publicado muchos buenos libros sobre cómo redactar artículos científicos. Mi libro preferido es el de Day1, que es fácil de leer, sencillo y por ello excelente, a pesar de que trata primordialmente sobre ciencia experimental (y no sólo Medicina). Sin embargo, existen otros muchos. Todo joven investigador (y también los veteranos) debería leer al menos un par de estos libros. Todos los libros que he leído destacan la importancia de la sencillez, la brevedad y la claridad. En los artículos epidemiológicos, y quizás también en otros, la única excepción a la regla de la brevedad es la sección de «material y métodos», que debe ser bastante detallada debido a los escollos que existen en la investigación epidemiológica. Y a continuación se debe dar la oportunidad de emitir su opinión sobre la validez de la investigación a los expertos que realizan la revisión y a otros lectores. Esfuércese en la brevedad y la claridad, pero facilite suficientes detalles en cuanto a material y métodos.
Si el artículo se remite a una revista en inglés, el lenguaje empleado debe ser sencillo porque muchos de los potenciales lectores no son angloparlantes. El principal propósito de un artículo es transmitir un mensaje, no mostrar la elocuencia del autor. Los autores británicos en particular a veces usan un lenguaje que resulta
278
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
difícil incluso para los lectores americanos, por no mencionar a otros. Se debería evitar la jerga técnica (palabras o expresiones que sólo entienden aquellos que trabajan en el mismo campo). Los autores cuyo idioma nativo no es el inglés siempre deberían hacer revisar su borrador por un experto en el tema que fuese un competente lingüista nativo (el editor de origen americano de la revista de la que soy editor afirma que esto también se aplica a la mayoría de los que tienen el inglés como lengua materna). Sea sencillo, utilice un lenguaje fácil y evite la jerga técnica. Pida a un lingüista experto que revise su manuscrito.
Los aspectos formales, tales como la cumplimentación de las «Instrucciones a los Autores», un vocabulario correcto y conciso, una mecanografía nítida, una expresión numérica de calidad y, por ejemplo, los nombres alemanes, italianos, franceses y otros, correctamente escritos en la relación bibliográfica, significan mucho más de lo que muchos autores pueden imaginarse, en especial cuando la mesa del editor se halla cubierta de montones enormes de manuscritos, de los cuales sólo un tercio o menos puede encontrar espacio en la revista. También es prudente pedir a los colegas que hagan comentarios sobre el artículo antes de someterlo a la revista, pues en la ciencia existen muchos tipos de «cegueras», entre ellas la incapacidad de ver nuestros propios errores. Como afirma Day1, un artículo científico es la tarjeta de visita del investigador. La calidad de los trabajos del investigador es decisiva para su reputación en el mundo científico, y no lo simpático que es o lo divertidos que son los chistes que cuenta en las comidas de congresos. Así pues, no es necesario enfatizar demasiado la importancia de perfeccionar a fondo cualquier contribución escrita. BIBLIOGRAFÍA 1. Day, R.A. How to write and publish a scientifw paper (Philadelphia, PA: ISI Press, 1979). 2. Miettinen, O.S. Theoretical Epidemiology: Principies of Occurence Research in Medicine. (New York: John Wiley & Sons, 1985).
8 Aspectos éticos
A pesar de que los problemas éticos generalmente son característicos de los estudios clínicos y experimentales, las investigaciones epidemiológicas no se hallan libres de los mismos. Los epidemiólogos solamente se han dado cuenta de ello recientemente. La investigación epidemiológica a menudo utiliza datos de registros informáticos. El acceso a estos datos se halla regulado por la legislación que protege su confidencialidad. Debido al largo período que abarcan muchos estudios epidemiológicos, tanto los datos obtenidos de los registros como los recogidos directamente a partir del estudio de la población pueden tener que almacenarse durante largos períodos de tiempo. Los datos personales deben protegerse durante todo el período del estudio y destruirse adecuadamente al finalizar el mismo. Además, los estudios epidemiológicos se ocupan de personas, la mayoría de las cuales están «sanas», al menos al comienzo del período del estudio; someter a estas personas a exámenes clínicos presenta problemas que son muy distintos de los que se hallan en la investigación clínica con pacientes enfermos, quienes pueden beneficiarse de muchos de los exámenes. Los estudios mediante cuestionarios a menudo interrogan sobre temas que pueden ser considerados como delicados, así que debe tenerse cuidado de no dañar los sentimientos del sujeto. A continuación se discuten algunos aspectos éticos importantes. La mayoría se han seleccionado por su carácter general. Cada estudio puede además presentar problemas específicos. El estudio debe llevarse a cabo de la mejor manera posible. Una investigación pobremente planificada y mal conducida nunca será ética. Las conclusiones erróneas derivadas de un estudio deficiente 279
280
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
pueden ocasionar un sufrimiento humano considerable o pérdidas económicas (por ejemplo, debido a que no se ha identificado un carcinógeno, porque el rediseño de un lugar de trabajo se ha hecho a partir de bases equivocadas, porque se han dado prioridades erróneas a distintas mejoras higiénicas). Los resultados del estudio siempre deben hallarse a disposición de la comunidad. Esto generalmente requiere su publicación en una revista científica o al menos profesional. Si no se publican los resultados, significa que se ha abusado de los sujetos examinados y que se han desperdiciado los fondos económicos. Los propios investigadores, al empezar el proyecto, indudablemente piensan que publicarán los resultados (¿por qué si no iban a realizar la investigación?), pero si los resultados no son muy «excitantes» o si algún miembro principal deja el equipo, la redacción del informe puede quedar por hacer. A veces alguna otra persona intenta evitar o al menos retrasar la publicación. Puede ser la dirección (si la investigación se ha hecho en una empresa), los superiores en un instituto de investigación que cuenta con un sistema de revisión interna de los artículos o alguien del exterior, como las organizaciones del mercado laboral o compañías industriales. Los argumentos típicos son que los resultados son poco concluyentes, que existen errores metodológicos o que primero deben llevarse a cabo «más investigaciones». Esto no es lo mismo que decir que los errores en la ejecución del estudio o en la interpretación de los resultados no se deban corregir, pero como ningún estudio epidemiológico es perfecto, se puede abusar fácilmente de tales argumentos. La censura siempre es no ética, a menos que el motivo sea un fallo importante en el estudio. Los errores menores no son motivo suficiente para su rechazo, a condición de que los autores los discutan abiertamente. Los resultados se deberían publicar con un lenguaje y una forma que fueran comprensibles para los diferentes grupos a que van destinados. Este hecho a menudo requiere dos o más niveles de informes, uno científico y otro popular. Además, los protocolos de estudio y los datos crudos deberían guardarse durante años para que otros epidemiólogos puedan comprobar los detalles del estudio, si fuera necesario, y replicar la investigación. La interpretación de los resultados debe ser objetiva. Se debe revisar toda la literatura relevante, no sólo los artículos que concuerdan con el punto de vista del autor. Deben mostrarse todos los da-
ASPECTOS ÉTICOS
281
tos pertinentes, no sólo los «óptimos». También se deben destacar los errores y discutir abiertamente los problemas de validez. Provocar sensacionalismo en los medios de comunicación no es una manera correcta de que los investigadores serios se comuniquen con el público, sobre todo si los resultados son inciertos. Los contratos de investigación deben cumplirse de manera estricta en relación con la adherencia al protocolo del estudio, la confidencialidad de las mediciones individuales, el programa de publicaciones y el uso de los fondos. No deben firmarse contratos que limiten el derecho a la publicación libre y científica. Desafortunadamente, los estudios desarrollados en industrias no siempre garantizan una publicación libre y científica (y muchos nunca llegan a publicarse). Antes de firmar un contrato de investigación, debe llegarse a un acuerdo de cómo se tiene que informar a los medios de comunicación y de quién será dicha responsabilidad. Se debe dar información a todos los implicados sobre los objetivos del estudio y cómo se llevará a cabo. Dependiendo de la fuente de información, se requerirán descripciones escritas para los registros, las empresas, los sindicatos y las autoridades. Se debe facilitar información personal cuando el estudio implique realizar mediciones en los individuos. También se debe dar suficiente información a los lugares de trabajo implicados para que todo el mundo sepa lo que se lleva a cabo. Debe informarse exactamente a los participantes sobre los exámenes médicos que se realizarán y se explicarán sus propósitos. Es obligatorio el pleno consentimiento de los participantes. Todos deben tener la libertad de decidir si quieren o no participar. El derecho de los participantes a saber lo que el estudio puede descubrir viene regulado por la ley en algunos países. Se deben dar los resultados individuales a cada participante, preferentemente con recomendaciones sobre qué hacer (por ejemplo, «todo está bien», «contacte con su doctor», etc.). Si anteriormente se ha acordado, los resultados pueden darse de forma alternativa directamente al médico de empresa o al médico de familia. Sin embargo, por otro lado, estos resultados son confidenciales, lo que significa que el personal de gestión no debe ser informado. Los exámenes que conllevan algún riesgo o que son dolorosos o desagradables, por lo general no se consideran éticos. Por ejemplo, debido al riesgo de radiación que implican, las pruebas radiológicas se consideran actualmente no éticas en los estudios de cohortes o
282
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
transversales, en los que la mayoría de los sujetos están sanos en relación con la enfermedad de interés. Por otro lado, un examen radiológico de, por ejemplo, la columna lumbar podría hallarse justificado en un estudio de casos y controles, porque el caso está enfermo y puede beneficiarse de tal prueba. En los países nórdicos, la obtención de muestras de sangre se considera aceptable, mientras que en otros países se considera un procedimiento demasiado doloroso (o no ético por razones religiosas). Si se toman muestras de sangre, no se deberían realizar otras pruebas que las acordadas por ambas partes. Las pruebas «extra» que puedan afectar a la integridad del sujeto (por ejemplo, alcohol en sangre, anticuerpos del virus de la inmunodeficiencia humana, metabolitos de drogas) no se pueden considerar éticas bajo ninguna circunstancia sin el permiso expreso del sujeto. A menudo, éstas y otras restricciones, especialmente la exigencia de libertad ante el riesgo que posee el sujeto, restringen la selección de los exámenes adecuados en los estudios epidemiológicos, en comparación con los que se hallan disponibles en los estudios clínicos. Si en el transcurso de un estudio prospectivo se hace evidente que los niveles de exposición individuales exceden los límites de seguridad, el investigador debe tomar la iniciativa de retirar al sujeto de la exposición peligrosa, incluso aunque signifique una pérdida de información (ver el ejemplo 8, Capítulo 4). La decisión reside en el empresario, no en los investigadores, si bien éstos deben informar al representante del empresario y darle sus recomendaciones. Del mismo modo, si un estudio transversal revela riesgos para la salud, los investigadores deben actuar de manera que todos los implicados reciban una información adecuada y suficiente para permitir una acción preventiva. En la investigación en Salud Ocupacional toda intervención debe ir dirigida a la reducción o eliminación de las exposiciones perjudiciales. Si se sustituye un agente de exposición por otro, debe haber garantías de que el nuevo agente es menos perjudicial que el anterior. Si la intervención produce la finalización de la exposición a través de la transferencia de los individuos a trabajos no expuestos, la nueva tarea no debe afectar a los trabajadores económicamente causándoles una reducción de sus salarios u otros beneficios. Las intervenciones que requieran un nivel elevado de ejercicio físico deben estar bien diseñadas para que las personas con alguna
ASPECTOS ÉTICOS
283
indisposición, por ejemplo, problemas cardíacos, no se sientan perjudicadas por ello. A veces es necesario realizar un examen médico para excluir a los individuos con riesgos antes de incluir los sujetos en el programa. Los resultados de tales exámenes no deben usarse para poner en peligro la continuación del empleo de dicho sujeto. Las intervenciones llevadas a cabo en el campo de la Salud Ocupacional por lo general plantean menos problemas éticos que las pruebas clínicas, debido al requisito de que la intervención debe estar dirigida hacia la reducción de la exposición. A veces se incluyen ítems delicados en los cuestionarios y entrevistas. Es importante considerar profundamente qué preguntas son realmente necesarias y qué información es menos importante. Por ejemplo, la información sobre el uso de alcohol es importante en un estudio sobre los efectos de la exposición a disolventes en la incidencia de cáncer hepático, pero es innecesaria cuando se estudian los efectos del trabajo de fundición en la incidencia de bronquitis. Las preguntas relacionadas con rasgos neuróticos son relevantes cuando se estudia el estrés en el trabajo, pero son poco apropiadas cuando se trata de la relación entre la exposición a los pesticidas y el sarcoma de partes blandas. El entrevistador siempre debe ser considerado, hábil, paciente, amable y comprensivo. Debe proceder lógicamente y ajustarse a la capacidad intelectual de la persona entrevistada. Debe mostrar respeto por las personas entrevistadas, sin tener en cuenta cómo se comporten. No debe ser demasiado exhaustivo, especialmente cuando se entrevista a personas enfermas. Estos requisitos son de rigor y descalifican a mucha gente para ser entrevistadores. Incluso los entrevistadores con unas buenas cualidades necesitan un notable entrenamiento. Entrevistar a los parientes cercanos de personas fallecidas generalmente es una tarea delicada que requiere el máximo tacto y consideración. A ser posible, el entrevistador debería posponer la entrevista hasta que haya pasado el período de luto. Este período tarda aproximadamente un año, como media. Incluso si la entrevista tiene lugar años después, se rememoran hechos dolorosos y por lo tanto se requiere mucho tacto. También es muy exigente el hecho de entrevistar a familiares cercanos de personas seriamente enfermas, por ejemplo, padres de niños que sufren de cáncer. Los mismos familiares pueden estar mental o físicamente enfermos, es-
284
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
pecialmente el familiar más cercano de personas mayores fallecidas. El entrevistador puede no conocer su estado de salud de antemano y por ello es importante actuar con cautela. Es necesario tener en cuenta siempre los requisitos de confidencialidad. No se pueden revelar los datos individuales a personas ajenas, por ejemplo, a los empresarios. Además, debe tenerse en consideración la naturaleza confidencial de los datos de los registros y bases de datos. Debe respetarse el derecho de las empresas a mantener la confidencialidad sobre sus condiciones (por ejemplo, los resultados de las mediciones de higiene). La mayoría de los países tienen una ley sobre protección de los datos y también una legislación especial sobre los registros médicos, los beneficios de la seguridad social y los registros de las empresas. En algunos países, como Francia y Alemania, la legislación es tan estricta que es casi imposible llevar a cabo estudios de cohortes sobre mortalidad. Desde un punto de vista ético, el grupo de referencia o de control es incluso más problemático que el grupo de estudio. El motivo es que la mayor parte de los sujetos raramente se benefician al actuar como controles. Si el estudio implica exámenes clínicos, se podría considerar añadir algunas pruebas extra al programa para el grupo de control. Ello no sería relevante desde el punto de vista de los objetivos del estudio, pero podría aportar a los individuos control una información útil sobre su propio estado de salud, y así el estudio tendría más sentido para ellos. Como ejemplos de tales pruebas extra que no producen dolor, no ocasionan riesgo y pueden ser beneficiosas para los sujetos, además de no ser demasiado caras, tenemos la medición de la presión arterial, el electrocardiograma y algunas pruebas de bioquímica sanguínea, si es que se toman muestras de sangre. Estas pruebas se podrían incluir si se dispusiera de los fondos necesarios. Los estudios basados en cuestionarios y entrevistas, en los que la hipótesis del estudio no se puede revelar a efectos de evitar el sesgo de información, pueden resultar problemáticos desde el punto de vista ético. Debemos recordar también que algunos pacientes no conocen la verdadera naturaleza de su enfermedad, quizás porque su médico ha creído que no serían capaces de soportar la información. Sería un grave error revelar diagnósticos serios en entrevistas o cuestionarios (por ejemplo, si se empezase la sesión diciendo «Usted ha sido escogido para este estudio porque padece cáncer»).
ASPECTOS ÉTICOS
285
Las enfermedades específicas no se deberían mencionar. Si la entrevista se lleva a cabo en un hospital en relación con la rutina normal del centro, el paciente por lo general considera la situación menos molesta que cuando una persona totalmente extraña de repente llama al timbre de la casa o telefonea. La investigación debe ser honesta. Es triste que uno tenga que afirmar este hecho tan evidente, incluso en un texto como éste, pero se han dado varios casos de investigaciones fraudulentas durante los últimos 10 años1. Se considera deshonesto manipular los datos, aplicar métodos incorrectos de recogida de datos o de análisis, ocultar parte de la evidencia o interpretarla erróneamente a propósito. Inventarse los datos, naturalmente, también es deshonesto, pero como los estudios epidemiológicos generalmente significan un trabajo en equipo, las perspectivas de ir adelante con este tipo de fraude son escasas. Si los epidemiólogos se encuentran con situaciones en las que los intereses de las partes implicadas se hallan en conflicto (por ejemplo, los sindicatos versus los empresarios), se debe mantener un papel de experto imparcial. Recientemente, es más frecuente ver a epidemiólogos en los juicios, por ejemplo, sobre temas relacionados con indemnizaciones legales por posibles enfermedades ocupacionales o en audiencias públicas, por ejemplo, cuando se valoran nuevas propuestas para estándares o normas. Este es un tema realmente complicado. Mientras el epidemiólogo sea honesto, esta práctica es justificable. Sin embargo, usualmente el epidemiólogo representa a una de las partes y la imparcialidad no es posible. Ha habido muchos ejemplos de mala conducta en tales situaciones; probablemente lo peor es la desacreditación sistemática de las investigaciones de los otros, magnificando los errores que siempre pueden encontrarse en los estudios epidemiológicos. La interpretación unilateral de los datos científicos es otro ejemplo. En resumen, el investigador debe asegurarse de que el estudio no perjudique de ninguna manera a los individuos, sea física, psicológica o económicamente. Los sujetos deben estar completamente informados sobre los objetivos y métodos del estudio, su participación debe ser voluntaria y se les debe informar sobre sus resultados personales. La ciencia mala nunca es ética. Hoy en día existen comités éticos en la mayoría de las instituciones y deben dar su aprobación antes de empezar cualquier proyecto. Ello propor-
286
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
ciona al menos ciertas garantías de una investigación ética. Sin embargo, no hay nada que impida a los epidemiólogos «prostituirse» a sí mismos en tribunales y audiencias. BIBLIOGRAFÍA 1. Smith, J. «Preventing fraud», Br. Med. J. 302:362 (1991).
9 Algunas pautas para la interpretación de los estudios epidemiológicos INTRODUCCIÓN El resultado de un estudio epidemiológico puede reflejar una asociación verdadera, ser debido al azar o estar sesgado. El investigador debe ser capaz de evaluar cuan «cierto» es el resultado obtenido. Además, el lector del informe del investigador debería ser capaz de juzgar qué alternativa es la más probable. Este capítulo ofrece algunas pautas para la evaluación crítica de los resultados de un estudio epidemiológico. La interpretación de un estudio va más allá de la simple comprobación de si los resultados son «correctos». En la ciencia, el objetivo final es ir de lo particular a lo abstracto-general. Así que la experiencia conseguida mediante un estudio no es interesante como tal; solamente debería considerarse como un medio para complementar o cambiar la propia visión abstracta sobre la naturaleza de las cosas5. La interpretación de un estudio aislado radica fuertemente en el juicio individual. Los expertos pueden estar en desacuerdo sobre si los resultados de un estudio son válidos o no, sobre su sentido, por no hablar de las generalizaciones científicas en que puede derivar. Por esto los autores de un artículo deberían ser muy cautelosos de no mostrar a los lectores su punto de vista como la única verdad; en cambio, deben proporcionar a los lectores una oportunidad imparcial para que se formen su propio e independiente juicio. Esta oportunidad se establece mejor al facilitar a los lectores el acceso a los mismos datos relevantes que llevaron al autor a elaborar sus conclusiones. De aquí que es importante que el artículo 287
288
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
presente los detalles pertinentes, además de ser conciso y bien redactado. El punto de vista posterior de una persona se compone de su punto de vista anterior y la, en comparación, pequeña cantidad de información nueva que pueda haber aportado un estudio en particular. Esta es la verdadera razón de que la síntesis de información sea subjetiva; el punto de vista previo es, con mucho, el componente más importante en el conocimiento a posteriori. Es bien conocido que los expertos a menudo están en desacuerdo en materias científicas, a pesar de que su información procede de las mismas fuentes documentales. Por ello, a menudo prevalecen dos o más puntos de vista paralelos y, contrariamente a lo que se cree a menudo, estos «puntos de vista que prevalecen» son subjetivos, pues se han formado a partir de juicios y síntesis hechos por seres humanos. No hace falta decir que la profundización en el tema es necesaria para cualquier interpretación competente de un estudio. Casi tan importante es la comprensión de los principios epidemiológicos y de la inferencia científica en general. Sin embargo, la mera comprensión de los métodos epidemiológicos, aunque es extremadamente importante, no es suficiente como para ir más lejos de una evaluación puramente técnica de lo que es correcto e incorrecto en un estudio concreto. Si el punto de vista previo del lector sobre el tema científico es incompleto y confuso, el punto de vista posterior también será poco claro, a pesar de una evaluación técnicamente perfecta del artículo en cuestión. De acuerdo con el pensamiento estadístico convencional, los resultados de un determinado estudio se deberían interpretar independientemente del conocimiento previo, en otras palabras sin dejar que el conocimiento anterior influya en las conclusiones sobre si los resultados son correctos o no. Sin embargo, en la vida cotidiana nadie ignoraría una experiencia previa en la adopción de decisiones, así que, ¿por qué no tiene que hacerse lo mismo en la actividad científica? El pensamiento bayesiano ofrece una alternativa al punto de vista convencional «frecuentista». Bayes era un clérigo y matemático que vivió en el siglo XVIII. Estudió las probabilidades condicionales y formuló un teorema que describía sus relaciones. La esencia del teorema de Bayes, cuando se aplica a la Epidemiología, es que
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
289
siendo correcta la hipótesis del estudio, la credibilidad posterior u odds es el producto de la odds previa y la razón de verosimilitud (RV). En otras palabras, Odds posterior = odds anterior x razón de verosimilitud En general, la razón de verosimilitud es el cociente de las probabilidades de que una asociación observada sea consistente con la hipótesis del estudio (HA, o alternativa) o con la hipótesis nula (Ho). De aquí que,
donde P significa probabilidad y / denota «condicionado a». El problema de la estadística bayesiana radica en la dificultad para definir una credibilidad previa, especialmente cuando no hay información a priori. La credibilidad previa depende de la síntesis de toda la evidencia disponible, sea epidemiológica, experimental o teórica, y el resultado de tal síntesis es subjetivo. Además, el cálculo de la credibilidad posterior a menudo es complicado, sobre todo cuando se implican muchos parámetros. El pensamiento bayesiano es diferente del enfoque «frecuentista», según el cual el resultado de un estudio particular se contrasta y evalúa independientemente de los estudios previos. Sin embargo, ningún científico sensato ignoraría todos los conocimientos anteriores ni efectuaría la interpretación de un estudio científico basándose meramente en el estudio. Como afirma Miettinen5 «... la evidencia documentada no representa el resultado final del estudio. Como el objetivo es aprender acerca de cantidades abstractas y relaciones, el resultado real del estudio podría tomarse como el punto de vista sobre el objeto abstracto al que conduce el estudio o como el cambio en el punto de vista aportado por el estudio» (pág. 107). Si se está de acuerdo con esta afirmación, entonces un «resultado» significa mucho más que una diferencia estadísticamente significativa obtenida a partir de un conjunto de datos.
290
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
En la ciencia, el «punto de vista que prevalece» por lo general es subjetivo.
COMPROBACIÓN DE LA VALIDEZ
El lector no puede evaluar un estudio a menos que los autores hayan descrito su diseño, material y métodos de manera suficientemente detallada. De hecho, la sección de material y métodos debería ser tan detallada que otro investigador competente pudiera replicar el estudio a partir de la descripción del autor (ver el Capítulo 7). Si el artículo sólo contiene descripciones superficiales, incompletas o pobres de los materiales y métodos, el lector no podrá evitar pensar que los autores son indolentes, incompetentes o ambas cosas. A veces los autores evitan entrar en detalles a propósito de las razones por las que saben que el estudio tiene fallos. Independientemente de los motivos de un informe deficiente, tales artículos científicamente no son informativos. El lector puede evaluar un estudio sólo si los investigadores proporcionan descripciones suficientemente detalladas de su diseño, materiales y métodos.
En general, los lectores no tienen ni tiempo ni motivación para examinar cada artículo en profundidad. La mayoría de la gente sólo lee el resumen. Sin embargo, bajo ciertas circunstancias, la literatura científica se debe analizar con gran detalle. Se requiere una lectura profunda, por ejemplo, cuando se reúne la base científica necesaria para establecer estándares higiénicos y otras regulaciones. Además, la clasificación de las sustancias químicas en diferentes categorías de carcinogenicidad solamente se puede hacer después de un cuidadoso examen de todos los artículos pertinentes. La aceptación de artículos para su publicación en revistas científicas depende en gran medida de las recomendaciones que proporcionan los que revisan los manuscritos. Una revisión realizada por exper-
ALGUNAS PAUTAS PAR A LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
291
tos presupone una lectura a fondo. Cuando se realizan tales evaluaciones críticas, siempre es útil proceder de manera ordenada (véase también el Capítulo 7). Las siguientes directrices deberían ayudar a los lectores a realizar una aproximación sistemática a un artículo científico: 1. Debemos fijarnos en quiénes son los autores y de qué institución procede el artículo. Desafortunadamente, los investigadores no son todos iguales; una buena reputación científica ofrece cierta (aunque no completa) garantía de que el estudio es bueno. 2. El diseño del estudio debe ser apropiado y eficiente. Los estudios de enlace de registros crudos, por ejemplo, son menos concluyentes que los detallados estudios de cohortes. Los estudios de casos y controles son ineficientes cuando la exposición es rara en la base del estudio, y lo mismo ocurre con los estudios de cohortes si el resultado es raro. 3. A pesar de que hoy en día en los artículos no se recomiendan las extensas revisiones de la literatura, el lector debe asegurarse de que los autores han citado la literatura de una manera equilibrada. Este equilibrio no significa que se deban mencionar todos los artículos malos, sino que se deben citar los puntos de vista que se hallan en conflicto con los de los autores, si es que existe tal documentación. 4. Los objetivos del estudio deberían estar formulados de forma clara y también debería ser fácil comprobar si los autores han tenido éxito en alcanzarlos. Es importante distinguir entre un estudio cualitativo y uno cuantitativo y deberíamos estar seguros de que los autores lo han tenido en cuenta. 5. El lector debe ser capaz de juzgar qué hipótesis previa pretende probar el diseño del estudio o si el estudio fue sólo exploratorio. ¿La hipótesis fue formulada de manera que se podía comprobar? 6. La sección de material y métodos debería contener una definición clara de la base del estudio. El artículo debe mostrar lo frecuente que era el fenómeno en estudio en tal base. Partiendo de esta información, el lector puede juzgar si el tamaño de la muestra fue suficiente o no. Los grupos expuestos y de referencia deben describirse de manera detallada y completa (Capítulo 7). Se debe considerar, en especial, si la muestra fue representativa de la categoría que debía representar (Capítulo 5). Si la población general fue la categoría
292
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
7.
8.
9.
10.
11.
de referencia, se deberían señalar las razones, si es que las hubiera. ¿De qué manera esta selección ha debilitado la inferencia derivada del estudio? Los métodos de recogida de datos deberían estar tan bien descritos que el lector pudiera señalar fallos, si es que los hubiera. Además, los métodos de medición, los criterios de anormalidad y otros criterios diagnósticos deberían describirse de forma clara. Se debe evaluar la validez del estudio. El lector debe disponer de información suficiente para valorar la comparabilidad entre los grupos examinados, por ejemplo: cómo fueron selecionados los sujetos para el estudio y si permanecieron en él; si la información era asimétrica; si se controlaban los métodos y cómo; y cuáles eran los métodos para controlar el sesgo de confusión. La posibilidad de una clasificación errónea no diferencial se debería considerar en los estudios con resultados negativos. El análisis estadístico debe ser correcto. Los lectores médicos generalmente necesitan el consejo de un estadístico competente para tal evaluación. Una interpretación completa de las pruebas es igualmente importante. Una excesiva confianza en los meros valores de p no indica una excesiva profundización científica. Es importante considerar si los resultados principales están en concordancia o en conflicto con el punto de vista que prevalece (o con cuál de ellos, si hay varios). Si se hallan en conflicto, ¿cuál podría ser el motivo? Finalmente, el lector debería juzgar cómo los autores interpretan sus resultados. ¿Sus conclusiones son buenas o van demasiado lejos? ¿Es posible estar de acuerdo con el razonamiento del autor?
Incluso si no se han controlado totalmente los errores sistemáticos, no por eso el estudio tiene que ser un fracaso total. Es importante considerar la dirección y fuerza de tales errores. Los sesgos menores no necesariamente invalidan un estudio, especialmente si se puede evaluar su efecto cuantitativo. Debemos recordar que el sesgo de confusión y otros errores sistemáticos no siempre magnifican el efecto, como piensa mucha gente. Igualmente, pueden enmascarar o reducir un efecto verdadero. Los buenos epidemiólogos generalmente señalan los posibles errores de sus estudios y discuten
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
293
sus efectos. A menudo un estudio puede aportar información útil a pesar de alguna limitación menor. La generalización requiere que la validez interna sea como mínimo razonable; en caso contrario el estudio carece de sentido. Debe distinguirse claramente entre la generalización concreta de la muestra a la población, que se realiza a partir de los resultados de las encuestas descriptivas, y la generalización científica hacia lo abstracto-general, que es el objetivo de los estudios etiológicos. Los resultados que pueden modificar los puntos de vista que prevalecen son especialmente interesantes, pero la búsqueda de explicaciones alternativas (sesgos, errores aleatorios) debe ser más intensa de lo normal, debido a la baja credibilidad previa del resultado. SIGNIFICACIÓN ESTADÍSTICA Nos hemos referido a la significación estadística muchas veces y el valor de p se ha presentado brevemente en el Capítulo 5. En este apartado se facilitan algunas directrices para la interpretación de la significación estadística. Las pruebas de significación se aplican para valorar formalmente la probabilidad de que el resultado de una comparación obedezca a la hipótesis del estudio o la deniegue (la hipótesis nula). Esta probabilidad generalmente se resume como el valor de p. Convencionalmente se acepta que, bajo la hipótesis nula (es decir, a condición de que no exista ningún efecto verdadero), los valores de p expresan la probabilidad de que la «verdadera» diferencia sea más extrema que la observada. Sin embargo, la magnitud de la diferencia no ha sido formulada en ninguna hipótesis de estudio; además, la misma diferencia produce un valor de p bajo en una muestra extensa y un valor de p más elevado en una muestra pequeña. Si usamos el lenguaje convencional, puede decirse que el mismo resultado hubiera sido «significativo» para una muestra grande y «no significativo» para una muestra pequeña. Así que no sólo la magnitud de la diferencia, sino también la cantidad de información de los datos determina el valor de p (ver el Capítulo 5). Si se trata de una muestra pequeña, la estimación puntual del RR varía aleatoriamente dentro de unos límites amplios y el valor de p también contiene escasa información. Diremos que tal estudio
294
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
es no informativo. Si, por otro lado, la muestra es muy extensa, incluso una mínima diferencia origina un valor de p muy pequeño. Esta diferencia tan pequeña no tiene significado biológico, además puede aparecer fácilmente a partir de un leve sesgo de confusión indetectado o de otros sesgos. Así que en estudios muy extensos el valor de p no aporta demasiada información. Puede decirse que el valor de p es demasiado sensible para ser útil en los estudios muy extensos. Tales resultados deberían analizarse mejor de manera cuantitativa mediante la estimación de los intervalos de confianza, y no de modo cualitativo únicamente mediante las pruebas de significación. Ejemplo 1. Supongamos que la mortalidad acumulada en un estudio de seguimiento, que comprende 1.000 sujetos expuestos y 1.000 controles, es del 10%. En este estudio un RR = 1,5 es estadísticamente significativo (p = 0,01). El mismo grado de significación requiere un RR = 11 en un estudio que comprenda sólo 50 sujetos expuestos y 50 no expuestos. Supongamos además que el tema es el efecto de la exposición a cromatos en el cáncer de pulmón. A partir de las tablas 2 y 3 (Capítulo 5), se puede observar que el sesgo de confusión debido al tabaquismo podría explicar el RR del estudio más grande. Contrariamente, un sesgo de confusión indetectado, desfuerza suficiente para causar un RR de 11, sería imposible. Un RR = 1,5 en el estudio más pequeño estaría lejos de ser significativo y un RR = 11 sería, naturalmente, muy significativo de forma convincente en el estudio más extenso. En el estudio pequeño un RR = 11 no aportaría mucha información cuantitativa debido al amplio intervalo de confianza, mientras que un RR = 1,5 en el estudio extenso es tan estable que incluso se puede valorar la fuerza del efecto en términos cuantitativos. El valor de p puede interpretarse mucho mejor en los estudios de tamaño medio. Las diferencias biológicamente insignificantes no
originan valores de p bajos y la variación aleatoria del estimado del RR es razonable. Además, una leve invalidez no provoca valores de p muy pequeños. Un valor de p muy pequeño obtenido de un estudio de tamaño medio es más compatible con la hipótesis del estudio que con su negación; intuitivamente apoya la hipótesis del estudio. Un valor de p pequeño, digamos de 0,10 a 0,20, ca-
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
295
rece de sentido porque no discrimina entre la hipótesis nula y la hipótesis del estudio, mientras que un valor p intermedio o grande apoya la hipótesis nula. La expresión «intuitivamente» se usa a propósito porque no existen definiciones precisas para términos como «grande», «pequeño» o «muy pequeño». Esto es debido tanto a la cantidad de información (el tamaño del estudio y lo frecuente que es el fenómeno) como al valor numérico de p. Los límites de significación usados habitualmente (por ejemplo, 0,05) son arbitrarios, como se explica en el Capítulo 5. La mala práctica de «aceptan) mecánicamente o de «rechazan) la hipótesis del estudio (o la hipótesis nula) simplemente si p < 0,05 o p > 0,05, como desafortunadamente se hace a menudo, revela una falta de profundización científica. La elevada sensibilidad de los valores de p derivados de los estudios extensos no debería llevarnos, naturalmente, a descartar dicha información como poco importante. Al contrario, los estudios extensos proporcionan estimaciones cuantitativas fiables del verdadero RR, porque el estimado es más estable cuanto más extenso es el estudio. Por lo tanto, en los estudios extensos, el RR y su intervalo de confianza, no el valor de p, aportan información relevante. De aquí que, especialmente en esta situación, se debería efectuar la estimación del intervalo más que un contraste de hipótesis cualitativo. En los estudios grandes el estimado del riesgo relativo es informativo, mientras que el valor de p no lo es. En los estudios de tamaño intermedio el valor de p es informativo. En los estudios pequeños, ambos son no informativos.
Como norma existen varias alternativas para el análisis estadístico de los datos. Generalmente, los investigadores, o mejor dicho sus consejeros estadísticos, prefieren las pruebas que tienen más potencia para discriminar entre la hipótesis del estudio y la hipótesis nula. Desafortunadamente, muchas veces se usan pruebas equivocadas cuyas asunciones no se cumplen en los datos. Además, el lector debe ser capaz de juzgar si se han aplicado las pruebas estadísticas correctas. Por lo tanto, debe proporcionarse el es-
296
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
tadístico del cual se ha derivado el valor p, y no el simple valor de p; a veces incluso se hace peor, pues sólo se indica que el resultado fue «significativo». Además, el autor debería mencionar si se ha utilizado una prueba unilateral o bilateral. Una prueba unilateral asume que el efecto tiene una sola dirección, mientras que una prueba bilateral valora tanto efectos causales como preventivos. Generalmente se usan las pruebas bilaterales indiscriminadamente. Una hipótesis etiológica pocas veces tiene dos direcciones; sería como postular que una exposición puede ser tanto perjudicial como preventiva. La mayoría de las hipótesis causales adoptan la fórmula de que la exposición A causa la enfermedad B, o que la enfermedad B tiene su causa en las exposiciones A y C (ver el Capítulo 1). Las hipótesis preventivas afirman que la exposición A (por ejemplo, la dieta) previene la enfermedad B o que una reducción de la exposición C previene la enfermedad B. Se trata claramente de hipótesis unidireccionales y, por lo tanto, no tiene sentido contrastar la otra vertiente mediante un cálculo de valores bilaterales de p. Por otro lado, en los ensayos clínicos debería usarse un contraste bilateral porque usualmente no existe ninguna evidencia previa cierta de que el nuevo tratamiento sea más eficiente que el usado convencionalmente. También se deberían usar estas pruebas bilaterales en los llamados estudios «exploratorios» sin una hipótesis previa. Habitualmente, las pruebas unilaterales son las más apropiadas en Epidemiología Ocupacional porque esta disciplina investiga hipótesis etiológicas, según las cuales el efecto biológico posee una sola dirección (por ejemplo, la exposición al asbesto causa carcinoma bronquial). Los valores de p de las pruebas unilaterales por lo general se considera que son el doble de «sensibles» que los valores correspondientes de las pruebas bilaterales; estos últimos se obtienen habitualmente de la tablas estadísticas. Un valor de p unilateral puede obtenerse simplemente dividiendo por dos el valor de p bilateral listado en la tabla. Sin embargo, cuando se decide en favor de un contraste de hipótesis unilateral, es importante que la diferencia observada se encuentre en la dirección hipotética. Si no fuera así, el valor unilateral de p sería incorrecto. Si, por ejemplo, los datos proporcionan un efecto protector en lugar de uno perjudicial, es mejor no dar ningún valor de p, sino sólo afirmar que el resultado no se observó en la dirección esperada. Naturalmente, la interpretación de un estudio no debe recaer demasiado en si se ha al-
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
297
canzado un nivel arbitrario de significación o no. Sin embargo, el hecho de usar un valor de p unilateral en lugar de uno bilateral puede cambiar formalmente un resultado «no significativo» en uno «significativo» (por ejemplo, p = 0,03 en lugar de 0,06). Los investigadores con buena visión epidemiológica no acostumbran a dicotomizar de esta manera. Pero existen muchos tipos de lectores de los estudios epidemiológicos. Si la significación estadística se considera algo central para el juicio científico, el autor debería al menos proporcionar el tipo de valor de p correcto. De todas maneras, en los textos epidemiológicos podría prescindirse perfectamente del término «estadísticamente significativo». En lugar de usar este cliché, los autores deberían mencionar el estadístico utilizado, proporcionar el valor exacto de p y finalmente afirmar si es uní o bilateral. Este sistema debería permitir a cada lector elaborar su propio juicio sobre el grado de significación del resultado. Los valores unilaterales de p son apropiados para el contraste de hipótesis unidireccionales.
Como ya hemos dicho, en Epidemiología Ocupacional en general se prefiere la estimación cuantitativa del intervalo al contraste cualitativo de hipótesis. Además, en la presencia de errores sistemáticos, tales como el efecto del trabajador sano, una prueba de significación no tiene sentido. Incluso puede llegar a ser errónea si se interpreta acríticamente. Este problema surge, especialmente, cuando se compara la mortalidad de una cohorte expuesta a la de la población general (Capítulo 5). Estos resultados no se deberían expresar en términos de significación estadística; desafortunadamente, dichos términos aún se usan con demasiada frecuencia. El intervalo de confianza para el estimado del RME aporta una información más adecuada. Muestra dentro de qué límites se localizará el parámetro verdadero sin implicar falsamente si se ha obtenido, a partir de una comparación válida, un resultado «significativo» o «no significativo», que es la impresión que dan los valores de p a los lectores poco familiarizados con el tema. Según el pensamiento estadístico «frecuentista» convencional, en la interpretación de los resultados debe tenerse en cuenta el nú-
298
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
mero de comparaciones realizadas simultáneamente. Por definición, a un nivel del 5%, uno de cada veinte resultados de las pruebas es «significativo». Por ello se dice que, si se hacen suficientes comparaciones, algunas pruebas automáticamente serán significativas aun sin tener ningún sentido biológico. La constelación de muchas comparaciones simultáneas, que dan lugar a varios valores de p «significativos», se conoce con el nombre de fenómeno de la multisignificación. Formalmente, según esta manera de pensar, si se contrastan estadísticamente n asociaciones independientes, la probabilidad de que al menos una de ellas resulte significativa es 1(1 -alfa)", suponiendo que todas las hipótesis nulas sean verdaderas. Esta forma de razonar implica que existe una hipótesis nula «universal», según la cual nada se halla interrelacionado. Este sistema de razonar no ha sido refrendado por la ciencia empírica10. Es evidente que, desde el punto de vista de una hipótesis determinada, es totalmente irrelevante el hecho de saber cuántas comparaciones no relacionadas entre sí se llevan a cabo al mismo tiempo5. Por ejemplo, para probar la hipótesis de que la exposición al benceno causa leucemia (y suponiendo que se ha encontrado una asociación positiva), es totalmente irrelevante si se investigan veinte, diez o ningún otro elemento químico en el mismo estudio. Lo que realmente importa es la credibilidad de la hipótesis previa, no el número de comparaciones. Sin embargo, si las hipótesis están relacionadas, la situación es distinta; tales hipótesis deben examinarse conjuntamente. Por ejemplo, si la exposición al plomo disminuye la velocidad de conducción de un nervio, probablemente también lo hará en otros. Así que la probabilidad de encontrar al menos un caso de disminución «significativa» aumenta en función del número de nervios que se examinen. El contraste estadístico de una hipótesis particular es independiente del número de comparaciones no relacionadas que se realizan a partir de los mismos datos.
Por otro lado, si en un estudio exploratorio se hacen muchas comparaciones sin ninguna hipótesis previa, puede originarse una situación de multisignificación. Esta constelación debe diferen-
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
299
ciarse de un estudio que ha sido diseñado primordialmente para examinar una hipótesis determinada, pero en la que además el investigador saca partido de los datos adicionales recogidos, examinando también otras asociaciones. Por ejemplo, el enlace de un registro de cáncer con los datos ocupacionales de un censo anterior, de hace 10 años, sería un estudio exploratorio. Sin embargo, incluso en tal constelación, algunas asociaciones tendrán una credibilidad previa más elevada que otras y la interpretación no podrá recaer simplemente en los valores de p. En el contraste de hipótesis, el pensamiento estadístico convencional también distingue entre las hipótesis previas, aquellas que el investigador ya tenía en mente antes de iniciar el estudio, y las hipótesis sugeridas por los datos o nuevas hipótesis surgidas al examinar los datos. Se habla, respectivamente, de estudios de «prueba de hipótesis» y de «generación de hipótesis». Dentro de la misma línea, se dice que los datos que fueron usados inicialmente para la generación de hipótesis no pueden usarse para la prueba de la misma hipótesis. En otras palabras, debe usarse material nuevo para tales propósitos. Los epidemiólogos bayesianos no están de acuerdo con este punto de vista5. Una firme adhesión a dichos principios perjudicaría a la investigación epidemiológica. A menudo un determinado estudio, iniciado para probar cierta hipótesis, aporta una gran cantidad de información secundaria sobre el mismo tema. Por ejemplo, un estudio de cohortes sobre la relación entre la exposición al arsénico y el cáncer de pulmón también mostrará un exceso de otras formas de cáncer y de enfermedad coronaria, sin que existan unas hipótesis previas bien formuladas. Obviamente, pocos investigadores se abstendrían de examinar tales resultados. Además, cuando se evalúa una evidencia previa, formal o informalmente, sea mediante un meta-análisis o por intuición, apenas se distingue entre los estudios de generación de hipótesis y los estudios históricos de prueba de hipótesis. La evidencia aportada por los datos es independiente del conocimiento que tenga cualquier persona antes de conocer los datos. Si la credibilidad previa fuera baja, entonces el resultado cambiaría dicha credibilidad sólo marginalmente. Si, por otro lado, una reflexión atenta a la luz de los nuevos datos detectara que la evidencia previa fue valorada erróneamente, entonces la credibilidad previa revisada será mayor, tal como ocurre con la credibilidad posterior5. Sin embargo, la experiencia muestra que las
300
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
hipótesis sugeridas por los datos generalmente son erróneas, mientras que las hipótesis previas habitualmente son correctas. El contraste estadístico presupone la ausencia de errores sistemáticos. Ninguna prueba de significación puede discriminar entre una diferencia verdadera y otra provocada por sesgo. Si la validez del estudio es baja, la prueba estadística no tendrá sentido y será errónea. El constraste estadístico carece de sentido si existen errores sistemáticos.
ERRORES POSITIVOS Y NEGATIVOS Los errores sistemáticos y las conclusiones equivocadas pueden situarse tanto en una dirección positiva como negativa. La positividad/negatividad no es un todo o nada, sino un continuo. Debido a que contienen sesgo o por una mala interpretación, unos resultados que realmente son ligeramente positivos pueden resultar medianamente o fuertemente positivos, o al contrario ligeramente o medianamente negativos (en este caso «ligeramente» negativo indica que no se desvía significativamente de la unidad, y «medianamente» como significativamente menor que la unidad, pero no mucho). La forma habitual de razonar en términos de blanco y negro, probablemente procede del mal hábito de distinguir los resultados como estadísticamente significativos (= positivos) o no significativos (= negativos), siempre en base a unos puntos de corte arbitrarios de los valores de p, y olvidándonos de que los errores sistemáticos no se pueden valorar mediante el contraste de significación estadística. En la siguiente discusión sobre los resultados «falsos positivos» y «falsos negativos», debe tenerse en cuenta la naturaleza continua de la escala positividad/negatividad. Resultados falsos positivos
Los motivos más frecuentes para los falsos positivos son, aparte del azar, los sesgos de información y de confusión; también los ses-
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
301
gos de selección pueden producir un resultado falso positivo. Los estudios extensos se pueden interpretar deficientemente si se concede demasiada importancia a la significación estadística, porque incluso sesgos menores pueden comportar valores de p pequeños. En los estudios más pequeños, la significación estadística requiere una diferencia mucho más amplia. Por lo tanto, si la diferencia ha de verse influida por los errores sistemáticos, estos errores deben ser tan sustanciales que han de ser muy evidentes. En los estudios de casos y controles el motivo más conocido de resultados falsos positivos es el sesgo de información. Este sesgo tiene lugar si los casos recuerdan hechos pasados mejor que los controles, o si el entrevistador interroga a los casos de manera más intensa (ver el Capítulo 5). Generalmente se asume que el sesgo de información invalida fácilmente los estudios de casos y controles, al basarse en datos anamnésicos. Sin embargo, la fuerza de dicho sesgo depende seguramente del tipo de temas sobre los que se interrogue, más que de ninguna regla general (ver el Capítulo 5). La verdad es que si ocurre tal sesgo, es más probable que sea positivo que negativo. Sin embargo, en Epidemiología Ocupacional existe poca evidencia empírica de la presencia de dicho sesgo, y si bien el recuerdo es difícil, algunos temas se rememoran con diferente detalle1. Esto no quiere decir que el recuerdo de las personas entrevistadas sea preciso, que no lo es, sino que la tendencia a un recuerdo asimétrico de los casos y controles no ha sido demostrada empíricamente de forma convincente. El sesgo de selección también puede causar resultados falsos positivos en los estudios de casos y controles. Tales errores pueden surgir cuando la exposición bajo estudio influencia la selección de los casos y controles en la investigación. Los estudios de casos y controles en pacientes hospitalizados pueden ser especialmente problemáticos. Además, la predisposición a contestar cuestionarios o entrevistas puede ser distinta en los casos y en los controles. Si los porcentajes de respuesta son muy diferentes, las conclusiones deben elaborarse con cautela. Los autores del artículo deberían documentar en qué aspectos los que no respondieron difieren de los que sí lo hicieron. Sin tener este tipo de información, el lector no puede evaluar los resultados. Los errores causados por diferencias en los porcentajes de respuesta, naturalmente, también pueden ser negativos.
302
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
En los estudios cohortes, el sesgo de confusión probablemente es una fuente de error más importante que los sesgos de selección y de información por lo que se refiere a resultados falsos positivos. Sin embargo, el sesgo de confusión generalmente tiene una dirección negativa, al menos cuando se comparan cohortes ocupacionales con la población general. Las exposiciones ocupacionales concomitantes o previas pueden introducir un sesgo de confusión en el estudio de las enfermedades relacionadas con el trabajo, incluso más que el tabaquismo u otros factores del estilo de vida. Una base del estudio distorsionada o sesgada puede llevar a una conclusión falsamente positiva. La base del estudio contiene sesgo cuando no es representativa del ámbito del estudio. Son ejemplos de esta situación: ser miembro de la base en función o dependiente del resultado (ver el ejemplo 2), finalizar el seguimiento en función del resultado (por ejemplo, cuando ya han ocurrido «suficientes» casos), investigar más profundamente la base de datos en función de los resultados (por ejemplo, un análisis más completo de lo normal en cuanto a hallazgos «interesantes») y efectuar una publicación en función de los resultados (los resultados positivos interesantes se someten a publicación, mientras que los resultados negativos nunca se documentan). Ejemplo 2. En un estudio sobre una enfermedad hepática ocupacional, el material básico estaba compuesto por 800 pacientes a quienes se había realizado una biopsia hepática11. Se seleccionaron especímenes de los 23 pacientes que habían estado «expuestos a agentes químicos» y que habían sido remitidos a biopsia debido a unos resultados anormales elevados en las pruebas de función hepática. Como era de esperar, los investigadores encontraron una notable variedad de anormalidades estructurales no específicas al aplicar métodos sofisticados de estudio, como la microscopía electrónica. No se utilizó ningún grupo de referencia. Los autores concluyeron que la exposición química fue la causa de las anormalidades encontradas. Está claro que las anormalidades estructurales deben encontrarse en una serie de pacientes seleccionados de esta manera. (¿Por qué se realizó una biopsia hepática si no fue porque se sospechaba una enfermedad hepática?) Además, como en el material de origen había sujetos que habían tenido, a la vez, enzimas hepáticas anormales (la mayoría) y exposición a agentes químicos, era inevitable que existie-
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
303
sen sujetos con ambos atributos por mera coincidencia. Por lo tanto, algunos de los «expuestos», realmente también debían haber tenido anormalidades. Cualquier actividad ocupacional, incluso el trabajo en una oficina, puede ser incriminada de hepatotoxicidad -y tóxica para cualquier órgano diana- si la base del estudio está sesgada en dicho sentido4. La literatura en conjunto también puede hallarse sesgada positivamente. Esta posibilidad tiene que ver con lo mencionado anteriormente sobre el hecho de que el éxito o fracaso de la remisión de manuscritos a revistas científicas depende de los resultados, y también de que los editores en general, realmente, prefieren los hallazgos positivos sobre los negativos. La mente humana encuentra más «excitantes» los hallazgos positivos que los negativos, y claro, ni los editores ni los consultores son excepciones. El peor aspecto del sesgo de publicación es que, en especial, las revistas consideradas como las mejores también sucumben a esta tentación, debido a que poseen una extensa selección de manuscritos y una tasa de rechazos más elevada que otras publicaciones menos prestigiosas. Los primeros informes de un fenómeno pueden resultar especialmente sesgados hacia la dirección positiva debido a estas circunstancias. Ejemplo 3. Consideremos un acumulo aleatorio de malformaciones congénitas que ocurre en un pequeño grupo de mujeres trabajadoras. Supongamos también que el acumulo resulta ser estadísticamente significativo (p < 0,01). Tal hallazgo puede llegar fácilmente a los medios de comunicación. De hecho esta situación ocurrió hace algunos años. Grupos reducidos de mujeres, que trabajaban en terminales de video en distintas compañías de Norteamérica, dieron a luz a un número inesperadamente elevado de niños con malformaciones congénitas varias. Estos resultados se publicaron básicamente en los periódicos, pero causaron cierta sensación. Varios años más tarde no se ha encontrado ninguna explicación biológica de por qué el trabajo con terminales de video podría ser teratógeno. Sólo en los Estados Unidos, por simple azar, podrían ocurrir decenas de tales acúmulos de malformaciones congénitas en grupos reducidos. Así que no es de extrañar que alguien, sin un conocimiento profundo de la epidemiología ni de la teratología, tropezase con un acumulo tan aleatorio. El hecho está en que a dicho hallazgo no se le tenía que haber dado una interpretación causal basada meramente en un
304
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
valor de p estadísticamente significativo, sin haber considerado la credibilidad previa del hallazgo. Ningún estudio epidemiológico, diseñado correctamente y lo suficientemente extenso, ha sido capaz de de confirmar este «hallazgo» (1991). En cambio, un gran número de estudios publicados que no muestran ningún efecto, así como la persistente falta de una explicación biológica, han añadido credibilidad al punto de vista de que realmente no existe efecto alguno6.
Cuando un número suficiente de pequeños grupos se halla «expuesto», es posible que varios resultados similares hallen salida en alguna publicación y «apoyen la evidencia». Ello comportaría la disminución de la credibilidad previa de un estudio negativo sobre el mismo tema. Es difícil que se produzcan resultados negativos verdaderos porque requieren materiales mucho más extensos y, como consecuencia, mucho más tiempo y dinero (ver la siguiente sección). Cuando incluso los investigadores contemplan los resultados positivos como más excitantes que los negativos, no hay duda de que el convencer a los trabajadores expuestos y al público en general de que no existe riesgo será algo difícil, sobre todo si hay tanta «evidencia» publicada que lo afirma. Las conclusiones acríticas efectuadas por algunos investigadores sobre resultados que técnicamente son correctos, pero que pueden tener otras explicaciones, pueden ocasionar que realmente la literatura se halle sesgada en una dirección positiva. En la literatura, los primeros informes que se publican sobre un tema pueden estar sesgados hacia la positividad.
En la literatura también podemos hallar errores de interpretación, si los investigadores se hallan tan aferrados a un punto de vista determinado que tratan de forzar que tanto sus resultados como los de otros sigan dicho criterio. Algunos investigadores tienden a interpretar una asociación como algo causal en virtud de bases poco firmes y a menudo conceden demasiada importancia a los valores «significativos» de p. También pueden olvidarse del sesgo de confusión positivo y de otros sesgos que ni controlan ni mencionan. Y lo que es peor, se han descubierto varios casos de fraude, es decir,
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
305
de fabricación o falsificación de resultados, circunstancia que según mis conocimientos se ha producido al menos una vez en Medicina Ocupacional. Aunque tarde o temprano el fraude se descubre, los científicos fraudulentos pueden crear, inicialmente, mucha confusión. Resultados falsos negativos
La definición de unas condiciones de trabajo seguras es un objetivo importante de la investigación en Salud Ocupacional. Como consecuencia, los estudios que demuestran de forma convincente la ausencia de efecto son, al menos tan importantes como aquellos que revelan el efecto perjudicial de una exposición. El problema es que los requisitos para considerar de forma convincente un estudio como negativo son realmente estrictos. Existe una diferencia fundamental entre un resultado verdaderamente negativo y uno «no positivo». Matemáticamente, probar un resultado negativo requeriría un número infinito de observaciones. En la práctica nunca puede lograrse, así que usualmente se cambia el término «infinito» por el de «extenso». Por lo tanto, un estudio verdaderamente negativo debe ser extenso. Además tiene que ser sensible, para que pueda detectar un efecto si es que existe. También debe facilitar datos precisos sobre la exposición, porque un estudio solamente puede ser negativo en relación con los niveles de exposición prevalentes o bajos. Naturalmente, debe estar bien diseñado y correctamente ejecutado y su objetivo definido de forma explícita. ¿El objetivo es excluir el riesgo de sólo una enfermedad (por ejemplo, cáncer), o es certificar la seguridad completa de las condiciones estudiadas (si es que existe una seguridad total, lo cual es dudoso)? Un estudio verdaderamente negativo debe ser extenso y sensible, y debe tener datos precisos de exposición.
Un estudio pequeño de resultado negativo suele denominarse «no positivo», pero igualmente podría llamarse «no informativo» o «no concluyente». Los estudios no positivos generalmente son de
306
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
tamaño pequeño o medio, con un RR cerca de la unidad. El estimado puntual del RR puede hallarse claramente por debajo del 1, pero como el intervalo de confianza es ancho y su límite superior se encuentra claramente por encima del 1, diremos que el resultado es no concluyente más que negativo. De modo similar, los estudios con un RR moderadamente elevado también se clasificarán como no positivos si el límite inferior del intervalo de confianza está por debajo del 1. En la jerga convencional, este resultado se etiquetará de estadísticamente no significativo. Tales estudios pueden, en un sentido cuantitativo, excluir riesgos acentuados o aquellos que sobrepasen el límite superior del intervalo de confianza. Los términos «extensos» y «pequeños» son vagos. Si definimos «extenso» como muchos casos expuestos o un número esperado elevado, el concepto ya no resulta tan difuso. Entonces «extenso» ya no significa sólo que el número de personas o personas-año es extenso, sino que la enfermedad es común en la base del estudio. Juntas, estas propiedades dan lugar a muchos casos expuestos. Un diseño de casos y controles es similar en este aspecto porque, si la serie de casos es extensa y la exposición común, también habrá muchos casos expuestos. El tema radica en que no es sólo el tamaño de la cohorte, o el número de casos en un estudio de casos y controles, lo que determina el tamaño del estudio. La frecuencia del fenómeno de interés también es importante. Por ejemplo, el seguimiento de una cohorte muy extensa, digamos de medio millón de personas-año, puede ser una base de estudio pequeña si la enfermedad es rara. Aunque el problema ha mejorado, no se soluciona sólo por calificar como «extenso» un estudio con muchos casos expuestos. La siguiente pregunta es: ¿cuántos son «muchos»? De nuevo no podemos dar ninguna respuesta precisa. Los estudios cualitativos necesitan menos casos que los cuantitativos para que sean «extensos». También debemos ser pragmáticos. Si tanto la enfermedad como la exposición son raras, en general (por ejemplo, angiosarcoma de hígado, exposición al berilio), debemos tener un criterio menos estricto de lo que es «extenso», quizás unos 40-50 casos expuestos. Si, en cambio, se estudian fenómenos comunes (por ejemplo, exposición a fibras minerales sintéticas, carcinoma bronquial), podríamos requerir 200 o incluso más casos expuestos para considerar el estudio como «extenso». Sin embargo, estas ci-
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
307
fras son arbitrarias y subjetivas y otros epidemiólogos pueden escoger otras. Los estudios no sensibles se caracterizan por un diseño crudo (por ejemplo, enlace de registros) y/o métodos crudos (por ejemplo, epígrafes ocupacionales como substitutos de la exposición). Estos estudios son débiles a efectos de aportar evidencia en favor de la ausencia de un efecto. Pueden compararse con un diagnóstico clínico no sensible, tal como un examen radiológico para el diagnóstico del prolapso de un disco lumbar. Estos estudios no pueden probar que una determinada exposición carezca de efecto. Los estudios negativos sólo se pueden relacionar con los niveles de exposición prevalentes o más bajos, nunca con exposiciones elevadas o prolongadas. Este requisito es esencial e importante desde el punto de vista práctico. En Toxicología, muchas asociaciones dosis-respuesta tienen un umbral y la definición de este umbral posee una notable aplicación práctica en el establecimiento de estándares higiénicos. Sin embargo, mostrar de forma convincente que no ocurre ningún efecto bajo ciertas condiciones de exposición, requiere que tales condiciones estén bien caracterizadas en términos cuantitativos. Desafortunadamente, tales datos son difíciles de generar, al menos retrospectivamente, y este problema ha arruinado muchos estudios válidos en otros aspectos. Estas consideraciones ilustran las dificultades con las que se enfrentan los investigadores que estudian una constelación en la que realmente no existe ningún efecto. Las exigencias para que de forma convincente unos resultados sean negativos son realmente elevadas. No hay duda de que los estudios verdaderamente negativos son raros en la literatura. Así que la conclusión de que algunas exposiciones carecen de efectos perjudiciales (por ejemplo, cierto agente químico no es carcinógeno) debe basarse en una síntesis de toda la literatura disponible; nunca puede basarse en un solo estudio. Así, debe combinarse toda la evidencia científica (es decir, teórica, experimental y epidemiológica). Incluso así, es difícil llegar a una conclusión negativa. Por ejemplo, un grupo de expertos, concertados por la Agencia Internacional de Investigación sobre el Cáncer (IARC), solamente pudo clasificar un elemento químico (caprolactam) como no carcinógeno, después de haber revisado más de 700 agentes3. La evidencia «negativa» de todos los otros agentes que carecían de la «positiva» se consideró insuficiente.
308
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Falta de potencia
Como hemos señalado antes, la diferenciación entre estudios positivos o negativos (y no positivos) es artificial e incorrecta. Si bien la negatividad es una función de la potencia estadística (tamaño del estudio), la escala de positividad/negatividad es un continuo. Un resultado no positivo debido a una baja potencia estadística permite excluir un riesgo más elevado que el límite superior del intervalo de confianza del RR, naturalmente en relación con las condiciones de exposición que prevalecen y con la asunción de que no existe ningún sesgo negativo ni error aleatorio (ver el Capítulo 5). Ejemplo 4. Supongamos que el RR para el asma bronquial es 1,75 en un grupo de 50 trabajadores, en comparación con 50 controles. El IC90 del RR es 0,68-4,54. Lo único que puede decirse es que la exposición que prevalece en el estudio no incrementa más de cinco veces el riesgo de contraer el asma. Este resultado contiene muy poca información útil, si es que tiene alguna.
Un estudio de tamaño demasiado pequeño puede ocasionar que un efecto verdadero pase desapercibido. Este error de tipo II es inversamente proporcional a la potencia estadística. Los que tienen una buena práctica epidemiológica pronto detectan un error de este tipo, pero los menos expertos pueden interpretar la falta de significación estadística como la indicación de una verdadera negatividad. Como ya hemos dicho, incluso los materiales que parecen extensos pueden resultar pequeños. La clave está en disponer de suficientes casos expuestos y, en este punto, la selección del tipo correcto de estudio es importante. Si se trata de una enfermedad rara, se necesita una base de estudio extensa. Entonces la única opción válida es un muestreo de la base del estudio y un diseño de casos y controles. Si la exposición es rara, es mejor definir la base del estudio como un seguimiento de aquellos que sufren la exposición y usar un diseño de cohortes. La ocurrencia de enfermedades con una corta duración no se puede estudiar con efectividad mediante un diseño transversal, el cual mide la prevalencia y no la incidencia. También acaece una baja potencia cuando el estudio se centra en categorías erróneas de trabajadores. En este caso «erróneas» sig-
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
309
niñea categorías expuestas con una baja probabilidad de adquirir la enfermedad, por ejemplo, los grupos de edad jóvenes. Si en un estudio sobre el cáncer, por razones de conveniencia, sólo se estudian los trabajadores activos laboralmente y se omiten los trabajadores jubilados porque su seguimiento será costoso, se perderá una importante parte de la información. Entonces, la «verdad», que podía ser, de hecho, positiva, puede resultar ser negativa. Así que se debe ser muy cuidadoso al seleccionar el material de estudio, de manera que las categorías de edades estén bien representadas. Por ejemplo, a menudo el mesotelioma inducido por el asbesto se puede observar en un estudio en personas relativamente jóvenes, si la exposición se inició precozmente, mientras que el exceso de carcinoma bronquial provocado por la misma exposición se demostrará mejor en grupos de ancianos (aunque la tasa de fondo —el denominador— puede ser tan elevada en la gente mayor que el RR puede ser bajo por esta razón). En este ejemplo, ambos grupos, jóvenes y ancianos, son informativos y su estudio debería extenderse a otras edades. Cuando se trata de un estudio cualitativo, es decir, cuando la cuestión es la causalidad, deben fijarse unos criterios muy estrictos de admisión y excluir a los sujetos con una exposición corta y/o baja de la categoría de expuestos. Del mismo modo, en un estudio de casos y controles, el criterio para clasificar a alguien como expuesto también debe ser estricto. Las exposiciones inciertas se clasificarán mejor como «desconocidas»; de otra forma, una clasificación errónea no diferencial diluirá el efecto y con ello se enmascarará un riesgo verdadero. Por otro lado, si el estudio es cuantitativo (los aspectos cualitativos ya se conocen), deben incluirse los sujetos con una exposición baja y/o corta. De no ser así, no existiría información alguna sobre estas categorías de exposición. Sin embargo, este material no debería analizarse como un grupo homogéneo. Este dilema muestra de nuevo la importancia de distinguir claramente entre estudios cualitativos y cuantitativos. Un estudio cualitativo se debería concentrar en sujetos altamente expuestos; uno cuantitativo debería abarcar una amplia gama de exposiciones. Un estudio cualitativo debería centrarse en sujetos altamente expuestos, mientras que uno cuantitativo debería examinar varias intensidades de exposición.
310
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Cuando el período de seguimiento es demasiado corto o cuando no se tiene en consideración el período de latencia en el análisis de datos de un estudio sobre una enfermedad con un largo período de latencia (por ejemplo, cáncer relacionado con el trabajo), puede también alcanzarse un resultado falso negativo. Si no se tiene en cuenta el período de latencia, la potencia disminuirá, porque la base del estudio quedará diluida con un seguimiento durante un período en el que el resultado que se estudia es poco probable (las personas-año se han calculado antes de que la enfermedad relacionada con el trabajo haya podido desarrollarse). Si el seguimiento es demasiado corto, entonces ocurrirán menos casos. El largo período de latencia es un problema difícil cuando se estudia el cáncer ocupacional (ver el Capítulo 6). La exigencia de resultados a corto plazo se halla en conflicto con el largo período necesario para alcázar la potencia estadística indispensable. Sin embargo, no debería permitirse que la presión externa sobre los investigadores provoque conclusiones precipitadas basadas en resultados (generalmente no positivos) prematuros. Si se hacen públicos los resultados preliminares, es tarea del autor recalcar su naturaleza preliminar. A veces existen motivos para hacer una publicación de forma anticipada, y hoy en día se ha convertido en una rutina actualizar a intervalos regulares estudios publicados demasiado tempranamente (desde el punto de vista científico). Una publicación anticipada, junto con una actualización posterior, podría ser un compromiso satisfactorio, siempre que los autores explicasen la naturaleza de cada informe consecutivo. En el análisis deberían valorarse los diferentes períodos de latencia para identificar cuándo ocurre el efecto máximo, pero esta práctica requiere un material bastante extenso. La figura 9.1 ilustra esquemáticamente por qué los estudios sobre cáncer relacionado con el trabajo son escasamente informativos durante los primeros años de seguimiento. El grado de información disminuye conforme avanza el período de seguimiento, en parte debido al «ruido de fondo», y en parte porque el pico de la inducción del cáncer ya ha pasado. La figura se ha simplificado por razones pedagógicas y todas las cifras son ficticias. Además, la forma de la curva solamente ajusta bien para un iniciador. Sería diferente para un promotor o para una exposición mixta de iniciador y promotor.
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
311
Figura 9.1. Ejemplo simplificado que muestra la importancia de tener en cuenta el período de latencia en los estudios sobre cáncer relacionado con el trabajo. El estudio únicamente puede detectar efectos cuando ha transcurrido un período de tiempo suficientemente largo. Más tarde, la elevada incidencia de fondo enmascara el efecto.
Pueden alcanzarse conclusiones falsamente negativas cuando: • El material de estudio es demasiado pequeño • El diseño del estudio es ineficiente • Se han estudiado categorías de exposición erróneas • La exposición es demasiado baja y/o corta • El seguimiento es demasiado corto o incompleto • No se ha tenido en cuenta el período de latencia.
Afortunadamente, la negligencia en unos requisitos tan elementales del diseño de un estudio en la actualidad es menos prevalente que hace unos años. Además, las interpretaciones equivocadas de los datos raramente pasan el dintel de publicación en las buenas re-
312
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
vistas. Sin embargo, tales informes se publicarán en revistas científicas mediocres sin una estricta revisión por expertos y los trabajos malos todavía se pueden presentar en congresos científicos que no realizan una revisión previa de los resúmenes o que lo hacen de forma laxa. La falta de potencia estadística no es la única razón por la que un estudio puede fallar a la hora de detectar un efecto existente. También hay otras causas; algunas de ellas se tratarán en las siguientes secciones. Falta de sensibilidad
El uso de indicadores crudos, tanto para la enfermedad como para la exposición, enmascara los efectos verdaderos. Especialmente cuando el objetivo es documentar la ausencia de todo tipo de efectos, es decir, cuando el propósito es establecer estándares de higiene, el estudio debe ser sensible. Por ejemplo, la mortalidad es un indicador demasiado crudo cuando el objetivo es excluir todo tipo de efectos sobre la salud. Sin embargo, la simple ausencia de un aumento de la mortalidad en un estudio se interpreta con frecuencia como un indicativo de seguridad. Esta conclusión es particularmente dudosa cuando la comparación se hace con referencia a estadísticas de mortalidad general nacionales o incluso regionales. Los errores aleatorios tienden a enmascarar las diferencias existentes. Ocurren cuando las mediciones están mal estandarizadas, cuando su precisión es baja y cuando los indicadores son crudos. Los errores aleatorios se han discutido en el Capítulo 5 y por ello no se tratarán en este apartado. Clasificación errónea
La potente consecuencia enmascaradora del efecto de la clasificación errónea no diferencial no ha sido tenida en cuenta hasta hace poco. La dirección del error del RR, que surge de tal clasificación errónea, es hacia la unidad (por ejemplo, al enmascarar un efecto verdadero, sea etiológico o preventivo). Incluso una clasifi-
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
313
Tabla 9.1. Efecto de un 10% de clasificación errónea no diferencial en el estimado puntual de la OR. OR correcta = (40:60)/(10:90) = 6,0; OR incorrecta = (42:58)/(18:82) = 3,3.
cación no diferencial relativamente pequeña produce un sustancial error negativo. Ejemplo 5. En un estudio de casos y controles supongamos que se observa que 40 casos sobre 100 y 10 controles sobre 100 han estado expuestos a un determinado agente químico. La estimación correcta de la OR será (40:60)/(10:90) = 6,0. Supongamos que hay un error de clasificación no diferencial del 10% (es decir, uno de cada diez individuos se clasifica erróneamente). La Tabla 1 muestra lo que sucede.
Este ejemplo presenta lo fuerte que puede llegar a ser el efecto enmascarador de una clasificación errónea relativamente pequeña. Un error del 20% disminuiría la OR a 2,2 y del 50% a 1. A menudo, es difícil averiguar la bondad de los datos de exposiciones pasadas y no se puede evitar la clasificación errónea no diferencial. Solamente se puede especular sobre el número de resultados falsos negativos que han aparecido a partir de tal clasificación errónea. Cuando se estudia el efecto de una exposición determinada y se usan las categorías ocupacionales como una aproximación de la exposición, a menudo se considera a priori que tales estudios no son informativos debido a la clasificación errónea.
314
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Miscelánea de errores
A veces las medidas de las enfermedades escogidas por los investigadores pueden ser inapropiadas o irrelevantes para el propósito de detectar efectos de una exposición. Ejemplo 6. Hace algunos años fue publicado un estudio en el que los trabajadores del plomo, cuyo nivel presente o medio durante 5 años de plomo en la sangre era de 60-80 µg/100 ml (2,893,86 µmol/1), se compararon con los que tenían niveles por debajo de 60 µg/100 ml (2,89 µmol/1)7. Se midieron muchos elementos bioquímicos y otros indicadores de enfermedad, entre los que se hallaban no menos de 29 pruebas bioquímicas de laboratorio. No se encontraron diferencias estadísticamente significativas entre los grupos. Los autores concluyeron que «no existían diferencias significativas en la salud de los trabajadores con un nivel de concentración de plomo en la sangre entre 60 y 80 µg/dl». También afirmaron: «Según nuestra opinión, el actual (1978) nivel estándar de plomo en sangre de 80 µg/dl puede mantenerse, a menos que nuevos datos apoyen la propuesta de la OSHA». Un fallo destacable en este estudio fue que no se incluyeron pruebas para medir los trastornos de la síntesis de la protoporfirina, y que tampoco se hicieron mediciones de las funciones neurofisiológicas o psicológicas. Realizar una afirmación general negativa sin el estudio de estos parámetros, que son bien conocidos por ser los efectos de sensibilidad más elevada (los más críticos) en la intoxicación por plomo, representa una interpretación seriamente errónea de los datos toxicológicos y epidemiológicos. Además de basar la afirmación en marcadores erróneos del efecto, los autores pueden ser criticados por haber utilizado contrastes demasiado reducidos; la dicotomización a 60 µg/100 ml, en lugar de usar un grupo ocupacional de referencia no expuesto, ocasiona una disminución sustancial de la sensibilidad del estudio. Las conclusiones falsamente negativas también se pueden producir cuando: • Las mediciones de la morbilidad son crudas • Existen errores aleatorios • Hay una clasificación errónea no diferencial • Se usan indicadores de morbilidad erróneos o irrelevantes
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
315
Finalmente, los errores sistemáticos también pueden causar resultados falsos negativos. El sesgo de confusión negativo probablemente ocurre tan a menudo como el positivo, aunque este último ha recibido más atención. Una clasificación errónea también puede ser diferencial o sistemática, por ejemplo, si la exposición se subestima automáticamente para los casos en comparación con los controles. Esta es una posibilidad cuando se estudian enfermedades fatales y los controles son una muestra extraída de la base del estudio. En tal situación, el historial de exposición se recogerá predominantemente de familiares cercanos de los casos y, a menudo, de los mismos controles (que están vivos). Los propios sujetos recuerdan el historial de trabajo mejor que sus familiares, así que se obtendrán historiales de exposición más positivos para los controles que para los casos y de ello resultará un enmascaramiento del efecto verdadero, como consecuencia de la sistemática clasificación errónea. Quizás el error sistemático negativo más conocido sea el efecto del trabajador sano (ver el Capítulo 5). Los sesgos negativos también son frecuentes en los estudios transversales debido a la selección basada en la salud hacia el abandono del trabajo expuesto. EVIDENCIAS EN FAVOR DE LAS INFERENCIAS CAUSA-EFECTO Cuando los errores sistemáticos o la variación aleatoria parecen ser explicaciones poco probables de una asociación observada entre dos fenómenos, es el momento de evaluar si la asociación es causal o si no es más que una de las llamadas asociaciones estadísticas. Como ya se ha dicho varias veces, la investigación no experimental tiene menos fuerza que la experimental a la hora de apoyar la causalidad. Así que la inferencia científica de que un fenómeno causa otro, debe utilizar todo el conocimiento disponible, no sólo los resultados de un estudio aislado, no sólo la investigación epidemiológica y no sólo una observación aislada. En 1965, Sir Austin Bradford Hill2 formuló nueve criterios generales para discernir la causalidad. Tales criterios se han convertido en clásicos aunque su aplicabilidad en Epidemiología ha sido criticada recientemente (por ejemplo, citas 8 y 9). A pesar de las dudas que han surgido, los criterios de Hill me-
316
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
recen ser tomados en consideración. Los exponemos a continuación junto con los argumentos contrarios más pertinentes. 1. Asociación fuerte. Cuanto más fuerte sea la asociación, es decir, cuanto más elevado y estable sea el RR, más creíble será la causalidad. Los estudios pequeños siempre son una excepción, como ya hemos dicho. Sin embargo, una asociación débil no excluye la causalidad. Por ejemplo, la exposición puede haber sido baja o el estudio puede haber sido diluido por errores aleatorios. 2. Evidencia consistente. La consistencia de la evidencia habla en favor de la causalidad. Hill afirmó que, si la misma asociación ha sido hallada por muchos científicos y bajo diferentes circunstancias, la causalidad es probable. El argumento contrario es que los estudios pueden haber sido hechos mediante distintos métodos y que algunos pueden ser mejor que otros. Además, si el agente causal necesita causas complementarias para ser operativo, éstas no siempre se hallarán presentes. Así que la falta de consistencia no excluye la causalidad, aunque su presencia habla en su favor. 3. Especificidad de la asociación. Hill afirmó que, si una asociación se halla confinada a ciertos grupos de trabajadores que tienen condiciones de exposición bien definidas y que exhiben el mismo patrón de morbilidad, la causalidad gana credibilidad. Este criterio es, sin duda, erróneo. Hay muchas causas simples que pueden causar enfermedades diferentes (por ejemplo, el tabaquismo, que causa distintos tipos de cáncer, enfermedad coronaria, bronquitis, etc.; el arsénico, que provoca cáncer pulmonar y de la piel, así como enfermedad coronaria; el disulfuro de carbono, que causa enfermedad coronaria, enfermedades cerebrovasculares y enfermedades neurológicas, etc.). 4. Temporalidad. La causa debe preceder al efecto. Cuando la enfermedad aparece justo después de la exposición, la relación es directa. Si la enfermedad tiene un largo período de latencia, la exposición debe haber ocurrido lo suficientemente temprano como para que la enfermedad tenga tiempo de desarrollarse. Todo el mundo está de acuerdo en que este requisito es necesario, aunque a veces es difícil de verificar. 5. Gradiente biológico. Debería existir la evidencia de una relación dosis-respuesta. Sin embargo, no pueden excluirse los factores de confusión en tal relación. Además, si en un estu-
ALGUNAS PAUTAS PAR A LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
6.
7.
8.
9.
317
dio el efecto es máximo (por ejemplo, todos contraen la enfermedad, como se ha visto para la exposición a la erionita y el mesotelioma), el estudio no puede demostrar una relación dosis-respuesta. Plausibilidad biológica. La circunstancia de que el hallazgo es biológicamente plausible habla en favor de la causalidad. La relación entre esta plausibilidad y la causalidad ha sido inferida fuertemente por el pensamiento bayesiano, como ya se ha expuesto antes en este capítulo. Sin embargo, Pott no pudo explicar por qué los deshollinadores contraían cáncer de escroto y, en cambio, tenía razón al afirmar que la enfermedad estaba relacionada con el trabajo. El hecho que de los mecanismos biológicos aún sean desconocidos para los científicos no debe influir en la verdad científica. Coherencia de la evidencia. Según Hill, si el trabajo experimental y la teoría apoyan un hallazgo epidemiológico, se corrobora la evidencia de causalidad. Sin embargo, no está del todo claro en qué difiere la coherencia de la plausibilidad. Quizás la distinción sea que no debería haber ninguna evidencia conflictiva. Evidencia experimental. Los seres humanos rara vez pueden estar expuestos experimentalmente y la extrapolación a partir de los experimentos con animales es problemática. A pesar de ello, si el mismo efecto que ha sido observado en estudios epidemiológicos se puede inducir mediante experimentación animal, la causalidad de la asociación gana credibilidad. Del mismo modo, un cambio en la exposición, que es seguido por un cambio en la morbilidad, apoya la causalidad. El peso que se da a los efectos de los cambios activos en la exposición tiene que ver con las semejanzas entre la investigación experimental y los estudios epidemiológicos de intervención. Desafortunadamente, sólo se ha publicado un número muy limitado de estudios de intervención en la literatura epidemiológica de Medicina Ocupacional. Analogía. El razonamiento mediante analogía puede ayudar a decidir la causalidad. Por ejemplo, si una determinada sustancia química es un conocido carcinógeno y un compuesto relacionado muestra una asociación con el cáncer en un estudio epidemiológico, entonces la causalidad es más fácil de aceptar que si las dos sustancias no estuvieran relacionadas. Desafortunadamente, con buena imaginación, se pueden hallar analogías en casi todas partes.
318
INTRODUCCIÓN A LA EPIDEMIOLOGÍA OCUPACIONAL
Es importante utilizar toda la evidencia científica disponible cuando se discierne la causalidad de una asociación epidemiológica. A pesar de todos los intentos de crear pautas para evaluar la causalidad, este proceso todavía es predominantemente subjetivo y aquellos que más conocen el tema en estudio y las reglas de la inferencia científica son los que con mayor probabilidad lo harán más correctamente. Pero incluso las autoridades, como todos los humanos, pueden equivocarse, hecho sobradamente conocido en la historia de la Ciencia. Hill nunca propuso que sus criterios fueran reglas absolutas. Al contrario, afirmó que no se pueden dar reglas inflexibles para la inferencia causal. Los divergentes puntos de vista, expresados en un reciente simposio organizado sobre el tema de la inferencia causal, mostraron claramente que no es una materia simple. Recomendamos los resúmenes9 de dicho simposio como lectura posterior para aquellos que estén interesados en profundizar sobre este tema, tan importante y tan interesante. El objetivo de este capítulo ha sido explicar a los lectores lo difícil que es interpretar artículos epidemiológicos. En general, los métodos epidemiológicos son demasiado crudos para revelar riesgos leves. La mayoría de los errores que afectan a los estudios de cohortes y transversales tienen una dirección negativa, y lo mismo ocurre con algunos de los errores en los estudios de casos y controles. Hasta ahora, la mayor parte de los esfuerzos de los investigadores han ido dirigidos a controlar el sesgo positivo, y los de los lectores a detectar tales errores. La llamada valoración conservadora del riesgo ha sido considerada indicadora de un juicio sensato, mientras que interpretaciones menos conservadoras han sido consideradas como faltas de crítica. En mi opinión, deberíamos darnos cuenta del efecto de la rudeza de la Epidemiología en la valoración del riesgo. Los estudios crudos y una interpretación demasiado conservadora, pueden, solos o en combinación, conducir fácilmente a pasar por alto verdaderos peligros, es decir, a la subestimación del riesgo. La subestimación puede tener serias consecuencias para los implicados, tanto los trabajadores expuestos como el público en general.
ALGUNAS PAUTAS PARA LA INTERPRETACIÓN DE LOS ESTUDIOS EPIDEMIOLÓGICOS
319
BIBLIOGRAFÍA 1. Bourbonnais, R., F. Meyer y G. Theriault. «Validity of self reported work history», Br. J. Ind. Med. 45:29 (1988). 2. Hill, A.B. «The environment and disease: association or causation?». Proc. R. Soc. Med. 58:1217 (1965). 3. IARC «Monographs on the Evaluation of Carcinogenic Risks to Humans, Suppl 7». Overall evaluations of carcinogenicity: an updating of IARC monographs volumes 1 to 42 (Lyon: IARC, 1987). 4. Kurppa, K., S. Tola, S. Hernberg y M. Tolonen «Industrial solvents and theliver», Lancet 1:129 (1983). 5. Miettinen, O.S. Theoretical Epidemiology: Principies of Occurence Research in Medicine (New York: John Wiley & Sons, 1985). 6. Nurminnen, O.S. «Office Employment, work with video display termináis and course of pregnancy». Scand. J. Work Environ. Health 14:293 (1988). 7. Ramirez-Cervantes, B., J.W. Embree, C.H. Hiñe, K.W. Nelson, M.O. Vernes y R.D. Putnam. «Health assessment of employees with different body burdens of lead», J. Occup. Med. 20:610 (1978) 8. Rothman, K.J. Modern Epidemiology (Boston, MA: Little Brown, 1986). Existe versión en castellano: Epidemiología moderna (Madrid: Ed. Díaz de Santos, 1987). 9. Rothman, K.J. Causal Inference (Boston, MA: Epidemiology Resources, 1988). 10. Rothman, K.J. «No adjustments are needed for múltiple comparisons». Epidemiology 1:43 (1990). 11. Sotaniemi, E.A., Seppo Sutinen, Sirkka Sutinen, A.J. Arranto y O. Pelkonen. «Liver injury in subjects occupationally exposed to chemicals in low doses», Acta. Med. Scand. 212:207 (1982)
Índice analítico
Actividad y enfermedad coronaria, 243245 Agencia Internacional para la Investigación sobre el Cáncer (IARC), 209-212 Ajuste, 38 Alarmas, 94-95 Alergia, 227-228 Análisis de datos, 268, 292 objetivo del, 180-182 Asignación aleatoria, 133, 179 Asma bronquial, 223-224 Asociación exposición-efecto, 49 exposición-respuesta, 49-51 Base del estudio, 87, 264-265 base de cohortes, 100-122 base de población dinámica, 122-131 distorsionada, 302-303 Bronquitis, 223-225 Cadena causal, 13 Cálculo de personas-año, 26-27 Calendario de un proyecto, 270-271 Cáncer exposiciones ocupacionales, 208-213 niveles de la epidemiología, 213-215 problemas en el diseño de estudios, 215222 procesos industriales asociados, 211 321
Carcinógenos, 209 ocupacionales para los que la evidencia es suficiente, 209-210 probables y posibles en seres humanos, 210-211 Causa contributoria, 15 multicausalidad, 13 necesaria, 14 suficiente, 13-15 Causalidad, 11-16 criterios de Bradford-Hill, 315-318 Censo, 141-145 Ciegos, 134, 162,226,247,275 Clasificación errónea, 312-313 Cohorte, ver Estudio de cohortes Comparabilidad, 164-169 Comprobación de la validez, 290-293 Confidencialidad, 67-69, 284 Confusión, ver Sesgo de confusión Contrato de investigación, 281 Contraste estadístico unilateral o bilateral, 295-298 Control de variables, ver Métodos de control Controles, ver Estudio de casos y controles Costes, 270-272 por unidad de información, 141 Credibilidad anterior y posterior, 288-289, 299 Cuestionario, 79-80, 225
322
ÍNDICE ANALÍTICO
Densidad de incidencia, 24-27 Diario del proyecto, 274-275 Diferencia de tasas DT, 36, 102, 110 Diseño del estudio, ver Estudio pautas de evaluación, 290-293 principios generales, 139-145 prospectivo, retrospectivo, 106-110, 139-141 protocolo del estudio, 261-262 Doble ciego, 134 Dureza del indicador, 78-79
Efecto definición, 48-49 del trabajador sano, 185-192 Hawtorne, 136 modificación del, 10, 174-175 Enfermedad coronaria actividad física y estrés laboral, 243-245 factores de riesgo, 242-243 indicadores de morbilidad, 245-248 valoración de la exposición, 248-249 Enfermedad ocupacional, 205-206 Enfermedad relacionada con el trabajo cáncer, 208-209 definición, 206 enfermedad coronaria, 242-245 enfermedad respiratoria crónica, 222223 OMS y NIOSH, definiciones, 205-206 problemas específicos a estudiar, 206208 respuestas conductuales, 251-253 trastornos musculoesqueléticos, 231234 Enfermedad respiratoria factores de riesgo, 223-224 indicadores de riesgo y su medición, 224-228 tabaquismo, 229-230 valoración de la exposición, 228-229 Enlace de registros, 64-67, 213-215 Ensayo clínico, 133-134
comparabilidad, 164-165 randomización, 7, 133, 179 Ensayo de campo, 132-133 Ensayo de intervención comunitaria, 133 Entrevistas, 79-80 Epidemiología cualitativa, cuantitativa, 10, 50 definición, 4 de intervención, 11 del cáncer, 213 de la enfermedad coronaria, 242-245 descriptiva, 9-10 etiológica, 9-10 hipótesis de investigación, 16-19 importancia científica, 8 niveles en el cáncer, 213-215 niveles de la investigación, 9-11 ocupacional, 5 historia, 1-2 Error aleatorio, 75-76, 147-148, 193-195, 310312,314 clasificación errónea, 312-313 de tipo I, 198 de tipo II, 198,308-312 interobservador, 162 intraobservador, 163 positivo y negativo, 300-315 protocolos para su control, 266-268 sistemático, 147, 192-199, 300 Especificidad, 80-84, 300-305 Estadística bayesiana, 287-290 multisignificación, 298-299 potencia, 198-199, 305-312 significación, 195-199,293-300 valores de p, 196, 293-295 Estadísticas vitales, 56-62 Estándar administrativo, 51 Estandarización, 39, 182 directa, 39-41 indirecta, 41-43 Estimación por intervalo, 34-36 puntual, 34 Estratificación, 182-184
ÍNDICE ANALÍTICO
Estrés, 243-245, 251-256 Estudio cualitativo, 10, 75, 263-266, 309 cuantitativo, 48-50, 263-266, 309 de casos y controles, 87, 116-121, 123131 en el cáncer, 215-220 en las enfermedades respiratorias, 225 muestreo, 116-122, 141-145 no pareado, 127-128 pareado, 128-131 principios del diseño, 123-127 sesgo de información en, 152-155 de cohortes, de censo, 100-116, 141-145 en el cáncer, 214 en la enfermedad coronaria, 246 en las enfermedades respiratorias, 224-225 prospectivo, 109-111 retrospectivo, 107-108, 111-113 sesgo de selección en, 149-152 principios del diseño, 100-116 de intervención, 132-137 de mortalidad proporcional, 131-132 descriptivo, 90-96 elección del diseño, 139-145 estadísticas nacionales, 95 indicadores de morbilidad, 77-80 longitudinal, 88, 98-100 multicéntrico, 265-266 piloto, 273-274 prospectivo, 106-110, 139-141 en la enfermedad coronaria, 246 radiológico en la enfermedad respiratoria, 226 en los trastornos musculoesqueléticos, 238 retrospectivo, 106-110, 139-141 selección del, 139-145 transversal, 88-89, 96-97 vigilancia de salud, 90-94 Evaluación de la inferencia, 312-315 Evidencias en apoyo a la inferencia causaefecto, 315-318 Experimento, 7-11
323
Exposición errores aleatorios de medición, 75-76 específica y no específica, 83-84 múltiple, 74-75, 219 química y no química, 70-75, 242 recogida de datos, 69-70 Factor de riesgo causal, 171-173 para la enfermedad coronaria, 242-243 para la enfermedad respiratoria, 223224 Falsos negativos concepto, 81, 300 resultados, 305-307 Falsos positivos concepto, 81 resultados, 300-305 Falta de potencia, 308-312 Fenómeno de la multisignificación, 298 Fijación de estándares, 51 de prioridades, 272 Fracción etiológica FE, 15, 115 Fracción prevenida, FP, 136-138 Fuentes de la información datos de exposición, 69-70 estadísticas vitales, 56-62 estudios de enlace de registros, 64-67 indicadores de morbilidad, 77-80 legislación sobre confidencialidad y, 6769 registros de exposición, 63-64 registros de población, 62-63 Generalización, 149, 199-201 Grupo de referencia, 165-169, 255 Hipótesis definición, 16-19 generada por los datos, 299 nula, 17, 195, 295 universal, 298
324
ÍNDICE ANALÍTICO
pautas para la evaluación de, 195, 295298 previa, 289, 291, 299 prueba de, 295-300 Identificación de riesgos, 94-95 Incidencia definición, 26 diseño de un estudio de, 86-89 métodos de cálculo acumulada IA, 28 densidad de incidencia DI, 24-27 recurrencia, 26 tasa, 24 Indicador de morbilidad, ver Morbilidad crudo, 21-22, 38, 312 duro y blando, 78-79 Inexactitud asimétrica, 156 Inferencia causal, 315-318 Información, ver Fuentes de la información Iniciador, 212 Insensibilidad, 312 Interpretación aspectos éticos, 280-281 pautas para la, 287-319 errores positivos y negativos, 300-315 evidencias en apoyo de las inferencias causa-efecto, 315-318 significación estadística, 293-300 prueba de la validez, 287-293 Intervalo de confianza, 34-36, 297 Mala clasificación, 137, 309, 312-313 Matriz de exposición laboral, 73-74, 117, 159 Mediciones biológicas, 70 Medidas asociación exposición-efecto, exposición-resultado, 49-51 crudas, 21-22 incidencia, 24-30 latencia, 30-32 odds ratio OR, 36-37, 128
prevalencia, 22-23 riesgo, 33 estandarizadas, morbilidad, mortalidad, 37-45 mortalidad proporcional, 45 protocolos para, 261-265 Métodos de control del sesgo de confusión estandarización, 182 estratificación, 182-184 modelización, 184 pareamiento, 180-182 randomización, 179 restricción, 179-180 Modelización, 184-185 Modificación del efecto, 10, 174-175 Morbilidad diseño de estudios y, 93-94 indicadores, 77-80 cuestionarios y entrevistas, 79-80 duros, 78-79 en la enfermedad respiratoria, 224228 en los trastornos musculoesqueléticos, 234-239 para la enfermedad coronaria, 245248 sensibilidad y especificidad, 80-84 medidas estandarizadas, 39-45 Mortalidad ajuste, 38-39 efecto del trabajador sano y, 186-187 medidas, estandarizada, 39-45 odds ratio ORM, 48, 131 -132 proporcional, 45 sesgo de información y, 159-161 Movilidad de los trabajadores, 217-218 Muestreo del aire, 70 casos y controles, 116-122, 141-145 Multicausalidad, 13 Odds anterior y posterior, 288-289
ÍNDICE ANALÍTICO
Odds ratio OR definición, 36-37, 118, 125, 313 de mortalidad/morbilidad ORM, 48, 131-132 Organización del proyecto, 272 Osteoartrosis, 234
p, ver Valores de p Pareamiento frecuencial e individual, 127-131 objetivo del, 180-182 Periodo de inducción, 31 delatencia, 30-32, 310 Plan del estudio, 262-273 Potencia estadística, 198-199, 308-312 Precisión, 192-199 Prevalencia, 22-23 Probabilidad anterior, posterior, 288-289 Programas de vigilancia, 90-94 Promotor, 212 Protocolo, diario del proyecto, 274-276 estudio piloto, 273-274 plan del estudio, 262-273 publicación, 276-278 Prueba estadística unilateral o bilateral, 296-297 Publicación, 276-278, 310
Randomización, 7, 133, 179 Razón de incidencias estandarizadas RÍE, 214 mortalidad, estandarizada RME, 43-45, 110, 186187,221 proporcional RMP, 46-47 verosimilitud RV, 289 tasas, 33-36, 102 estandarizadas RTE, 39 Red causal, 12-13
325
Redacción de informes, 276-278 Registros cáncer, 59-61 defunciones, 56-59 enfermedad coronaria, 245 enfermedades específicas, 61 -62 estudios de enlace, 64-67, 213-215 exposición, 63-64 morbilidad, 59 población, 62-63 Respuestas conductuales y síntomas psicosomáticos, 251-256 Restricción, 179-180 Riesgo definición, 33 subestimación del, 175, 308-312, 318 Riesgo relativo RR, 33-35 Rotación de los trabajadores, 217-218
Seguridad, Aspectos éticos, 282 Selección basada en la salud, 89, 230, 240, 250, 255 Sensibilidad, 80-84, 156, 300-305 Sesgo base del estudio, 302 de confusión, 10, 170-179 efecto del trabajador sano, 185-192. de información, 156, 301 del observador, 157 de publicación, 303-305 de recuerdo, 156, 221 de selección, 149-155,301 literatura, 303 tipos, 149 Significación estadística, 293-300 Síntomas psicosomáticos, 252-253
Tabaquismo como factor de riesgo, 229-230 como modificador del efecto, 173 enfermedad respiratoria y, 229-230
326
ÍNDICE ANALÍTICO
Tasa cruda, ver Medidas de incidencia TI, 24-27 de mortalidad proporcional, 45 de prevalencia TP, 22-23 Temporalidad prospectiva o retrospectiva, 139-141 Teoría bayesiana, 287-290, 299 Teoría frecuentista de la estadística, 288 Trastornos musculoesqueléticos, cuello y extremidades superiores, 233234 dolor lumbar, 231-232 indicadores de morbilidad, 234-239 osteoartrosis, 234 valoración de la exposición, 239-240 Turnos de trabajo y enfermedad coronaria, 244-245, 250
Unilateral o bilateral, contraste, 296-297 Validez, ver Diseño del estudio; Enfermedades relacionadas con el trabajo comprobación, 290-293 efecto del trabajador sano, 185-192 de la comparación, 164-169 control del sesgo de confusión, 179185 selección del grupo de control, 165169, 255 sesgo de confusión, 170-179 de la información, 156-164 de la selección, 149-155 principios generales, 147-149 Valor de p, 293-297 Valor predictivo, 83