
1. Introdução: Por Que os Níveis de Evidência São Importantes?
Imagine um epidemiologista como um detetive investigando um caso complexo de saúde pública. Em vez de impressões digitais e testemunhas, suas pistas são dados sobre doenças e exposições em populações. Assim como um detetive, o epidemiologista dispõe de diversas ferramentas de investigação – cada uma com suas forças e limitações. Algumas ferramentas, como uma análise preliminar de dados de uma cidade inteira, podem sugerir uma pista importante, mas não provam a culpa de um suspeito. Outras, como um acompanhamento meticuloso de indivíduos ao longo de décadas, oferecem evidências muito mais fortes.
Na epidemiologia, cada “ferramenta” corresponde a um tipo de estudo, ou delineamento de pesquisa. A força de cada delineamento para estabelecer uma relação de causa e efeito é diferente. Essa força é organizada em uma hierarquia, popularmente conhecida como a pirâmide de evidências. Na base da pirâmide estão os estudos que são excelentes para gerar hipóteses, mas fracos para testá-las. No topo, encontramos os delineamentos que fornecem a evidência mais robusta sobre se uma intervenção ou exposição realmente causa um desfecho de saúde.
O objetivo deste guia é conduzi-lo, estudante iniciante, através dos principais delineamentos de estudo em epidemiologia. Começando pela base da pirâmide e subindo até o seu topo, exploraremos como cada tipo de estudo funciona, destacando suas vantagens e desvantagens críticas com exemplos práticos.
Vamos, então, iniciar nossa jornada pela base da pirâmide, onde as primeiras pistas sobre os determinantes da saúde são geradas.
2. A Base da Pirâmide: Estudos Geradores de Hipóteses
Na base da pirâmide, encontramos os estudos observacionais descritivos. Eles não são projetados para provar causalidade, mas são fundamentais para levantar suspeitas, gerar novas hipóteses e dar os primeiros passos na investigação de um problema de saúde.
2.1. Estudos Ecológicos
Um estudo ecológico é um tipo de investigação em que a unidade de análise não são indivíduos, mas sim grupos de pessoas. Esses grupos podem ser populações de bairros, cidades, estados ou países. O pesquisador explora a associação entre a exposição média de um grupo e a taxa de doença nesse mesmo grupo.
- Força:
- São excelentes para uma avaliação inicial de associações entre exposições e doenças em nível populacional.
- São frequentemente rápidos e de baixo custo, pois utilizam dados agregados que já estão disponíveis (como dados de censos, estatísticas de vendas ou registros de mortalidade).
- São particularmente úteis para avaliar o impacto de políticas ou intervenções em larga escala, como o efeito de uma campanha de vacinação em todo o país.
- Fraqueza Crítica: A Falácia Ecológica
- A principal limitação dos estudos ecológicos é a falácia ecológica. Este erro ocorre quando se assume que uma associação observada em nível de grupo é válida também no nível individual. Por exemplo, se uma cidade com alto consumo médio de sorvete também tem altas taxas de criminalidade, um estudo ecológico mostraria uma correlação. A falácia seria concluir que indivíduos que tomam sorvete são mais propensos a cometer crimes. A verdadeira razão pode ser um terceiro fator (uma variável de confusão), como o calor, que aumenta tanto o consumo de sorvete quanto as interações sociais que podem levar a conflitos.
- Um princípio fundamental da epidemiologia é que as associações ecológicas são escala-dependentes. Isto significa que uma associação forte encontrada ao comparar países (p. ex., consumo de gordura e doenças cardíacas) pode enfraquecer ou até mesmo desaparecer quando a análise é feita em um nível mais granular, como entre cidades ou bairros dentro do mesmo país. Fatores de confusão podem operar de maneira diferente em cada escala, mascarando a verdadeira relação no nível individual. Inferir características individuais a partir de dados de grupo é um salto lógico que pode levar a conclusões completamente equivocadas.
Exemplo Prático: Padrões de Voto e Mortalidade
Um exemplo clássico de estudo ecológico pode ser visto na análise de dados socioeconômicos e de saúde no Reino Unido. Pesquisadores correlacionaram dados agregados por áreas geográficas para gerar hipóteses sobre determinantes sociais da saúde.
| Padrão de Voto (Eleições de 1983) | Correlação com a Mortalidade (1981-85) |
| Voto Conservador | –0.84 |
| Voto Trabalhista | 0.74 |
| Voto Liberal | –0.55 |
| Abstenções | 0.66 |
Fonte: Adaptado de Davey Smith G, et al. Health inequalities: lifecourse approaches (2010), Tabela 3.
Nesta tabela, a correlação negativa forte (–0.84) sugere que áreas com maior proporção de votos no Partido Conservador tendem a ter taxas de mortalidade mais baixas. Por outro lado, a correlação positiva (0.74) indica que áreas com mais votos no Partido Trabalhista tendem a ter taxas de mortalidade mais altas. Este estudo não prova que o voto individual causa um desfecho de saúde, mas gera a hipótese de que fatores socioeconômicos, refletidos nos padrões de voto de uma área, estão fortemente associados à saúde da população.
Para superar a falácia ecológica e entender a saúde no nível individual, precisamos de estudos que coletem dados de cada pessoa.
Saiba mais sobre Estudos Ecológicos
2.2. Estudos Transversais (Inquéritos de Prevalência)
Um estudo transversal é como um “retrato” ou um snapshot de uma população em um único ponto no tempo. Neste delineamento, tanto a exposição (fator de risco) quanto o desfecho (doença) são medidos simultaneamente em cada indivíduo. Por isso, são ideais para determinar a prevalência – a proporção de pessoas em uma população que têm uma doença ou condição em um momento específico.
- Força:
- São extremamente úteis para o planejamento de serviços de saúde, pois fornecem uma fotografia da carga de doença (prevalência) em uma comunidade. Saber quantas pessoas têm diabetes ou hipertensão, por exemplo, é decisório para alocar recursos.
- São relativamente rápidos e menos custosos que estudos que acompanham pessoas ao longo do tempo.
- Fraqueza Crítica: Ambiguidade Temporal
- Como a exposição e a doença são medidas ao mesmo tempo, é impossível determinar o que veio primeiro. Essa incapacidade de estabelecer a sequência temporal entre exposição e desfecho é chamada de ambiguidade temporal.
- Por exemplo, se um estudo transversal encontra uma associação entre sedentarismo e depressão, não podemos saber se o sedentarismo levou à depressão ou se a depressão fez com que a pessoa se tornasse sedentária. Essa limitação impede que estudos transversais estabeleçam relações de causalidade.
Exemplo Prático: Fatores de Risco por Nível Socioeconômico
A tabela a seguir, extraída de um grande estudo sobre desigualdades em saúde, é um exemplo típico de análise transversal. Ela mostra a média de fatores de risco cardiovascular para diferentes grupos de funcionários públicos, classificados por grau de emprego e posse de carro, em um único momento.
| Indicador | Propriedade de Carro | Profissional | Administrativo | Escriturário | Outro |
| Pressão Sistólica (mmHg) | Sim | 133.3 | 135.2 | 136.0 | 137.2 |
| Não | 133.8 | 136.8 | 135.9 | 136.2 | |
| Pressão Diastólica (mmHg) | Sim | 84.0 | 84.2 | 84.2 | 86.5 |
| Não | 83.8 | 84.8 | 84.6 | 84.5 |
Fonte: Adaptado de Davey Smith G, et al. Health inequalities: lifecourse approaches (2010), Tabela 2.
A análise revela que, entre os donos de carro, há um gradiente: quanto menor o grau de emprego, maior a pressão arterial média. Este “retrato” é útil para descrever as desigualdades em saúde, mas não pode explicar se a posição no emprego causou a mudança na pressão arterial ou vice-versa.
Os estudos transversais nos dão um retrato útil, mas para entender a sequência de eventos – o que veio antes e o que veio depois – precisamos de delineamentos que acompanhem os indivíduos ao longo do tempo.
Saiba mais sobre Estudos Transversais
3. Subindo na Pirâmide: Estudos Analíticos Observacionais
Avançando na pirâmide, chegamos aos estudos analíticos. Diferente dos descritivos, seu objetivo principal é testar hipóteses sobre as causas das doenças. Eles fazem isso comparando grupos de indivíduos para identificar se uma determinada exposição está associada a um maior ou menor risco de desenvolver uma doença.
3.1. Estudos de Caso-Controle
A lógica de um estudo de caso-controle é retrospectiva. O pesquisador começa identificando um grupo de indivíduos que já têm a doença de interesse (os casos) e um grupo de comparação de indivíduos que não têm a doença (os controles). Em seguida, ele “olha para trás” no tempo, investigando e comparando a frequência de exposições passadas entre os dois grupos. Se a exposição for mais comum entre os casos do que entre os controles, isso sugere uma associação com a doença.
- Força:
- São particularmente eficientes para estudar doenças raras, pois partem de pessoas que já estão doentes. Seria impraticável acompanhar uma grande população por anos para observar o surgimento de poucos casos de uma doença rara.
- Também são úteis para doenças com um longo período de latência (o tempo entre a exposição e o início da doença), pois não é necessário esperar anos para que a doença se desenvolva.
- Fraqueza Crítica: Viés de Memória (ou de Recordação)
- Como a informação sobre exposições passadas é coletada após o diagnóstico da doença, existe um risco significativo de viés de memória. Pessoas com uma doença (casos) podem se lembrar de suas exposições passadas de forma diferente – muitas vezes com mais detalhes ou com uma tendência a superestimar exposições que acreditam estar relacionadas à sua condição – do que pessoas saudáveis (controles). Isso pode distorcer a associação encontrada.
Exemplo Prático: Posição Socioeconômica e Risco de Câncer
Estudos encontraram associações consistentes entre baixa posição socioeconômica e maior risco de câncer de pulmão, estômago e esôfago. Para investigar essa relação, poderíamos delinear um estudo de caso-controle hipotético:
- Seleção de Casos: Identificar 500 pacientes recém-diagnosticados com câncer de pulmão em hospitais de referência.
- Seleção de Controles: Para cada caso, selecionar um controle do mesmo hospital, com idade e sexo semelhantes, mas internado por uma condição não relacionada ao câncer e não associada aos fatores de risco para câncer de pulmão (ex: cirurgia ortopédica).
- Avaliação da Exposição: Entrevistar todos os casos e controles sobre seu histórico profissional, nível de escolaridade e renda familiar ao longo da vida (exposições passadas). Note-se a dificuldade prática aqui: obter dados retrospectivos confiáveis sobre renda e ocupação ao longo da vida é um desafio metodológico imenso, e é exatamente aqui que vieses como o de memória podem se manifestar.
- Análise: Comparar a proporção de indivíduos com baixa posição socioeconômica no grupo de casos com a proporção no grupo de controles. Se essa proporção for significativamente maior nos casos, isso reforça a hipótese da associação.
Saiba mais sobre Estudos Caso-Controle
3.2. Estudos de Coorte
Considerado o delineamento observacional mais robusto, um estudo de coorte segue um grupo de pessoas (a coorte) ao longo do tempo para observar o desenvolvimento de desfechos. No início do estudo, todos os participantes devem estar livres da doença de interesse. Eles são então classificados de acordo com sua exposição a um fator de risco (ex: expostos e não expostos) e são acompanhados para comparar a incidência (o surgimento de novos casos) da doença entre os grupos.
A principal distinção está em como e quando os dados são coletados:
- Coorte Prospectiva: O pesquisador define a coorte no presente, mede as exposições e acompanha os participantes para o futuro para registrar a ocorrência de novos casos da doença.
- Coorte Retrospectiva (ou Histórica): O pesquisador utiliza registros do passado para definir a coorte, determinar o status de exposição em um ponto anterior no tempo e, em seguida, utiliza registros subsequentes (até o presente) para determinar quem desenvolveu a doença. A lógica é a mesma (exposição → desfecho), mas todo o período de acompanhamento já ocorreu no passado.
- Força Principal:
- Este é o melhor delineamento observacional para estabelecer a relação temporal correta: a exposição é medida antes do desenvolvimento da doença. Isso é um critério fundamental para a inferência causal.
- Permite calcular diretamente a incidência da doença e medidas de risco como o Risco Relativo (RR), que quantifica a força da associação.
- Fraqueza Crítica:
- Estudos de coorte prospectivos podem ser extremamente caros e demorados, exigindo anos ou décadas de acompanhamento.
- São vulneráveis a perdas de seguimento, que ocorrem quando os participantes se mudam, desistem do estudo ou falecem por outras causas. Se as perdas forem diferentes entre os grupos expostos e não expostos, os resultados podem ser enviesados.
Exemplo Prático: O Estudo de Whitehall
O Estudo de Whitehall é um famoso estudo de coorte prospectivo que foi fundamental para a epidemiologia social. Ele acompanhou milhares de funcionários públicos britânicos ao longo do tempo para investigar a relação entre posição social e saúde.
- Delineamento: No início do estudo, os funcionários foram classificados por seu grau de emprego (um indicador de posição socioeconômica) e posse de carro.
- Acompanhamento: A coorte foi seguida por mais de duas décadas, e os registros de mortalidade foram monitorados.
- Principal Achado: O estudo demonstrou “diferenças consideráveis no risco de mortalidade de acordo com dois indicadores socioeconômicos – grau de emprego no serviço civil e posse de carro”. Essa desigualdade persistiu por mais de duas décadas, demonstrando o impacto duradouro da posição social na saúde ao longo da vida. Homens nos cargos mais baixos tinham taxas de mortalidade significativamente mais altas do que aqueles nos cargos mais altos, mesmo após ajustar por fatores de risco como o tabagismo.
O impacto do Estudo de Whitehall foi imenso porque não demonstrou apenas uma diferença entre os extremos (ricos vs. pobres), mas sim um gradiente social contínuo na saúde: a cada degrau que se descia na hierarquia do serviço público, o risco de mortalidade aumentava, mesmo entre grupos de classe média que não enfrentavam privação material.
Este estudo forneceu evidências robustas de que a estrutura social é um poderoso determinante da saúde, pois estabeleceu claramente que a posição social (exposição) precedeu os desfechos de saúde (mortalidade).
Referência Clássica: Davey Smith G, Shipley MJ, Rose G. The magnitude and causes of socioeconomic differentials in mortality: further evidence from the Whitehall Study. Journal of Epidemiology and Community Health. 1990;44:260-5.
Embora os estudos de coorte sejam poderosos para observar o curso natural dos eventos, eles não são ideais para avaliar o efeito de intervenções deliberadas. Para isso, subimos mais um degrau na pirâmide.
Saiba mais sobre Estudos de Coorte
4. O Topo da Pirâmide: Estudos Experimentais e a Síntese da Evidência
No topo da pirâmide estão os delineamentos que oferecem o maior nível de evidência para a inferência causal, seja testando diretamente uma intervenção ou sintetizando toda a pesquisa existente sobre um tema.
4.1. Ensaios Clínicos Randomizados (ECR)
O Ensaio Clínico Randomizado (ECR) é considerado o “padrão-ouro” para avaliar a eficácia de uma intervenção, seja um novo medicamento, uma vacina ou um programa preventivo. Sua característica definidora é a randomização.
A randomização é o processo pelo qual os participantes do estudo são alocados aleatoriamente (como jogar uma moeda) para um de dois ou mais grupos: o grupo de intervenção (que recebe o novo tratamento) e o grupo controle (que recebe o tratamento padrão, um placebo ou nenhuma intervenção). A grande vantagem deste procedimento é que ele tende a criar grupos que são comparáveis não apenas em relação aos fatores de risco que conhecemos (idade, sexo, gravidade da doença), mas também em relação aos fatores que não conhecemos ou não medimos. Ao distribuir esses fatores de forma equilibrada entre os grupos, a randomização minimiza o viés de confusão, garantindo que a única diferença sistemática entre os grupos seja a intervenção que está sendo testada.
- Força Insuperável:
- Fornece a evidência mais forte de uma relação causal entre uma intervenção e um desfecho. Se o grupo de intervenção tiver um resultado melhor que o grupo controle, podemos atribuir essa diferença à intervenção com um alto grau de confiança.
- Fraquezas:
- Questões Éticas: É eticamente inaceitável randomizar pessoas para uma exposição que se sabe ser prejudicial (ex: não podemos sortear pessoas para fumar ou viver na pobreza para estudar seus efeitos). Isso limita os ECRs a intervenções que se acredita serem benéficas.
- Altos Custos e Complexidade: ECRs são caros, logisticamente complexos e exigem um longo tempo de planejamento e execução.
- Generalização (Validade Externa): Os participantes de um ECR são frequentemente selecionados com base em critérios de inclusão e exclusão muito rígidos, o que pode torná-los não representativos da população geral de pacientes. Isso pode limitar a aplicabilidade dos resultados do estudo a um contexto do “mundo real”.
Saiba mais sobre Ensaios Clínicos Randomizados
4.2. Revisões Sistemáticas e Metanálises
No pico da pirâmide de evidências estão as revisões sistemáticas e as metanálises. Elas não são estudos que produzem novos dados, mas sim estudos que sintetizam a evidência de pesquisas já existentes.
- Revisão Sistemática: É um método rigoroso e transparente para localizar, avaliar criticamente e sintetizar toda a pesquisa disponível sobre uma questão de pesquisa específica. O processo é explícito e replicável, minimizando o viés na seleção dos estudos.
- Metanálise: É a técnica estatística frequentemente utilizada dentro de uma revisão sistemática para combinar numericamente os resultados de múltiplos estudos. Ao agrupar os dados, a metanálise aumenta o poder estatístico e pode fornecer uma estimativa de efeito mais precisa e robusta do que qualquer estudo individual.
Embora representem o mais alto nível de evidência para muitas questões, especialmente clínicas, elas têm limitações importantes no campo da saúde pública, onde as intervenções são complexas e sociais.
“A Cochrane Library [principal repositório de revisões sistemáticas] provavelmente nunca conterá revisões sistemáticas ou ensaios sobre os efeitos de políticas fiscais nacionais redistributivas, ou de investimento econômico que leve à redução do desemprego, na saúde.”
Esta citação ilustra um ponto essencial: as questões mais importantes para a saúde da população, como os efeitos da pobreza, da educação e das políticas econômicas, não podem ser estudadas através de Ensaios Clínicos Randomizados. Consequentemente, nunca haverá revisões sistemáticas e metanálises de ECRs sobre esses tópicos. Para compreender esses determinantes sociais da saúde, a epidemiologia deve, necessariamente, depender de um conjunto de evidências bem fundamentadas provenientes dos estudos observacionais que exploramos anteriormente. É precisamente por isso que a proficiência na compreensão e avaliação crítica de estudos observacionais, como os de coorte e caso-controle, é uma habilidade indispensável para qualquer profissional de saúde pública.
Saiba mais sobre Revisões Sistemáticas e Metanálise
5. Síntese: Comparando os Delineamentos de Estudo
A jornada pela pirâmide de evidências nos mostra que cada delineamento de estudo tem um papel específico e valioso na investigação epidemiológica. A tabela abaixo resume as principais características de cada um.
| Tipo de Estudo | Objetivo Principal | Relação Temporal | Principal Vantagem | Principal Desvantagem |
| Ecológico | Gerar hipóteses em nível populacional | Exposição e desfecho simultâneos (no grupo) | Rápido, baixo custo, usa dados agregados | Falácia ecológica |
| Transversal | Medir a prevalência em um ponto no tempo | Exposição e desfecho simultâneos (no indivíduo) | Bom para planejamento de saúde (“snapshot”) | Ambiguidade temporal |
| Caso-Controle | Investigar causas de doenças raras ou com longa latência | Retrospectiva (Desfecho → Exposição) | Eficiente para doenças raras | Viés de memória (recordação) |
| Coorte | Medir a incidência e investigar causas de doenças | Prospectiva (Exposição → Desfecho) | Estabelece relação temporal; mede risco | Custo elevado, longo, perdas de seguimento |
| Ensaio Clínico Randomizado | Testar a eficácia de uma intervenção | Prospectiva (Intervenção → Desfecho) | Padrão-ouro para causalidade (intervenção) | Questões éticas, custo, baixa generalização |
Em conclusão, não existe um “melhor” tipo de estudo para todas as perguntas de pesquisa. A escolha do delineamento ideal depende da natureza da questão, dos recursos disponíveis, da frequência da doença e, fundamentalmente, de considerações éticas. A força da epidemiologia não reside em um único estudo, mas na avaliação cuidadosa e na síntese de todas as evidências disponíveis, coletadas a partir das diversas ferramentas de investigação que compõem o arsenal do detetive da saúde pública.
6. Referências Bibliográficas
- Davey Smith G, Shipley MJ, Rose G. The magnitude and causes of socioeconomic differentials in mortality: further evidence from the Whitehall Study. J Epidemiol Community Health. 1990;44(4):260-5.
- Gordis L. Epidemiologia. 6ª ed. Rio de Janeiro: Thieme Revinter; 2017.
- Almeida-Filho N, Barreto ML. Epidemiologia & Saúde: Fundamentos, Métodos e Aplicações. Rio de Janeiro: Guanabara Koogan; 2012.
- Morgenstern H. Ecologic studies. In: Rothman KJ, Greenland S, Lash TL, editors. Modern Epidemiology. 3rd ed. Philadelphia: Lippincott Williams & Wilkins; 2008. p. 511-31.
- Meneghel SN, et al. Epidemiologia: exercícios indisciplinados. Porto Alegre: Editora Rede Unida; 2016.
- Davey Smith G, Ben-Shlomo Y, Lynch J. Health inequalities: lifecourse approaches. Bristol: The Policy Press; 2010.








