A imputação genotípica é uma técnica essencial no campo da genética, especialmente quando aplicada à farmacogenética, onde buscamos entender como variações no DNA influenciam a resposta individual a medicamentos. A base desse processo está no uso de plataformas de genotipagem por microarranjos, como as da Illumina, que permitem a detecção simultânea de centenas de milhares de variantes genéticas (SNPs e Indels). No entanto, essas plataformas não capturam todas as variantes existentes no genoma humano. Para superar essa limitação, utiliza-se a imputação genotípica, que “preenche lacunas” nos dados com base em padrões herdados observados em populações de referência amplamente estudadas, como o projeto 1000 Genomes (NGUYEN et al., 2022; ABO et al, 2012). Nesse contexto, a imputação permite inferir esses marcadores faltantes e viabilizar análises mais completas, sem a necessidade de recorrer ao sequenciamento genômico completo.

O processo de mapeamento genético com essas plataformas se baseia em tag SNPs, variantes estrategicamente escolhidas por apresentarem alto desequilíbrio de ligação (LD) com outras próximas. Isso significa que, ao observar um SNP, é possível inferir outros localizados nas redondezas genômicas com alta correlação, desde que haja um painel de referência bem construído. A técnica de imputação segue um fluxo técnico relativamente padronizado: primeiro, os dados genotipados são submetidos a uma etapa de faseamento dos haplótipos, ou seja, a separação das variantes herdadas do pai e da mãe. Em seguida, esses haplótipos são comparados com os de uma base de dados de referência, e variantes ausentes são inferidas com base em semelhanças estatísticas. Softwares como IMPUTE2, Beagle e Minimac são comumente utilizados nesse processo, aplicando modelos estatísticos avançados, como algoritmos bayesianos e de máxima verossimilhança (MARCHINI e HOWIE, 2010).

Quanto à confiabilidade da técnica, diversos estudos demonstram que a acurácia da imputação para variantes comuns (frequência acima de 1%) pode ultrapassar 98%, desde que se utilize painéis compatíveis com a ancestralidade do indivíduo e arrays bem desenhados. Além disso, scores poligênicos calculados com dados imputados têm se mostrado altamente correlacionados com os obtidos por sequenciamento completo, com coeficientes superiores a 0,97 em populações diversas (NGUYEN et al., 2022). Apesar disso, variantes raras e regiões genômicas com baixa cobertura de haplótipos ainda representam um desafio técnico, exigindo cautela na interpretação dos resultados nesses contextos.


A acurácia da imputação também depende diretamente da qualidade dos dados genotípicos iniciais. Antes do faseamento, é fundamental realizar etapas rigorosas de controle de qualidade, como a filtragem de SNPs com baixa frequência alélica (MAF), desvios significativos do equilíbrio de Hardy-Weinberg (HWE), alta taxa de falha na genotipagem ou baixo call rate. O call rate avalia a proporção de genótipos efetivamente chamados para cada marcador ou indivíduo, sendo usualmente exigido um limiar mínimo de 95% ou 98% para inclusão nas análises. Esses critérios garantem que apenas variantes confiáveis sejam utilizadas no processo, reduzindo o risco de erros estatísticos na inferência de genótipos ausentes e aumentando a robustez das análises subsequentes (DAS et al., 2016; MARCHINI e HOWIE, 2010).

Em resumo, a imputação genotípica é uma ferramenta poderosa, validada e amplamente utilizada na genética de precisão. Seu uso estratégico na farmacogenética permite ampliar significativamente o poder informativo dos exames, oferecendo um excelente equilíbrio entre custo, abrangência e qualidade dos dados.


Referências

ABO, R. et al. Merging pharmacometabolomics with pharmacogenomics using “1000 Genomes” single-nucleotide polymorphism imputation. Pharmacogenetics and Genomics, v. 22, n. 4, p. 247–253, 9 fev. 2012.

DAS, S. et al. Next-generation genotype imputation service and methods. Nature Genetics, v. 48, n. 10, p. 1284–1287, 29 ago. 2016.

MARCHINI, J.; HOWIE, B. Genotype imputation for genome-wide association studies. Nature Reviews Genetics, v. 11, n. 7, p. 499–511, 2 jun. 2010. 


NGUYEN, D. T. et al. A comprehensive evaluation of polygenic score and genotype imputation performances of human SNP arrays in diverse populations. Scientific Reports, v. 12, n. 1, 20 out. 2022. 

26 de agosto de 2025 — Rodrigo Matheucci