Em formação

GWAS: por que a replicação em outra coorte é tão crucial?

GWAS: por que a replicação em outra coorte é tão crucial?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Quase todas as análises históricas de GWAS (Genome-Wide Association Studies) concordam que, para uma descoberta de GWAS ser válida, ela precisa ser replicada em uma coorte independente. Qual é exatamente a razão por trás disso? Esse critério ainda é válido mesmo quando o objetivo é buscar genes para fazer estudos funcionais, em vez de uma perspectiva clínica de busca de locos de suscetibilidade? Considerando a dificuldade em replicar algumas caracterizações fenotípicas em um grande número de sujeitos, para um biólogo tudo isso parece irrelevante.

Considere o seguinte cenário: suponha que eu tenha 5.000 indivíduos fenotipados com um orçamento para genotipar todos eles em todo o genoma. A fenotipagem requer metodologia de ponta com custos imensos, e a coorte foi fenotipada por meio de outra bolsa. Qual seria o ponto de dividir minha coorte em dois como grupos de descoberta e replicação, a não ser para economizar dinheiro em troca de poder estatístico. A isso, acrescente os estudos funcionais subsequentes nos loci associados, qual seria o objetivo de genotipar alguns SNPs em mais 500 pessoas? Se for possível encontrar essa coorte adicional, não seria uma opção melhor combinar quaisquer coortes disponíveis em uma meta-análise, em vez de usá-las para replicação?


Como uma elaboração do meu comentário.

Resumo: A replicação é necessária em estudos de GWAS para contabilizar vieses técnicos não aleatórios.

Um exemplo de tal viés é, por exemplo, um chip usado para genotipagem dando genótipos consistentemente incorretos para um locus. Nesta situação, adicionar mais sujeitos não corrigirá este efeito e, portanto, a única solução é genotipar sujeitos adicionais com outro método (por exemplo, outro chip ou protocolo experimental). Outra fonte de viés técnico não aleatório está no nível de medição do fenótipo. Você pode querer, se possível, medir o fenótipo usando outras técnicas para ter certeza de que o viés será corrigido.

Uma coorte de replicação não precisa ser enorme e o tamanho real necessário dependerá muito do tamanho do efeito do SNP visto na coorte de descoberta. Um cálculo de "poder de detecção" ajudaria a prever o tamanho necessário da coorte. Para um SNP ser significativo, ele deve passar na correção de Bonferroni, mas como você pode executar um teste estatístico no site candidato, apenas a correção geralmente não será muito adstringente (ou seja, você pode executar testes de associação em "apenas" algumas dezenas ou centenas de SNPs )

Historicamente, a replicação de GWAS também foi necessária para corrigir a estrutura da população, mas como as ferramentas evoluíram substancialmente (por exemplo, o uso de análise de componente principal) e os tamanhos de coorte são agora substancialmente maiores em comparação com os primeiros estudos de GWA, isso é menos uma preocupação. O que era necessário era amostrar independentemente outros indivíduos da mesma população ou de uma população diferente.

Para a sua situação, o que você poderia fazer é dividir sua coorte em um painel de descoberta e replicação, genotipar seu sujeito no painel de replicação usando uma técnica independente e, eventualmente, fazer o mesmo com a fenotipagem e replicar seus SNPs candidatos. O painel de replicação necessário geralmente deve ser menor do que a coorte de descoberta pelos motivos declarados no parágrafo anterior.

Para sua última pergunta sobre a meta-análise. Sim, isso também pode ser um caminho a percorrer, mas tome cuidado, pois você ainda precisará de um coorte de replicação para validar os SNPs encontrados dessa forma, resultando, portanto, exatamente na mesma problemática que você descreveu.

Espero esta ajuda!


Como acontece com todos os resultados científicos sérios, os resultados do GWAS precisam ser validados por outros. Nesse caso, é extremamente importante porque esses estudos associam mutações a doenças ou, de maneira mais geral, determinados genótipos a fenótipos, apontando assim as possíveis causas. Portanto, validar esses resultados com o uso de "amostras" independentes é de fato crucial. Mas, como eu disse, todas as descobertas científicas sérias (dignas de nota) devem ser reproduzíveis.

Editar: o ponto é aleatoriedade e subamostragem. Essa grande coorte não deve vir de uma pequena subpopulação, mas de muitas regiões do mundo. Ao dividir aleatoriamente seus indivíduos em dois ou mais grupos, você garante que outros efeitos de fundo, como frequências de variação de alelos de genes locais, diferenças de estilo de vida, etc. a média. Imagine um cenário onde você tem 90 indivíduos em 60 deles e você pode vincular o genótipo ao fenótipo. isto é 2/3 dos indivíduos. Mas se você pegar 3 subamostras de 30 indivíduos e obter 7/23, 17/13 e 6/24 (não vinculado / vinculado), isso é 76,6% (23/30), 43,3% (13/30) e 80% (24/30). Destes, você pode obter a mesma média de 66,6%, mas com desvio padrão (15,5) e intervalo de confiança não apenas um número.


O que é variação genética

A variação genética é a diferença nas sequências de DNA entre os indivíduos de uma população. A variação ocorre nas células germinativas, ou seja, espermatozóides e óvulos, e também nas células somáticas (todas as outras). Apenas a variação que surge nas células germinativas pode ser herdada de um indivíduo para outro e, assim, afetar a dinâmica da população e, em última análise, a evolução. Mutações e recombinação são as principais fontes de variação.

O que são mutações?

Mutações são a fonte original da variação genética. Uma mutação é uma alteração permanente em uma sequência de DNA. De novo (novas) mutações ocorrem quando há um erro durante a replicação do DNA que não é corrigido pelas enzimas de reparo do DNA. Somente quando o erro é copiado pela replicação do DNA e fixado no DNA é que ele é considerado uma mutação (Figura 1). As mutações podem ser benéficas para o organismo, deletérias (prejudiciais) para o organismo ou neutras (não têm efeito sobre a aptidão do organismo).

Mutações somáticas podem se acumular em nossas células e são, em sua maioria, inofensivas. Eles podem levar a alterações locais em tecidos, como manchas que aparecem na pele, e também podem ter efeitos mais graves & # 8211, por exemplo, levando ao câncer. Para saber mais sobre o papel das mutações somáticas no câncer, dê uma olhada neste artigo de Martincorena e Campbell 1. Neste curso, enfocamos a variação genética hereditária, ou seja, a variação que ocorre nas células germinativas.

figura 1 As mutações são a fonte original da variação genética. Fonte da imagem: “As causas das mutações” Entendendo a evolução. Museu de Paleontologia da Universidade da Califórnia. 22 de agosto de 2008. http://evolution.berkeley.edu/evolibrary/article/evo_20 2.

O que é recombinação?

Recombinação é outra fonte importante de variação genética Cada um de nós tem uma mistura de material genético de nossos pais. A mistura desse material genético ocorre durante a recombinação, quando as fitas homólogas de DNA se alinham e se cruzam. A recombinação efetivamente "embaralha" o DNA materno e paterno, criando novas combinações de variantes nas células germinativas filhas (Figura 2).

Figura 2 A recombinação contribui para a variação genética humana ao embaralhar o DNA dos pais e criar novas combinações de variantes. Fonte da imagem: Creation Wiki.

Aula 20: Genética Humana, SNPs e Estudos Associados do Genoma Amplo

Baixe o vídeo do iTunes U ou do Internet Archive.

Descrição: Esta palestra do Prof. David Gifford é sobre genética humana. Ele cobre como os cientistas descobrem variações no genoma humano. Ele discute como priorizar as variantes com base em sua importância. E então aborda como provar a causalidade, não apenas a correlação.

Instrutor: Prof. David Gifford

Aula 1: Introdução a.

Aula 2: Alinhamento local.

Aula 3: Alinhamento Global.

Aula 4: Geno Comparativo.

Aula 5: Biblioteca Complexi.

Aula 6: Montagem do Genoma

Leture 7: Análise ChIP-seq.

Aula 8: Sequência de RNA Ana.

Aula 9: Modelagem e Dis.

Aula 10: Markov e Hidd.

Aula 11: RNA Secundário S.

Leture 12: Introdução a.

Aula 13: Prevendo o Prot.

Aula 14: Prevendo o Prot.

Aula 15: Regulamentação de genes.

Aula 16: Protein Interac.

Aula 17: Modelagem Lógica.

Aula 18: Análise de Chr.

Aula 19: Descobrindo Qua.

Aula 20: Genética Humana.

Aula 21: Biolo Sintético.

Aula 22: Causalidade, Natu.

O conteúdo a seguir é fornecido sob uma licença Creative Commons. Seu apoio ajudará o MIT OpenCourseWare a continuar a oferecer recursos educacionais de alta qualidade gratuitamente. Para fazer uma doação ou ver materiais adicionais de centenas de cursos do MIT, visite o MIT OpenCourseWare em ocw.mit.edu.

PROFESSOR: Então, todos prontos para o rock and roll hoje? Ou pelo menos rolar? OK, se não for rock. Bem-vindo de volta à aula 20.

Na quinta-feira, teremos uma participação especial do Professor Ron Weiss só para você. Ele vai falar sobre biologia sintética. Você sabe, no quadro-negro de Richard Feynman, quando ele morreu, havia uma pequena declaração que eu sempre gostei e que estava na verdade envolta em uma pequena linha de giz. E dizia: "O que não posso criar, não entendo." E então a biologia sintética é uma maneira de abordar questões nas ciências biológicas, vendo o que podemos fazer - você sabe, organismos inteiros, novos genomas, religando circuitos. Então eu acho que você achará uma discussão muito interessante na quinta-feira.

Mas, primeiro, antes de falarmos sobre biologia sintética, temos uma discussão muito empolgante sobre genética humana, que é claro, diz respeito a todos nós. E então teremos uma exploração hoje. E você sabe, ao preparar a palestra de hoje, gostaria de apresentar as maiores e mais recentes descobertas da pesquisa. Então, vamos falar hoje de técnicas fundamentais a coisas que são muito controversas e que causaram brigas em bares, então tenho esperança de que você esteja tão envolvido quanto as pessoas que bebem cerveja.

Então, vamos voltar a isso no final da palestra, mas primeiro eu queria falar sobre o amplo arco narrativo mais uma vez, sobre o qual falaremos hoje. E vamos ver como descobrir a variação humana. Somos todos diferentes, cerca de 1 em cada 1.000. E há duas abordagens amplas diferentes que as pessoas historicamente têm usado. Microarrays para descobrir variantes, e falaremos sobre como elas foram projetadas. E falaremos sobre como realmente testar a significância da variação humana em relação a uma doença específica em um estudo de caso e controle.

E então falaremos sobre como usar dados de leitura de genoma inteiro para detectar variação entre humanos e alguns dos desafios nisso, porque não faz tantas suposições quanto os estudos de microarray e, portanto, é muito, muito mais complicado de processar . E então vamos dar uma olhada nas melhores práticas de processamento de dados lidos por humanos para que você possa entender o que é o estado da arte.

E então vamos voltar para um estudo que mostra como podemos reunir diferentes tópicos de que falamos neste assunto. Em particular, falamos sobre a ideia de que podemos usar outros sinais genômicos, como marcas de histonas, para identificar coisas como elementos reguladores. Então, vamos falar sobre como podemos pegar essa lente e focalizá-la no genoma para descobrir variantes genômicas específicas que se revelaram muito importantes em uma doença específica.

E, finalmente, falaremos sobre a ideia de que - o início sobre o qual falaremos hoje é tudo sobre correlação. E, à medida que todos vocês avançam em sua carreira científica, tenho esperança de que sempre tomem cuidado para não confundir associação ou correlação com causalidade. Você é sempre respeitado quando articula claramente a diferença ao dar uma palestra, dizendo que isso está correlacionado, mas não necessariamente sabemos que é causal até que façamos o conjunto certo de experimentos.

OK, nessa nota, vamos nos voltar para as abordagens computacionais sobre as quais falaremos. Falaremos sobre tabelas de contingência e várias maneiras de pensar sobre elas quando discutirmos como identificar se um determinado SNP está ou não associado a uma doença usando vários tipos de testes. E então falaremos sobre dados lidos e sobre testes baseados em probabilidade. Como fazer coisas como pegar uma população de indivíduos e seus dados de leitura e estimar as frequências genotípicas em um locus particular usando esses dados in toto usando técnicas baseadas em EM. OK? Então, vamos começar.

Algumas das coisas sobre as quais não vamos falar incluem falha de genotipagem não aleatória, métodos para corrigir a estratificação da população e variantes estruturais e variações do número de cópias. Iremos abordar brevemente o ponto três, mas, fundamentalmente, eles são apenas enfeites sobre as técnicas fundamentais de que estamos falando e, portanto, não quero realmente confundir a discussão de hoje.

Agora, um distúrbio Mendeliano é um distúrbio definido por um único gene e, portanto, eles são relativamente fáceis de mapear. E também tendem a estar em baixa frequência na população porque são selecionados contra, especialmente os distúrbios mendelianos mais graves. E, portanto, correspondem a mutações muito raras na população.

Em contraste, se você pensou sobre a genética que discutimos da última vez, se você pensar em uma característica que na verdade talvez seja influenciada por 200 genes e talvez um desses genes não seja necessário ou suficiente para uma doença em particular. Como consequência, pode ser uma variante bastante comum e somente se você tiver o azar de obter todas as outras 199 variantes é que você realmente terá essa síndrome. E, portanto, você pode ver que o efeito da variação no genoma humano está inversamente relacionado à sua frequência - que variantes bastante raras podem ter efeitos muito sérios, enquanto variantes bastante comuns tendem a ter menos efeitos.

E na primeira fase do mapeamento da variação humana, as pessoas pensaram que variantes comuns eram coisas que tinham uma frequência alélica na população de 5% ou mais. E então, para se aprofundar mais, o Projeto 1000 Genomes pesquisou uma coleção de diferentes populações. E, portanto, se você pensasse que uma variante prevalecia na população com uma frequência de 0,5%, quantas pessoas teriam no Projeto 1000 Genomes aproximadamente? Apenas certifique-se de que estamos bloqueados aqui. 0,5%, 1.000 pessoas -

PROFESSOR: 5, ótimo. OK. Boa. Agora, é claro, essas são três populações diferentes ou mais e, portanto, pode ser que, de fato, essa variante esteja presente apenas em uma da população. Portanto, pode ser apenas uma ou duas pessoas que realmente têm uma variante específica. Portanto, a ideia é que a maneira de projetar chips SNP para detectar polimorfismos de nucleotídeo único, também conhecidos como "SNPs", é fazer esses estudos de sequenciamento populacional e projetar a matriz com base em todas as variantes comuns que encontrar , OK? E, portanto, a matriz fornece uma leitura direta em termos de variação, em termos de todas essas variantes comuns. É onde começaremos hoje. E onde terminaremos hoje são as abordagens baseadas em sequenciamento, que não fazem suposições de qualquer espécie e simplesmente o inferno começa. Então você verá o que acontece, ok?

Mas eu queria apenas reforçar a ideia de que existem diferentes frequências alélicas de variantes e que, conforme descemos para alelos cada vez mais raros, temos efeitos maiores. Mas esses alelos de frequência mais alta também podem ter efeitos, embora sejam muito menores.

OK, então vamos falar sobre como essas variantes surgem e o que elas significam em termos de um pequeno desenho animado. Há muito, muito tempo, em um mundo muito, muito distante, ocorreu uma mutação onde uma base G foi transformada em uma base A, OK? E isso foi no contexto de uma população de indivíduos - todos indivíduos felizes e sorridentes, porque todos eles realmente não têm uma doença. E a nossa história continua, o que acontece é que tivemos mais uma geração de pessoas que são todas felizes, sorridentes porque não têm a doença. Direito? Sim, também conto histórias à noite.

E então ocorreu outra mutação. E essa mutação fez com que algum subconjunto dessas pessoas pegasse a mutação e eles pegassem a doença. Portanto, a mutação original não foi suficiente para que as pessoas contraíssem essa doença genética. Foi necessária uma segunda mutação para eles pegarem a doença genética, certo? Portanto, temos pelo menos dois genes envolvidos nisso.

OK, a outra coisa que a gente sabe é que, nesse caso particular, algumas pessoas têm a doença que não tem essa mutação. E, portanto, essa mutação não é necessária. Não é necessário nem suficiente. Ainda assim, é um marcador de um gene que aumenta o risco. E essa é uma ideia fundamental, certo, que você pode aumentar o risco sem ser necessário ou suficiente para causar um distúrbio genético específico. OK? E então você tem essa associação entre genótipo e fenótipo, e é isso que vamos procurar agora. Estamos caçando. Nós vamos procurar esse relacionamento.

Então, em certos indivíduos mais velhos - espero que não eu mesmo no futuro - o que acontece é que sua mácula, que é o centro do seu olho, degenera como mostrado aqui. E você obtém esta propriedade infeliz em que não pode realmente ver no centro do seu campo de visão. É chamada de degeneração macular relacionada à idade. Então, para procurar as causas disso, que é conhecido por ser geneticamente relacionado, os autores do estudo coletaram uma coleção - uma coorte, como é chamada - desses indivíduos descendentes de europeus, todos com pelo menos 60 anos de idade , para estudar as bases genéticas para este distúrbio. E assim eles encontraram 934 controles que não foram afetados pela degeneração macular relacionada à idade e 1.238 casos, e eles os genotiparam usando matrizes.

Agora a questão é: algum dos SNPs identificados na matriz está relacionado a esse distúrbio específico? Darei a você a resposta primeiro e depois falaremos sobre algumas maneiras diferentes de pensar sobre esses dados, certo? Então aqui está a resposta. Aqui está um SNP específico, rs1061170. Existem os indivíduos com AMD e os controles. E o que você está vendo aqui, esses números são as contagens alélicas, certo? Então, cada pessoa tem quantos alelos? Dois, certo? Isso é o dobro do número de indivíduos. E a questão é: os alelos C e T estão significativamente associados aos casos ou controles?

E então você pode calcular uma métrica de qui-quadrado nesta chamada tabela de contingência. E uma das coisas sobre as tabelas de contingência que acho importante apontar é que você ouve falar de probabilidades marginais, certo? E as pessoas provavelmente sabem que originalmente derivou da ideia dessas margens ao longo de uma tabela de contingência, certo? Se você pensar na probabilidade marginal de alguém ter um alelo C, independentemente de ser um caso ou controle, seria 2.192 sobre 4.344, certo?

Portanto, a fórmula para calcular a estatística Qui-quadrado é mostrada aqui. É um polinômio de aparência assustadora. E o número de graus de liberdade é 1. É o número de linhas menos 1 vezes o número de colunas menos 1. E o valor P que obtemos é realmente muito pequeno - 10 elevado a menos 62.Portanto, a chance de isso acontecer ao acaso - mesmo com a correção de várias hipóteses, dado que estamos testando um milhão de SNPs - é realmente muito, muito baixa. Parece um vencedor. Parece que temos um SNP associado a esta doença em particular.

Agora, apenas para lembrá-lo sobre as estatísticas de qui-quadrado - tenho certeza que as pessoas já viram isso - a formulação usual é que você calcule este polinômio de qui-quadrado no lado direito, que é o número observado de algo menos o número esperado de algo ao quadrado sobre o número esperado ou algo assim, certo? E você resume todos os diferentes casos. E você pode ver que o número esperado de As é dado pela pequena fórmula à esquerda. Basta dizer que, se você expandir essa fórmula e manipulá-la, terá a equação que tínhamos no slide anterior. Portanto, ainda é aquela fórmula chi-quadrado difusa e amigável que você sempre conheceu, apenas de uma forma diferente, OK?

Agora, há outra maneira de pensar sobre como calcular a probabilidade de ver os dados em uma tabela de contingência aleatoriamente, certo? Porque estamos sempre perguntando, isso poderia ser apenas aleatório? Quer dizer, isso poderia ter ocorrido por acaso, que vemos os dados organizados neste formulário específico? Bem, temos outra maneira conveniente de pensar sobre isso, que podemos fazer o Teste Exato de Fisher, que está muito relacionado à ideia do teste hipergeométrico de que falamos antes, certo? Quais são as chances de vermos exatamente esse arranjo?

Bem, nós precisaríamos ter, de a mais b alelos C, teríamos 8 deles ser casos, que é o primeiro termo nessa equação. E dos alelos T, precisamos ter c deles de c mais d estar lá. E então precisamos ter a mais b mais c mais d escolher a mais c - esse é o número total de chances de ver coisas. Portanto, esta é a probabilidade do arranjo na tabela neste formulário específico. Agora pessoal ... vou deixar vocês digerir isso por um segundo antes de continuar.

Portanto, este é o número de maneiras do numerador de organizar as coisas para obter a mesa da maneira que vemos sobre o número total ou formas de organizar a mesa, mantendo os totais marginais iguais. Está claro? Portanto, esta é a probabilidade, a probabilidade exata, de ver a tabela nesta configuração. E então o que você faz é pegar essa probabilidade e todas as probabilidades para todos os valores mais extremos, digamos, de a. E você soma todos e isso lhe dá a probabilidade de uma hipótese nula. Portanto, esta é outra maneira de abordar a possibilidade de um determinado conjunto de valores da tabela de contingência ocorrer aleatoriamente.

Então, se as pessoas falam sobre o Teste Exato de Fisher - você sabe, hoje à noite naquele coquetel. "Oh sim, eu sei sobre isso. Sim, é como o hipergeométrico. Não é grande coisa." Você sabe? Direito.

Tudo bem. Portanto, agora vamos supor que façamos um teste de associação e você faça o seguinte design. Você diz, bem, eu tenho todos os meus casos. Eles estão todos no Mass General e quero genotipar todos eles. E o Mass General é o melhor lugar para essa doença em particular, então vou subir lá. Preciso de alguns controles, mas estou ficando sem dinheiro orçamentário, então vou fazer todos os meus controles na China, certo? Porque eu sei que vai ser mais barato fazer o genótipo lá.

E além disso - como um pouco à parte, uma vez eu estava me encontrando com um cara que é como um dos ministros de pesquisa da China. Ele veio ao meu escritório. Eu disse, então o que você faz na China? E ele disse, bem, acho que a melhor maneira de descrever isso é que estou encarregado do equivalente da NSF, DARPA e do NIH. Eu disse, oh. Eu disse, gostaria de conhecer o presidente? Porque eu ficaria feliz em ligar para o presidente do MIT. Tenho certeza que eles ficarão felizes em conhecê-lo. Ele disse não. Ele disse, eu gosto de ir direto. Então, de qualquer forma, eu disse a ele que estava trabalhando em pesquisas com células-tronco. Ele disse, você sabe, uma coisa que posso dizer sobre a China - na China, células-tronco, ética, sem problemas.

De qualquer forma, você vai para a China fazer seus controles, certo? E por que esse é um projeto experimental ruim? Alguém pode me dizer? Você faz todos os seus casos aqui, você faz seus controles na China. Sim?

PÚBLICO: Porque os SNPs na China não são necessariamente os mesmos.

PROFESSOR: Sim. A população chinesa terá um conjunto diferente de SNPs, certo, porque é uma população contida. Então você vai pegar todos esses SNPs que você acha que vão estar relacionados à doença que são simplesmente uma consequência da estratificação da população, certo? Então, o que você precisa fazer é controlar isso. E a maneira de fazer isso é escolher um monte de SNPs de controle que você acha que não estão relacionados a uma doença e fazer um teste de qui-quadrado para ter certeza de que eles não são significativos, certo? E metodologias para controlar a estratificação da população separando seus indivíduos e agrupando-os novamente é algo que é um tópico de pesquisa atual.

E, finalmente, a boa notícia sobre a degeneração macular relacionada à idade é que existem três genes com cinco variantes comuns que explicam 50% do risco. E, portanto, tem sido visto como uma espécie de estudo muito bem-sucedido de um distúrbio genético poligênico - isto é, múltiplos genes - que foi dissecado usando esta metodologia. E com esses genes, agora as pessoas podem ir atrás deles e ver se eles podem criar uma terapêutica adequada.

Agora, usando a mesma ideia - casos, controles - você olha para cada SNP individualmente e consulta sua significância com base em um modelo nulo. Você pode pegar uma ampla gama de doenças comuns e perguntar se pode ou não detectar quaisquer elementos genéticos que possam influenciar o risco. E aqui está um conjunto de doenças diferentes, começando com o transtorno bipolar na parte superior, indo até o diabetes tipo 2 na parte inferior. Este é o chamado terreno de Manhattan, porque você vê os prédios ao longo do terreno, certo? E quando há arranha-céus, você pensa, uau, isso pode ser um problema, certo? E então esse é o estilo - veja, isso saiu em 2007 - de pesquisas que tentam fazer varreduras amplas do genoma para loci que estão relacionados a doenças específicas.

Ok, agora eu gostaria de continuar e falar sobre outras maneiras pelas quais esses estudos podem ser influenciados, que é a ideia de desequilíbrio de ligação. Então, por exemplo, digamos que eu tenho um indivíduo em particular que vai produzir um gameta e o gameta vai ser haplóide, certo? E terá um alelo de um desses dois cromossomos e um alelo de um desses dois cromossomos. Já falamos sobre isso antes da última vez. E existem quatro possibilidades - AB, aB, Ab e ab, OK? E se fosse um cara ou coroa, então cada um desses genótipos desse gameta seria idêntico, certo?

Mas vamos supor que eu lhe diga que há apenas dois resultados - este, AB, e o menor, ab, OK? Se você olhar para isso, você diz: aha, essas duas coisas estão ligadas e estão intimamente ligadas. E então, se eles são sempre herdados juntos, podemos pensar que a distância entre eles no genoma é pequena. Então, no genoma humano, qual é a distância média entre eventos de crossover durante um evento meiótico? Alguém sabe, grosso modo, quantas bases? Hm?

PROFESSOR: Uma megabase. Um pouco baixo. Quantos centimorgans tem o genoma humano? Tudo bem? Alguem sabe 3.000? 4.000? Algo parecido? Então, talvez 50 a 100 megabases entre eventos de crossover, OK? Portanto, se esses marcadores estiverem bem organizados ao longo do genoma, a probabilidade de um cruzamento é muito pequena. E, portanto, eles estarão em um LD muito alto, certo? E uma forma de medir isso é com a seguinte fórmula, que é se você ligar os dois locus - temos L1 e L2 aqui. E agora estamos falando sobre a população em vez de um indivíduo em particular. Se a probabilidade do alelo A capital ser um pedaço de A e a probabilidade do alelo B grande for um pedaço de B, então se eles estivessem completamente desvinculados, então a probabilidade de herdar ambos juntos com seria um pedaço de A vezes um pedaço de B, mostrando independência.

No entanto, se eles não forem independentes, podemos chegar a um único valor D que nos permite quantificar a quantidade de desequilíbrio entre esses dois alelos. E a fórmula para D é fornecida no slide. E, além disso, se for mais conveniente para você pensar em termos de correlação r-quadrado, podemos definir a correlação r-quadrado como D ao quadrado sobre PA, QA, PB, QB, conforme mostrado na parte inferior esquerda deste slide, ok? Esta é simplesmente uma maneira de descrever o quão enviesadas são as probabilidades de serem independentes para herdar esses dois loci diferentes em uma população. Há alguma dúvida sobre isso, os detalhes disso? OK.

Então, só para dar um exemplo, se você olhar para o cromossomo 22, a distância física na parte inferior é em quilobases, então isso é de 0 a 1 megabase na parte inferior. E você olha para os valores de r ao quadrado, você pode ver coisas que estão fisicamente muito próximas, como sugerimos anteriormente, têm um valor alto de r ao quadrado. Mas ainda existem algumas coisas que estão bem distantes que têm valores de r ao quadrado surpreendentemente altos. Existem pontos críticos de recombinação no genoma. E é, mais uma vez, um tópico de pesquisa atual tentando descobrir como o genoma se recombina e a recombinação é direcionada. Mas basta dizer que, como você pode ver, não é uniforme.

Agora, o que acontece como consequência disso é que você obtém regiões do genoma onde as coisas se unem, certo? Eles são todos amigos de bebida, certo? Todos eles saem juntos, ok? Mas aqui está o que vou perguntar a você - quanto do seu genoma veio do seu pai? Metade. Quanto veio do pai do seu pai?

PROFESSOR: E do pai do pai do seu pai?

PROFESSOR: Um oitavo, ok? Portanto, a quantidade de seu genoma que retorna à árvore genealógica está caindo exponencialmente em um determinado caminho, certo? Então, se você pensar em grupos de coisas que vieram de seu tataravô ou de seu tataravô, certo, quanto mais você volta, menos contribuição eles terão para o seu genoma. E então os blocos serão menores - ou seja, a quantidade de informações que você está obtendo no topo da árvore.

Então, se você pensar sobre isso, a questão de quais blocos de coisas são herdados juntos não é algo para o qual você possa escrever uma equação. É algo que você estuda em uma população. Você sai e pergunta, que coisas observamos vindo juntos? E geralmente, blocos maiores de coisas são herdados juntos, ocorrem em gerações mais recentes, porque há menos diluição, certo? Considerando que se você voltar no tempo - não exatamente para onde os dinossauros vagavam pela terra, mas você entendeu - os blocos são, de fato, bem pequenos.

E assim, o projeto HapMap passou a observar os blocos e como eles eram herdados no genoma. E o que basta saber é que eles encontraram blocos - aqui você pode ver três blocos diferentes. E esses são chamados de blocos de haplótipos e as coisas que são coloridas em vermelho são valores altos de r ao quadrado entre diferentes marcadores genéticos. E falamos anteriormente sobre como calcular esse valor de r quadrado. Portanto, esses blocos normalmente são herdados juntos. Sim?

PÚBLICO: Esses blocos são como limites difusos?

PROFESSOR: Não. Bem, lembre-se, neste exemplo específico, estamos apenas consultando marcadores específicos que não estão necessariamente em intervalos regulares ao longo do genoma. Portanto, neste caso, os blocos não têm limites difusos. À medida que entramos nas abordagens baseadas em sequenciamento, eles podem ter limites mais confusos. Mas os blocos de haplótipos são normalmente considerados blocos discretos que são herdados, certo? Boa pergunta. Alguma outra pergunta? OK.

Então, quero enfatizar a ideia de que isso é empírico, certo? Não há mágica aqui em termos de teoria fundamental sobre o que as coisas deveriam ser blocos de haplótipos. É simplesmente que você olha para uma população e vê quais marcadores são companheiros de bebida e aqueles que formam blocos de haplótipos e você os categoriza e cataloga empiricamente - o que pode ser muito útil, como você verá.

E assim, quando pensamos em estudos genéticos, quando pensamos sobre a extensão dos segmentos compartilhados, se você está pensando em estudar uma família, como um trio - um trio é uma mãe, um pai e uma criança, certo? Eles vão compartilhar muitas informações genéticas e, portanto, os blocos de haplótipos que são compartilhados entre esses três indivíduos serão realmente muito grandes. Considerando que se você voltar gerações, os blocos - como os primos de segundo grau ou coisas assim - os blocos ficam menores. Portanto, o eixo x neste gráfico é o comprimento médio de um segmento compartilhado. E como um estudo de associação, que está retirando pessoas aleatórias da população, tem blocos compartilhados muito pequenos, certo? E assim, as técnicas de que estamos falando hoje são aplicáveis ​​em quase todos os intervalos, mas são particularmente úteis onde você não pode depender do fato de estar compartilhando muitas informações ao longo do genoma próximo a onde o marcador é que está associado a uma doença específica.

Agora, a outra coisa que é verdade é que devemos observar que o fato de que os marcadores têm este LD associado a eles significa que pode ser que um marcador particular esteja em - o que é chamado de SNP causal. Ou algo que, por exemplo, fica no meio de um gene causando uma mutação sem sentido. Ou fica bem no meio de um sítio de ligação de proteína, fazendo com que o fator não se ligue mais. Mas também pode ser algo que está um pouco distante, mas é altamente correlacionado ao SNP causador. Portanto, lembre-se de que, quando você tem uma associação e está olhando para um SNP, pode não ser o SNP causador. Pode estar apenas vinculado ao SNP causador. E às vezes essas coisas são chamadas de SNPs de proxy.

OK, então falamos sobre a ideia de SNPs e como descobri-los. Deixe-me fazer mais uma pergunta sobre onde residem esses SNPs e ver se você poderia me ajudar. OK, este é um gene muito importante, OK? Chame de RIG para abreviar, OK? Agora, vamos supor que você saiba que existem algumas mutações aqui. E minha pergunta para você é: importa se as duas mutações são ou não assim ou se as mutações são assim, na sua opinião?

Ou seja, ambas as mutações ocorrem em uma cópia ou em um cromossomo do gene, ao passo que, no outro caso, vemos dois SNPs diferentes que são diferentes da referência, mas estão se referindo aos alelos mãe e pai. Existe alguma diferença entre esses dois casos? Sim?

PÚBLICO: Em termos do fenótipo apresentado?

PROFESSOR: Em termos de fenótipo, desculpe.

PÚBLICO: Então, se causar uma mutação recessiva, não, porque outros genes serão capazes de resgatá-la. Mas se for dominante, então ainda ...

PROFESSOR: Na verdade, é o contrário. Se for recessivo, isso importa.

PROFESSORA: Porque nesse caso, com os roxos, você ainda tem uma cópia boa do gene, certo? Porém, com os verdes, é possível que você tenha feito a ablação de ambas as cópias boas do gene, esse gene realmente importante, e, portanto, você terá um risco maior de ter um distúrbio genético. Então, quando você está examinando o genoma - você sabe, temos perguntado onde existem diferenças de referência ou entre casos e controles no genoma, mas não perguntamos se elas estão ou não na mãe ou pai, certo? Estamos apenas perguntando, eles estão aí?

Mas acontece que, para perguntas como essa, temos que saber se a mutação ocorreu ou não apenas no cromossomo da mãe ou em ambos os cromossomos dessa vizinhança em particular, certo? Isso é chamado de faseamento das variantes. Faseamento significa colocar as variantes em um cromossomo específico. E então, ao graduar as variantes, você pode descobrir algumas das possíveis consequências fenotípicas delas. Porque se eles não forem transformados, neste caso, ficará muito menos claro o que está acontecendo.

Então, a questão é: como transformamos as variantes em fases, certo? Portanto, o faseamento atribui alelos aos cromossomos dos pais. E assim, o conjunto de alelos ao longo de um cromossomo é um haplótipo. Já falamos sobre a ideia de haplótipos. Então imagine que uma forma de fase é se eu disser, por magia, nesta população que você está olhando, aqui estão todos os haplótipos e estes são os únicos que existem. Você olha nos seus haplótipos e pensa, aha, esse haplótipo existe, mas esse não tem, certo? Que este é um haplótipo - estes dois roxos juntos são um haplótipo, e este verde sem um é outro haplótipo. Então você vê quais haplótipos existem - isto é, quais padrões de herança de alelos ao longo de um cromossomo você pode detectar. E usando os haplótipos empíricos estabelecidos, você pode transformar as variantes em fases, certo?

Agora, a outra maneira de escalonar as variantes é muito, muito mais simples e muito melhor, certo? A outra maneira de definir as variantes de fase é ter apenas uma única leitura que cobre tudo, certo? E aí a leitura, vai se manifestar, certo? A leitura cobrirá toda a região e então você verá as duas mutações naquela única região do genoma. O problema que enfrentamos é que a maioria de nossas leituras são bastante curtas e estamos remontando nossos genótipos a partir de um genoma quebrado. Se o genoma não fosse destruído, não teríamos esse problema.

Então, todo mundo está trabalhando para consertar isso. A Illumina tem um truque bonitinho para consertar isso. E o PacBio, que é outro fabricante de instrumentos de sequência, pode produzir leituras com dezenas de milhares de bases, o que permite a fase direta das variantes das leituras. Mas se alguém, mais uma vez, vier até você no coquetel hoje à noite e disser, você sabe, eu nunca entendi por que você tem que fazer as variantes de fase. Sabe, esta é uma pergunta popular que ouço o tempo todo.

Você pode dizer a eles, ei, você sabe, você tem que saber se a mãe e o pai têm grandes problemas ou se todos os problemas são com a mãe, certo? Ou papai. Assim, você pode tranqüilizá-los enquanto termina os aperitivos.

OK, eu queria apenas falar sobre as variantes de fase, porque estamos prestes a passar para a próxima parte de nossa discussão de hoje. Estamos deixando o mundo muito limpo e primitivo de SNPs muito definidos, definidos por microarrays, para o mundo selvagem e confuso dos dados de sequenciamento, certo? O que é que todas as apostas estão canceladas. São todos dados de sequenciamento brutos e você tem que entender isso - centenas de milhões de leituras de sequenciamento.

Portanto, a palestra de hoje foi extraída de algumas fontes diferentes. Postei alguns deles na internet. Há um artigo muito bom de Heng Li sobre a matemática subjacente da chamada e variação do SNP que postei. Além disso, parte do material de hoje foi retirado do Genome Analysis Toolkit, que é um conjunto de ferramentas da Broad, e falaremos sobre isso durante a aula de hoje.

O melhor caso possível, quando você está olhando para dados de sequência hoje, é obter algo assim, certo? Que é que você tem uma coleção de leituras para um indivíduo e as alinha ao genoma e então vê que algumas das leituras têm um C em uma posição de base particular e outras leituras têm um T nessa posição de base. E então é uma chamada muito limpa, certo? Você tem um heterozigoto CT nessa posição - isto é, qualquer pessoa que seja é um heterozigoto lá.Você pode ver o genoma de referência bem no fundo, certo? Portanto, é muito difícil para você ler no verso, mas C é o alelo de referência.

E o modo como o visualizador IGV funciona é que ele mostra alelos não-referência em cores, então todos esses são os alelos T que você vê lá em vermelho, OK? E é muito, muito bonito, certo? Quer dizer, você pode dizer exatamente o que está acontecendo. Agora não sabemos se o alelo C ou T são mãe e pai respectivamente, certo? Não sabemos em qual dos cromossomos eles estão, mas basta dizer que é muito limpo.

E a maneira como tudo isso começa, claro, é com um arquivo BAM. Vocês já viram arquivos BAM antes. Eu não vou insistir nisso. Há uma definição aqui e você pode adicionar anotações extras nos arquivos BAM. Mas a outra coisa que gostaria de salientar é que você sabe que os arquivos BAM incluem índices de qualidade. Portanto, usaremos essas pontuações de qualidade em nossa discussão.

A saída de tudo isso normalmente é algo chamado de arquivo de chamada de variante ou arquivo VCF. E para que você não fique completamente assustado com esses arquivos, quero descrever um pouco sobre sua estrutura. Portanto, há um cabeçalho no topo informando o que você realmente fez. E então o cromossomo 20 neste local de base tem este SNP. O alelo de referência é G, o alelo alternativo é A. Estas são algumas das estatísticas descritas por esta informação de cabeçalho, como DP é a profundidade de leitura. E isso informa o status de um trio que você processou.

Portanto, este é o número do alelo de um dos cromossomos, que é 0, que é um G. O outro é um G e assim por diante. E então esses dados aqui são GT, GQ, GP, que são definidos aqui. Então você tem uma pessoa, segunda pessoa, terceira pessoa, junto com qual dos alelos, 0 ou 1, eles têm em cada um de seus cromossomos, OK?

Portanto, esta é a saída. Você coloca leituras brutas e o que obtém é um arquivo VCF que, para bases ao longo do genoma, chama variância, certo? Então é só isso, certo? Você recebe seus dados lidos. Você pega seu genoma e joga no sequenciador. Você pega o arquivo BAM, chama as variantes e depois faz o diagnóstico médico, certo?

Então, vamos falar sobre o que acontece no meio, aquele pequeno passo - como você realmente chama as variantes? E você pode dizer, caramba, isso não parece muito difícil. Quer dizer, olhei para o slide que você me mostrou com o heterozigoto CT. Isso ficou lindo, certo? Quer dizer, isso foi simplesmente lindo. Quer dizer, esses sequenciadores são tão bons e fazem tantas leituras, o que pode ser difícil nisso, afinal? Sabe, faltam quinze para as 14h, hora de ir para casa. Não é bem assim, ok? Não exatamente.

O motivo é que os dados reais são assim. Então, essas são todas as leituras alinhadas ao genoma e, como eu disse antes, todas as cores são bases sem referência. E então você pode ver que as leituras que saem de um indivíduo são realmente muito confusas. E, portanto, precisamos lidar com eles de uma forma baseada em princípios. Precisamos fazer avaliações boas e probabilísticas sobre a existência ou não de uma variante em uma base específica. E não vou entrar em detalhes em todas as etapas do Genome Analysis Toolkit, basta dizer que aqui está um fluxograma de todas as etapas que o percorrem. Primeiro, você mapeia suas leituras. Você recalibra as pontuações. Você compacta o conjunto de leitura e, em seguida, tem conjuntos de leitura para n indivíduos diferentes. E então vocês chamam as variantes em conjunto e depois melhoram as variantes e depois avaliam, ok?

Portanto, irei abordar alguns dos aspectos deste pipeline, aqueles que considero mais relevantes, para que você possa apreciar um pouco da complexidade de lidar com isso. Deixe-me começar com a seguinte pergunta. Suponhamos que você tenha um genoma de referência aqui, indicado por esta linha, e alinhe uma leitura a ele. E então há alguns erros básicos que não são de referência, então suas variantes são chamadas no final da leitura, OK? Portanto, este é o cinco primos, três primos. E então você alinha uma leitura da fita oposta e tem algumas chamadas variantes na extremidade oposta da leitura como esta.

E você vai dizer para si mesmo, o que pode estar acontecendo aqui, sabe? Por que eles não são concordantes, certo, quando são mapeados, mas estão na mesma região do genoma? E então você pensa consigo mesmo, bem, o que acontece se eu mapear isso corretamente aqui para o genoma de referência e isso corretamente para o genoma de referência aqui, mas este indivíduo na verdade tinha um cromossomo que teve uma deleção bem aqui, OK? Então o que aconteceria seria que todas essas leituras aqui embaixo ficariam desalinhadas, todas essas bases ficariam desalinhadas com a referência. E então você receberá chamadas de variantes. E essas bases também ficarão desalinhadas com a referência, você receberá chamadas de variantes.

Portanto, as exclusões em um indivíduo podem fazer com que as coisas sejam mapeadas, mas você recebe chamadas variantes no final. E isso é mostrado aqui, onde você tem leituras que estão sendo mapeadas e você tem chamadas de variantes no final das leituras. E também é um pouco suspeito porque no meio aqui está um homopolímero de sete pares de bases que são todos T's. E, como sabemos, os sequenciadores são notoriamente ruins na leitura correta de homopolímeros. Então, se você corrigir as coisas, descobrirá que alguma fração das leituras realmente tem um dos T faltando e todas as variantes que estavam presentes antes desaparecem. Portanto, este é um processo de ajuste de INDEL quando você está mapeando a região em busca de variantes.

Agora, isso não ocorre, estamos falando de microarrays SNP. Portanto, este é um problema exclusivo do fato de que estamos fazendo muito menos suposições quando mapeamos leituras para o genoma de novo.

A segunda e outra etapa muito importante da qual eles estão muito orgulhosos é essencialmente - eu acho como colocar isso educadamente - descobrir que os fabricantes de instrumentos de sequenciamento, como você sabe, para cada base que eles fornecem, eles fornecem uma estimativa da probabilidade de que a base esteja correta - ou errada, na verdade. A chamada pontuação de Phred - já falamos sobre isso antes. E, como você pode imaginar, os instrumentos dos fabricantes às vezes são otimistas, para dizer o mínimo, sobre a qualidade de suas partituras. E então eles fizeram um levantamento de um monte de instrumentos e compararam a pontuação relatada com a pontuação real, certo?

E então eles têm toda uma etapa em seu pipeline para ajustar as pontuações, seja você um instrumento Solexa GA, um instrumento 454, um instrumento SOLiD, um instrumento HiSeq ou o que quer que seja. E há uma maneira de ajustar a pontuação com base na pontuação bruta e também em quão baixo você está na leitura, como mostra a segunda linha. A segunda linha é uma função da correção da pontuação em relação ao nível de leitura ou número de ciclos que você percorreu. E na parte inferior estão os ajustes para os dinucleotídeos, porque alguns instrumentos são piores para certos dinucleotídeos do que outros.

Como você pode ver, eles têm muito orgulho da parte superior esquerda. Este é um dos principais avanços metodológicos do Projeto Genoma 1000, descobrindo como recalibrar pontuações de qualidade para instrumentos. Por que isso é tão importante? A razão pela qual é importante é que a estimativa da veracidade dos números baseiam-se no centro para determinar se uma variante é real ou não. Portanto, você precisa ter a melhor estimativa possível se uma base que sai do sequenciador está correta ou não, certo?

Agora, se você está fazendo muito sequenciamento de indivíduos ou exomas - devo falar sobre o sequenciamento de exomas por um momento. Até recentemente, não era realmente prático fazer o sequenciamento do genoma completo de indivíduos. É por isso que essas matrizes SNP foram originalmente inventadas. Em vez disso, as pessoas sequenciaram a parte expressa do genoma, certo? Todos os genes. E eles podem fazer isso por captura, certo? Eles vão pescar. Eles criam varas de pesca com os genes com os quais se importam e retiram as sequências desses genes e as sequenciam. Então você está olhando para um subconjunto do genoma, mas é uma parte importante.

No entanto, quer você faça ou não o sequenciamento do exoma ou do genoma inteiro, você tem muitas leituras. E assim, as leituras com as quais você se preocupa são as leituras que são diferentes da referência. E assim você pode reduzir a representação de seu arquivo BAM simplesmente jogando no chão todas as leituras que não importam, certo? E aqui está um exemplo do arquivo BAM original e todas as leituras, e o que você faz é apenas ajustá-lo para apenas as regiões variáveis, certo? E então você está removendo informações em torno das regiões variantes do arquivo BAM e as coisas se comprimem enormemente e o processamento posterior se torna muito mais eficiente. OK.

Agora, vamos voltar para as abordagens metodológicas, uma vez que tenhamos os dados da melhor forma possível, temos as melhores pontuações de qualidade possíveis e, para cada posição de base, temos uma indicação de quantas leituras dizem que a base é esta e quantas leituras dizem que a base é aquilo, OK? Portanto, temos essas contagens de leitura bruta das diferentes formas alélicas. E voltando a isso, agora podemos voltar e tentar fazer essas leituras e determinar quais são os genótipos subjacentes para um indivíduo.

Agora, quero deixar claro a diferença entre um genótipo para um indivíduo e um espectro alélico para uma população. Um genótipo de um indivíduo pensa em ambos os alelos que esse indivíduo possui, e eles podem ser faseados ou não, certo? Se eles estiverem em fase, significa que você sabe qual alelo pertence à mãe e qual alelo pertence ao pai, por assim dizer, certo? Se eles não forem faseados, você simplesmente saberá o número de alelos de referência que possui naquele indivíduo. Normalmente, as pessoas pensam que existe um alelo de referência e um alelo alternativo, o que significa que um genótipo pode ser expresso como 0, 1 ou 2, que é o número de alelos de referência presentes em uma base particular se não for faseada, certo? 0, 1 ou 2-- 0 significa que não há alelos de referência, 1 significa que é um heterozigoto, 2 significa que há dois alelos de referência naquele indivíduo. OK?

Portanto, existem diferentes maneiras de representar o genótipo, mas, mais uma vez, ele representa as diferentes formas alélicas dos dois cromossomos. E qualquer que seja a forma que você escolher, a probabilidade sobre esses genótipos tem que somar 1. Você pode pensar sobre o genótipo variando sobre todas as bases possíveis da mãe e do pai ou mais de 0, 1 e 2. Não importa, dependendo de que maneira você deseja simplificar o problema.

E o que gostaríamos de fazer é, para uma dada população - digamos casos ou controles - gostaríamos de calcular a probabilidade sobre os genótipos com alta veracidade, OK? Então, para fazer isso, vamos começar fazendo todas as leituras para cada um dos indivíduos em uma população, OK? E vamos calcular as probabilidades do genótipo para cada indivíduo. Então, vamos falar sobre como fazer isso.

Agora tudo o que escrevi no quadro está no próximo slide. O problema é que, se eu colocar no slide, ele vai piscar na sua frente e você vai, sim, eu entendo isso, eu acho. Assim, primeiro colocarei no quadro e você olhará e dirá, hm, talvez eu não entenda isso, eu acho. E então você fará qualquer pergunta e podemos olhar para o slide em um momento, OK? Mas aqui está a ideia fundamental, certo? Em uma determinada base do genoma, a probabilidade das leituras que vemos com base no genótipo que pensamos que existe pode ser expressa da seguinte forma, que é que tomamos o produto sobre todas as leituras que vemos, OK? E o genótipo será uma composição da base que obtemos da mãe e da base que obtemos do pai, ou pode ser simplesmente 0, 1 e 2. Vamos deixar isso de lado por um momento.

Qual é a chance de herdarmos algo de uma base específica da mãe? É esta base sobre uma leitura particular. Qual é a chance de uma determinada leitura vir do cromossomo da mãe? Isso é metade da probabilidade dos dados, dada a base que vemos. E mais uma vez, já que poderia ser um cara ou coroa se a leitura viesse do cromossomo da mãe ou do pai, divida por 2 - a probabilidade dos dados que vemos com a versão do pai dessa base particular.

Portanto, mais uma vez, para todas as leituras, vamos calcular a probabilidade do conjunto de leituras que vemos, dado um determinado genótipo hipotético, observando qual é a probabilidade ou a probabilidade de todas essas leituras. E para cada leitura, não sabemos se veio da mãe ou do pai. Mas, em qualquer caso, vamos calcular a probabilidade no próximo quadro-negro, este bit bem aqui. OK? Sim?

PÚBLICO: Então, se você presumir que a mãe e o pai têm uma fase diferente em uma base específica, isso não poderia distorcer a probabilidade de obter uma leitura do cromossomo da mãe ou do cromossomo do pai?

PROFESSOR: Uma fase diferente?

PÚBLICO: Portanto, a composição das bases afeta o que você obtém. Eu acho que certas composições de base são mais prováveis ​​de serem sequenciadas, por exemplo.

PROFESSOR: Sim. Na verdade, acho que é por isso que no terceiro slide, eu disse que o erro de genotipagem não aleatório estava sendo excluído.

PROFESSOR: Certo? Da nossa discussão de hoje? Mas você está certo que pode ser que certas sequências sejam mais difíceis de ver, mas vamos excluir isso por enquanto. OK?

Portanto, esta é a probabilidade das leituras que vemos, dado um genótipo hipotético. E vou apenas mostrar a você, isso é muito simples. Que temos uma leitura, vamos chamar de leitura D sub j, e temos a base que achamos que deveríamos ver. E se a base estiver correta, então a probabilidade de que isso esteja correto é 1 menos o erro, certo, que a máquina relatou. E se não estiver correto, a probabilidade é apenas o erro naquela base que a máquina relatou. Portanto, estamos usando as estatísticas de erro da máquina e se corresponder ao que esperamos, é 1 menos o erro. E se não corresponder, simplesmente será o erro relatado, certo?

Portanto, essa é a probabilidade de ver uma determinada leitura dada uma base hipotética que deveria estar lá. É assim que usamos isso, olhando para todas as bases possíveis que poderiam estar lá, dado um genótipo hipotético. Lembre-se de que esse genótipo será apenas um par. Vai ser apenas AA ou TT ou o que for, certo? Portanto, será um par. Então, vamos testar se uma ou duas bases estão presentes.

E, finalmente, queremos calcular a posterior do genótipo, dados os dados que observamos, OK? Portanto, queremos calcular qual é a probabilidade do genótipo, dadas as leituras que temos em nossas mãos. Isso é muito importante. Essa é a probabilidade desse genótipo lá em cima. É a probabilidade do conjunto de leitura dado o genótipo vezes a probabilidade do genótipo - este é um anterior - sobre a probabilidade dos dados. Esta é simplesmente a regra de Bayes. Assim, com isso, para um indivíduo agora, podemos calcular a posterior do genótipo dado o conjunto de leitura. Conceito muito simples.

Então, de outra forma, você pode ver a mesma coisa aqui, que é o modelo Bayesiano. E falamos sobre essa função de probabilidade haplóide, que estava no quadro-negro que mostrei. E estamos assumindo que todas as leituras são independentes e que virão igualmente da mãe e do pai, mais ou menos, etc., certo? E a função de verossimilhança haplóide, mais uma vez, está apenas usando as estatísticas de erro da máquina. Então, estou perguntando se a máquina diz que este é um A e acho que é um A, então a probabilidade de que isso seja correto é 1 menos o erro da máquina. Se os dois não estiverem de acordo, é simplesmente o erro na máquina que estou usando.

Isso me permite agora dar uma probabilidade posterior de um genótipo, dado um monte de leituras. E a única parte que não discutimos é esta anterior, que é como estabelecemos o que pensamos que está acontecendo na população e como estabelecemos isso? Então, se você olhar novamente para o slide, você pode ver que temos esses indivíduos e há esse passo mágico no lado direito, que é que, de alguma forma, vamos calcular uma estimativa conjunta em todas as amostras que surgirem com uma estimativa de quais são os genótipos em uma determinada posição SNP.

E a maneira como podemos fazer isso é com um procedimento EM iterativo - semelhante a este - para que possamos estimar a probabilidade do genótipo da população iterativamente usando esta equação até a convergência. E existem vários truques. Como você verá, se quiser se aprofundar mais nisso no artigo que postei, existem maneiras de lidar com algumas das questões numéricas e fazer a contagem de alelos de frequências e assim por diante. Mas, fundamentalmente, em uma população, vamos estimar uma probabilidade sobre os genótipos para uma posição particular.

E apenas para mantê-lo simples, você pode pensar nos genótipos sendo 0, 1 ou 2-- 0, nenhum alelo de referência presente 1, um alelo de referência presente naquele local 2, dois alelos de referência presentes naquele local, OK? Portanto, obtemos uma probabilidade de cada um desses estados para essa população. Alguma dúvida sobre isso? Os detalhes ou qualquer coisa? As pessoas têm a ideia geral de que o que estamos apenas fazendo é fazer um monte de leituras em uma determinada posição para um indivíduo e computar a probabilidade posterior de um genótipo ver todas essas leituras e, então, quando pensamos sobre a totalidade população - digamos os casos ou os controles - estamos calculando a probabilidade sobre os genótipos dentro dessa população usando este tipo de procedimento iterativo.

OK, continuando então, se voltarmos ao nosso 0, 1, 2 tipo de representação do genótipo, podemos marginalizar psi, que é a probabilidade do alelo de referência estar na população, e 1 menos psi sendo a probabilidade do alelo não de referência, onde os alelos capitais são referência e os pequenos são não referência. E então poderíamos também para epsilon 0, epsilon 1 e Epsilon 2, essas são as probabilidades das várias formas alélicas, os vários genótipos. E, na verdade, acho que o epsilon 0 deve ser um pouco A, um pouco A. Deve ter invertido os dois, mas não é tão importante.

OK, então o que sabemos sobre uma população? Quem já ouviu falar de Hardy-Weinberg antes? Equilíbrio de Hardy-Weinberg? OK. Então o equilíbrio de Hardy-Weinberg diz que, por exemplo, em uma população, se a frequência alélica do alelo de referência é psi, certo, qual é a chance de que um indivíduo seja AA, grande A, grande A, referência, referência? Em uma população? Perdão? Acho que ouvi. Psi ao quadrado, certo? Vamos supor organismos diplóides, vamos supor acasalamento aleatório, vamos supor nenhuma seleção, vamos supor que não há gargalos e assim por diante, certo? Com o tempo, a população chegará ao equilíbrio na troca de alelos.

No entanto, se houver uma seleção forte ou se parte da população se levantar e se mudar para um continente diferente ou algo assim, você pode ficar fora de equilíbrio. E então uma pergunta, sempre que você está fazendo um estudo genético como este - sua população está em equilíbrio ou não? E temos uma maneira direta de testar isso porque estamos estimando os genótipos, certo?

Então, o que podemos fazer é este teste.Podemos fazer um teste de probabilidade de log diretamente, certo? E podemos comparar a probabilidade dos genótipos observados - estes são E1 e E2, onde o número indica o número de cópias de referência - sobre a probabilidade dos genótipos serem compostos diretamente da frequência do alelo de referência. E isso nos dirá se eles são concordantes ou não. E se o valor do Qui-quadrado for grande o suficiente, diremos que essa divergência não pode ter ocorrido ao acaso e, portanto, a população não está em equilíbrio.

E você pode dizer, bem, puxa, por que eu realmente me importo se ele está em equilíbrio ou não? Quer dizer, você sabe, que relevância isso tem para mim quando estou fazendo meu teste? Bem, aqui está o problema. A questão é esta - você vai testar se os genótipos são ou não diferentes entre um caso e uma população de controle, digamos, certo? E você tem alguns testes diferentes que pode fazer. O primeiro teste é o teste na parte superior e o segundo teste é o teste na parte inferior. Vamos dar uma olhada no teste na parte inferior por um momento, certo?

O teste na parte inferior está dizendo que você considera a probabilidade dos dados no grupo um e no grupo dois multiplicados juntos sobre a probabilidade dos dados com os grupos combinados e você pergunta se a probabilidade aumentada - você está disposto a pagar por que dados os dois graus de liberdade que o modelo implica, certo? Porque você precisa de dois graus de liberdade adicionais para pagar por isso no fundo.

Por outro lado, no topo, você só tem um grau de liberdade adicional para pagar pela diferença simplesmente na frequência do alelo de referência. E, portanto, essas são duas métricas diferentes que você pode usar para testar associações para um determinado SNP em duas populações de caso e controle diferentes. O problema é que se a população está em equilíbrio, então o fundo tem muitos graus de liberdade, certo? Porque a parte inferior, em certo sentido, pode ser calculada diretamente a partir da parte superior. Você pode calcular os ípsilons diretamente do tamanho se estiver em equilíbrio. Portanto, você precisa saber se está ou não em equilíbrio para descobrir que tipo de teste usar para ver se um determinado SNP é significativo ou não.

OK, apenas uma breve revisão a que chegamos neste ponto. Eu entreguei a você uma cesta de leituras. Estamos nos concentrando em um local específico no genoma. Para um indivíduo, podemos olhar para essa cesta de leituras e calcular uma probabilidade posterior do genótipo naquele local. Perguntamos então se tomarmos todos os indivíduos em uma dada população interessante, como os casos, poderíamos computar a posterior ou a probabilidade do genótipo sobre todos esses casos. Podemos então pegar os casos e os controles e testar as associações usando essa razão de verossimilhança, certo? Então esse é o caminho a percorrer na questão dos SNPs. E vou fazer uma pausa aqui e ver se há outras perguntas sobre isso.

OK, agora existem muitas outras maneiras de abordar a variação estrutural. Eu disse que tocaria no assunto. Há outro método que é - não temos atribuído aqui quais haplótipos às coisas ou prestando atenção a qual cromossomo, mãe ou pai veio um alelo em particular. Mas basta dizer - vou deixar você ler este slide quando quiser - o principal é que, imagine que você tem um monte de leituras. O que você pode fazer em uma área específica, haverá uma variante, é fazer a montagem local das leituras. Queremos fazer uma montagem local porque a montagem local lida com casos gerais de variação estrutural.

E se você pegar os casos mais prováveis ​​da montagem local apoiada por leituras, terá os diferentes haplótipos ou coleções de bases possíveis ao longo do genoma da montagem. E já falamos sobre, no início da aula, como pegar uma dada sequência de bases e estimar a probabilidade de divergência de outra string. Assim, você pode estimar a divergência de cada uma dessas montagens a partir da referência e calcular as probabilidades, como fizemos antes para bases únicas, embora seja um pouco mais complexo.

E outra maneira de abordar isso é, em vez de perguntar sobre bases individuais e olhar para a probabilidade de bases individuais, você pode fazer uma montagem localizada das leituras que lidam com a variação estrutural. E se você fizer isso, o que acontece é que você pode recuperar problemas de INDEL que parecem chamar variantes SNP que na verdade são induzidas por inserções e exclusões em um dos cromossomos. Como você pode ver, à medida que as coisas ficam mais sofisticadas na análise dos dados do genoma humano, é necessária uma variedade de técnicas, incluindo montagem local, para ser capaz de recuperar o que está acontecendo. Porque, é claro, o genoma de referência é apenas uma ideia aproximada do que está lá e está sendo usado como um andaime.

Já falamos sobre a ideia de faseamento, e falamos sobre por que o faseamento é importante, especialmente quando estamos tentando recuperar, haja ou não um evento de perda de função, certo? E então a parte da genômica em fases agora é altamente heurística, depende parcialmente de dados empíricos de coisas como o Projeto HapMap e está fora do escopo do que vamos falar, porque poderíamos falar sobre a fase de uma palestra inteira. Mas basta dizer que é importante.

E se você olhar o que realmente acontece, aqui está um trio, mãe, pai e filha. Você pode ver na parte inferior, você vê as leituras da mãe. E você vê que o pai na verdade tem dois haplótipos. Ele obteve um haplótipo de um de seus pais e o outro haplótipo de ambos os pais. E então a filha realmente tem o haplótipo número um do pai e nenhum haplótipo número um da mãe. Portanto, você pode ver como esses blocos de mutações são herdados ao longo da geração nesta forma.

E, finalmente, se você olhar para um arquivo VCF, se você vir uma barra vertical, isso indica que a origem cromossômica é fixa. Portanto, ele diz a você, por exemplo, neste caso, aquele para o qual a flecha está apontada é aquela variante número um, que é a variante alternativa T veio da mãe e um T veio do pai. Portanto, o VCF, quando tem barras entre os dois alelos diferentes de um genótipo, não tem fase, mas na verdade você pode ter uma versão do VCF em fases. E então há toda uma fase no kit de ferramentas do GATK que faz o faseamento.

E, finalmente, superando tudo isso, a questão é: quão importantes são as variantes que você descobre? E então há uma fase de análise de variantes e ela passará e anotará todas as variantes. Por exemplo, esta é uma variante aceitadora de sítio de splice que está em um gene de revestimento de proteína e é considerada importante. E então, no final desse pipeline, o que vai acontecer é que você vai cuspir não apenas as variantes, mas, para algumas delas, quais são suas funções anotadas.

OK, então isso termina a parte de nossa palestra em que falamos sobre como processar dados lidos brutos. E eu encorajo você a olhar para o GATK e outros sites para realmente olhar o estado da arte. Mas, como você pode ver, é uma disciplina em evolução que tem um núcleo de análise probabilística principal em parte de seu núcleo cercado por um monte de arame de enfardar, certo, para mantê-lo todo unido. E você obtém as leituras organizadas, organizadas, compactadas, alinhadas corretamente, em fases e assim por diante, OK?

Vamos falar agora sobre como priorizar as variantes. E eu só queria mostrar a vocês um resultado muito bonito que é representado por este artigo, que saiu muito recentemente. E aqui está uma parte do genoma. E estamos olhando aqui - você vê aqui - um distúrbio pancreático. E há um realçador no lado direito da tela, onde está aquele pequeno quadrado vermelho.

E lembre-se de que dissemos que certas marcas de histonas estavam presentes tipicamente sobre intensificadores ativos. E então você pode ver a marca de mono-metil H3K4 presente sobre aquela pequena caixa vermelha, bem como a ligação de dois reguladores pancreáticos, FoxA2 e Pdx1. E dentro desse intensificador, você pode ver que há muitas variantes sendo chamadas. Bem, não muito. Na verdade, existem cinco variantes diferentes sendo chamadas. E, além dessas cinco variantes SNP específicas, há também outra variação que foi observada na população de uma deleção de 7,6 kb ao redor desse intensificador. E se você observar a herança dessas mutações com a prevalência da doença, verá que há uma correlação muito marcada. Que quando você herda essas variantes, você adquire esse distúrbio mendeliano. Portanto, é um distúrbio de um único gene, na verdade.

E, para confirmar isso, o que os autores deste estudo fizeram foi pegar aquele potenciador e olhar para todos os SNPs diferentes e transformá-lo. E no canto superior esquerdo, você pode ver que os cinco pequenos asteriscos observam a diminuição na atividade desse realçador quando eles mutaram as bases indicadas nas posições SNP. Os três Cs no painel à direita com o eixo y sendo a interação relativa mostra que esse intensificador está interagindo com o promotor desse gene. E eles elucidaram ainda mais os motivos com os quais estavam interagindo e as flechas apontam para onde ocorrem as mutações nesses motivos. Então, eles passaram de uma associação com aquela doença em particular para a caracterização funcional real do que está acontecendo.

Vou deixar você com um pensamento final para pensar. Isso é o que causou as brigas nos bares de que falei no início da palestra de hoje. Suponhamos que você olhe para gêmeos idênticos, gêmeos monozigóticos, e faça a seguinte pergunta. Você diz, OK, em gêmeos monozigóticos, a prevalência de uma determinada doença é 30% correlativa. Ou seja, se um indivíduo de um gêmeo tiver a doença, há 30% de chance de o outro gêmeo contraí-la. Agora, há duas possibilidades aqui, que é que para todos os pares de gêmeos, há um risco muito baixo de você conseguir, ou de que haja algum subconjunto de genótipos onde se um gêmeo tem, o outro sempre vai para obtê-la.

Portanto, o autor do estudo realmente olhou para um bloco de dados de gêmeos idênticos e fez duas perguntas. A primeira era se você olhar para a porcentagem de casos com teste positivo, sem fazer suposições sobre o genótipo, usando dados de gêmeos, você pode ver que a porcentagem de pessoas que realmente têm uma doença com teste positivo é bastante baixa para uma ampla variedade de doenças. Todas essas doenças foram estudadas no contexto de gêmeos idênticos. E isso sugeriu a eles que, de fato, o sequenciamento genômico pessoal pode não ser tão preditivo quanto se poderia desejar. Ou seja, se você tiver uma doença, para mais da metade deles o teste não será positivo. E, além disso, se o seu teste for negativo para a doença, seu risco relativo - isto é, a chance de você obter esta doença em relação à chance de obtê-la aleatoriamente na população - não é realmente reduzido tanto.

E assim, uma vez que este estudo se baseou apenas em dados de gêmeos e não fez nenhuma outra suposição, ele levantou a questão no campo de até que ponto o sequenciamento do genoma pessoal vai ser realmente útil? Por isso, falamos muito hoje sobre a análise da variação genética humana. Espero que você tenha gostado. Mais uma vez, na quinta-feira, temos Ron Weiss vindo. Muito obrigado. Isso conclui a aula 20 do material formal do curso e nos vemos na aula. Muito obrigado.


Curas ‘Nova Biologia’ Antes que a doença ataque

A caça de genes isolados dá uma imagem completa de como o corpo humano funciona e como as doenças se desenvolvem. Em vez disso, devemos olhar para as redes de genes e proteínas, diz o professor Johan Björkegren da Universidade de Tartu.

Professor Johan Björkegren. Crédito da imagem: Camilla Svensk.

Você publicou um artigo de revisão na Science Translational Medicine, onde fala sobre ‘nova biologia’. O que há de errado com o antigo?

Estamos usando 'novo' em um duplo sentido (também abreviação de 'sabedoria habilitada para rede' - A.O.). Queríamos nos referir ao fato de que, para os pesquisadores, não era possível abordar outro senão, talvez, um único gene ou uma única proteína e, em seguida, tentar descobrir o papel de uma determinada proteína em um determinado caminho.

Não estamos dizendo que havia algo errado com isso, mas não havia ferramentas para fazer mais nada. Em todo o mundo, a maioria dos professores de biologia e medicina são professores porque são especialistas em um caminho específico, às vezes até em um gene específico.

Desde a mudança do milênio, tem havido grande crença no que aconteceria com o novo conhecimento do genoma. É um pouco como entrar em uma biblioteca. A biblioteca com todos os livros e as informações que está lá é incrível, mas se você não sabe o que procurar, você se perde.

Isso descreve um pouco do que aconteceu quando vimos a biblioteca inteira na virada do milênio. Acho que os primeiros dez anos foram uma grande decepção, mas agora estamos começando a entender que o genoma é muito complexo. Para entender o genoma, precisamos entender o que é ativado no genoma.

Com a nova biologia, quando podemos rastrear a atividade dos genes, também podemos entender que em diferentes tipos de células, e também em condições fisiológicas e patológicas, diferentes seções da biblioteca são utilizadas. Dependendo de qual seção específica é usada em uma célula específica - digamos, uma célula do fígado - entendemos quais variantes de DNA são importantes para aquela situação específica. A nova biologia se baseia no fato de que existem todas essas novas ferramentas que são exigentes de muitas maneiras.

Quais ferramentas?

Além dos widescreens do genoma, também precisávamos de uma maneira de lidar com todo esse big data, como eles o chamam com mais frequência agora. Não só geramos, mas também precisamos analisá-lo. É nisso que [co-autor, professor da Escola de Medicina Mount Sinai] Eric Schadt tem sido realmente instrumental. Ele desenvolveu muitas maneiras úteis de analisar a data do genoma humano para encontrar essas redes.

Três desenvolvimentos foram fundamentais no uso da nova biologia: o desenvolvimento da Internet, o desenvolvimento de novas tecnologias de sequenciamento e também o desenvolvimento de algoritmos para inferir redes a partir desse tipo de dados.

Como descrever essas redes de genes ou proteínas ativas?

Se você observar a forma como transportamos as coisas, não transportamos as coisas diretamente de uma pequena cidade para outra, mas sim usamos hubs. Os verdadeiros grandes hubs, se você olhar para os aeroportos, por exemplo, são poucos. Além disso, nas redes sociais, a maioria das pessoas não tem interações além da família e talvez de alguns amigos.

Mas existem essas pessoas que estão muito bem conectadas. A maioria de nós conhece alguém que conhece alguém que é realmente famoso ou bem relacionado. Esta parece ser uma forma eficiente de transportar informação ou energia ou o que quer que seja.

O que as redes realmente estão proporcionando, por que são tão importantes, é mostrar o que são esses hubs, esses reguladores centrais que sabemos que são tão importantes nas redes sociais e de transporte. Acreditamos que os centros dessas redes moleculares de genes e proteínas são igualmente importantes.

Surpreendentemente, muitos dos genes vistos nas redes que inferimos até agora são genes novos. Por exemplo, descobrimos que muitos dos genes do metabolismo de ácidos graxos na rede que já são conhecidos não são os hubs. Exceto por um ou dois dos genes conhecidos, muitos dos centros do metabolismo dos ácidos graxos não estavam previamente ligados ao metabolismo dos ácidos graxos. Por que é que?

Muitos dos genes que já conhecemos parecem ser o que chamamos de genes efetores. Eles têm um papel particular na biologia: podem codificar receptores, enzimas ou moléculas de sinalização. O que também notamos é que não associamos os novos genes a caminhos bem conhecidos antes.

A razão é que eles não têm um papel efetor, eles têm um papel regulador. Eles não são descobertos quando você estuda os ácidos graxos porque eles não estão envolvidos na produção ou degradação real dos ácidos graxos, eles são apenas reguladores [de outros genes].

Seu artigo deixa a impressão de que os estudos de associação do genoma (GWAS), que continuam produzindo notícias sobre a descoberta de genes para uma ou outra coisa, são uma caça ao ganso quando tentamos entender a fisiologia humana ou doenças complexas. Como os modelos de rede nos ajudam a entender as verdadeiras causas dessas doenças?

Não é realmente uma caça ao ganso selvagem, mas estamos criticando a forma como os bancos de dados GWAS foram analisados ​​até agora. Eles estão procurando as variantes mais significativas para uma doença específica. Não estamos dizendo que essas variantes não são verdadeiras, nem mesmo dizendo que não são relevantes, mas estamos dizendo que a forma como a análise foi realizada até agora nos conjuntos de dados GWAS revelou apenas uma fração muito pequena do cenário de risco total.

A forma como a análise foi feita foi projetada de forma que os fatores ambientais que pensamos ativar variantes de DNA importantes para a doença não sejam descobertos. Os que são descobertos são completamente independentes de micro e macroambientes. Eles não estão tendo um grande efeito sobre as doenças.

Para fazer uma comparação: ao ouvir uma música, as descobertas do GWAS seriam como baixar um pouco o volume ou aumentá-lo um pouco. Pode ser que sejam sistemicamente importantes, mas não achamos que sejam alvos realmente bons para encontrar novos tratamentos, porque essas variantes que encontraram provavelmente afetarão a doença por um longo tempo.

Eles são independentes do meio ambiente. Na verdade, eles devem começar a afetar o risco da doença desde o dia em que você nasceu, depois aumentar sutilmente o risco ao longo da vida e, aos 60 anos, terá algum efeito sobre as doenças cardiovasculares.

Mas o que estamos dizendo e o que também foi mostrado no diabetes tipo II é que importantes fatores de risco, os fatores de risco de DNA herdado para essas doenças complexas, permanecem ocultos no conjunto de dados GWAS.

Se você olhar para as pessoas com peso normal, elas não sofrem nenhuma dessas variantes de risco, então, para elas, ter uma variante de risco não é realmente um problema porque não está afetando o risco. No entanto, quando você olha para a mesma variante em pessoas que estão ligeiramente acima do peso, com um índice de massa corporal acima de 26, você vê que essas variantes representam um risco de doença.

O que significa que certos fatores ambientais afetam um determinado gene, que então distorce o equilíbrio da rede, causando doenças?

Exatamente. A forma tradicional encontrou apenas as variantes que continuamente distorciam a rede, mas com os modelos de rede podemos encontrar aquelas que precisam de determinada pressão ambiental. Pode ser envelhecimento, tabagismo, obesidade ou qualquer outra coisa que tenha impacto sobre você.

Distinguimos entre o macroambiente, que inclui quem está fumando, com sobrepeso e assim por diante, e esse macroambiente afeta, em um segundo nível, o microambiente, que é o ambiente em diferentes tecidos. Isso mudará a bateria de cofatores e, de repente, uma variante que estava silenciosa está ativa e começa a contribuir para a doença. Para encontrá-los, você precisa olhar para as redes em vez de analisar genes individuais.

Os conjuntos de dados GWAS são um bom trunfo e o biobanco da Estônia também será útil no futuro, mas precisamos descobrir novas maneiras de examinar esses bancos de dados.As formas tradicionais de encontrar uma ou duas variantes que são as mais significativas explicam apenas 5–10 por cento da variação de risco da população. 80-90 por cento permanecem ocultos. Ainda achamos que essas variantes podem ser encontradas no banco de dados GWAS, mas você precisa de redes para encontrar essas variantes que são ambientalmente dependentes.

Se uma doença pode ser causada pela distorção das redes de muitas maneiras diferentes, estamos realmente vendo muitas doenças diferentes onde pensávamos ter apenas uma?

Para tomar o exemplo da aterosclerose, o mecanismo molecular é muito semelhante, mesmo entre humanos e camundongos. No entanto, existem muitas maneiras de desencadear a aterosclerose, dependendo de diferentes fatores de risco ambientais que atuam em conjunto com variantes de DNA.

Pode ser hipertensão ou obesidade. Portanto, as variantes afetam a hipertensão, a hipercolesterolemia, a obesidade ou o diabetes, e todas têm o potencial de causar o desenvolvimento da aterosclerose de forma secundária.

Você pode ver isso como um funil onde muitas doenças diferentes podem contribuir para a aterosclerose, mas o processo para a aterosclerose é muito semelhante. Mas há muitas maneiras de ativar essa rede para causar mais aterosclerose.

A multiplicidade de causas básicas significa que novos tratamentos são mais difíceis de encontrar? No artigo, você também fala mais sobre prevenção do que tratamento.

As redes não são apenas sobre doenças, elas existem para a fisiologia. Há claramente muitas redes a serem definidas, mesmo aquelas que funcionam normalmente.

Vamos pegar o exemplo do fígado e dizer que você tem uma doença hepática, talvez hepatite. Ainda não se sabe como isso afetará as redes fisiológicas - se elas são substituídas ou alteradas por componentes inflamatórios ou se há novos tipos de células que contribuirão para uma rede inflamatória inteiramente nova. Precisamos entender essas redes fisiológicas e, então, também precisamos entender as redes patológicas.

O que vemos no futuro é que achamos que essas redes eventualmente também serão refletidas por marcadores no sangue. Se pudermos entender muito bem como as redes estão funcionando nos órgãos, então, ao coletar uma amostra de sangue e examinar alguns talvez 3.000 marcadores de proteína, isso nos dará uma boa dica quando houver algo acontecendo com, por exemplo, a rede do fígado ou alguma outra rede na gordura.

Vemos que o futuro da medicina está em encontrar novos medicamentos que tratem as diferentes redes patológicas que são a raiz do mal. Hoje, eu diria que a maioria dos nossos tratamentos trata os sintomas e não a causa.

Esperamos que haja muito mais foco na saúde para que no futuro você possa normalmente fazer seu primeiro exame de sangue e DNA aos 35 ou 40. A partir disso, poderíamos dizer quando há algo claramente patológico acontecendo, e então você poderia receber tratamento, embora você se sinta perfeitamente saudável. Dessa forma, vamos tratar logo no início - essa é a parte preventiva.

Quando vem o futuro?

Em talvez cinco anos teremos um atlas de redes e, talvez, em outros cinco anos, começaremos a compreender os tratamentos. É importante mencionar que o que estamos sugerindo agora já foi alcançado. Isso não é apenas uma visão, está realmente acontecendo.

Uma coorte semelhante ao que estou fazendo com doenças cardiovasculares, Eric Schadt, coletou amostras do tecido adiposo e do fígado de pacientes diabéticos. Isso levou a vários novos medicamentos no pipeline.

Você está em Tartu não apenas por causa dos laços de sangue (os avós maternos de Johan Björkegren fugiram da Estônia em 1944 - A.O.), mas também pela qualidade da pesquisa que você pode fazer em Tartu. O que a Estônia tem a oferecer?

Também tenho um laboratório no Instituto Karolinska, onde meus objetivos de pesquisa são os mesmos: estamos nos concentrando em infarto do miocárdio e aterosclerose. Em Karolinska há um grande interesse de pesquisa por parte dos médicos clínicos, e desde muito cedo soube de Arno Ruusalepp, que defendeu seu doutorado em Karolinska. Ele voltou para Tartu e agora é um dos cirurgiões cardíacos mais importantes de Tartu.

Percebi que Tartu tem a ambição de realmente fazer a diferença. Você está em um estado de desenvolvimento na Estônia, onde está construindo a sociedade, e enquanto o faz por que não o faz da melhor maneira? A Universidade de Tartu, com seus centros - particularmente o Centro de Genômica Translacional que agora foi criado - deseja muito desenvolver esta medicina preventiva e personalizada com base nas novas descobertas das ciências genômicas.

A versão estoniana da entrevista apareceu originalmente na Postimees.

Schadt EE e Björkegren JL (2012). NOVO: sabedoria habilitada para rede em biologia, medicina e saúde. Medicina translacional científica, 4 (115) PMID: 22218693


Um dilema de pesquisa

Operando em um ambiente altamente competitivo publique ou pereça ambiente, novos pesquisadores são apresentados com um dilema aqui. Os Supervisores de Pesquisa incentivam o uso de estudos de replicação para fornecer uma valiosa contribuição de validação para a ciência e para expor seus alunos a múltiplas metodologias de pesquisa.

No entanto, esses novos pesquisadores estão ansiosos para construir seu histórico acadêmico e, portanto, desejam fazer pesquisas que serão publicadas. Uma vez que estudos de replicação normalmente não são publicados, isso não ajuda em seus registros de rastreamento.


EXCLUSIVO: Torna-se pública a primeira pessoa conhecida do mundo & # 39 que naturalmente venceu o HIV

Loreen Willenberg em seu escritório doméstico em Sacramento em maio de 2019, usando o pingente com informações de contato para doar seu corpo para pesquisas.

"É melhor você colocar suas coisas em ordem, você provavelmente tem cerca de seis meses de vida", disse a enfermeira a Loreen Willenberg ao retornar os resultados dos testes que mostravam que ela era HIV-positiva em julho de 1992.

O teste mede os anticorpos contra o vírus que o sistema imunológico desenvolve várias semanas após a infecção inicial. As palavras da enfermeira eram o conselho padrão na época, quando a epidemia estava no seu pior momento nos EUA e o tratamento eficaz ainda estava a anos de distância. Eles criaram "esse medo emocional de que eu morreria", que levaria anos para se dissipar na mente de Loreen.

A peste havia chegado discretamente, apenas uma parte das pessoas infectadas com o vírus apresentam sintomas semelhantes aos da gripe quando são expostos pela primeira vez, e logo até esses vão embora. Inicialmente não havia teste para detectar o vírus, ele nem tinha nome. Mas a partir do momento em que o HIV entra nas células T CD4 - as células auxiliares chave do sistema imunológico - ele lenta e metodicamente começa a eliminá-las até que depois de vários anos ou mesmo uma década, o corpo se torna vulnerável a uma panóplia de doenças que uma sistema imunológico em pleno funcionamento pode lutar com facilidade.

A fase tranquila da epidemia já havia passado quando Loreen recebeu os resultados do teste em 1992. Homens jovens saudáveis ​​murchariam em formas cadavéricas devastadas pela doença ao longo de apenas alguns meses após um diagnóstico de AIDS, mas anos depois de terem se infectado. Eles ocuparam metade dos leitos do Hospital Geral de São Francisco. A AIDS havia se tornado a principal causa de morte de homens jovens nos Estados Unidos, mais de 50.000 só naquele ano. E assim, um diagnóstico era visto como uma sentença de morte.

O estigma acompanhou a doença porque era muito prevalente entre os homens gays. Muitos dos doentes foram rejeitados e abandonados por suas famílias. Incontáveis ​​mortes por Aids foram atribuídas a outras causas para proteger os falecidos ou suas famílias da vergonha.

Loreen havia feito o mesmo teste antes, em 1988, e deu negativo. Agora, depois de terminar um noivado e pensar em namorar novamente, ela fez o teste de HIV uma segunda vez. Os resultados positivos a encheram de terror.

Os 27 anos seguintes viram uma mudança completa na epidemia e em Loreen. A introdução de medicamentos anti-HIV permitiu que os pacientes se levantassem como Lázaro de seus leitos de morte e, melhor ainda, evitassem que ficassem doentes, não apenas nas nações ricas, mas em todo o mundo.

Loreen não se beneficiou dessas drogas de maneira notável, ela não teve que se beneficiar. Ao longo dos anos, ela aprendeu com os principais pesquisadores do HIV em todo o país que sua biologia imunológica única foi capaz de controlar o vírus naturalmente.

"Loreen, não consigo encontrar nenhum HIV em seu corpo. Procurei em todos os lugares e acho que você pode ter limpado", disse a voz do outro lado da linha. Era abril de 2011 e quem ligou era um proeminente pesquisador de HIV do National Institutes of Health (NIH).

“Fiquei surpreso. Achei que era simplesmente extraordinário”, diz Loreen ao relembrar aquele momento. "E então minha curiosidade apareceu. É como diabos isso aconteceu. Qual é o mecanismo? Por vinte anos eu entendi que o vírus realmente se mistura com o seu DNA, o projeto literal da vida. Então, para ter um um pesquisador disse que seu sistema imunológico pode ter limpado isso, assim como se fosse uma gripe, isso é impressionante. "

Foi um momento marcante para Loreen em uma jornada pessoal e científica de uma paciente temerosa, estigmatizada e isolada, por meio do aprendizado de sua biologia imunológica única, que é capaz de controlar o vírus, para se tornar uma participante de pesquisa instruída e capacitada, a qual alguns liderando o HIV pesquisadores passaram a ver como colegas e colegas. Suas células levaram a uma melhor compreensão do HIV e talvez levem à cura.

O Paciente Secreto

Loreen não se encaixou perfeitamente na demografia da epidemia de AIDS de 1992, quando foi diagnosticada. Ela não era gay e não morava em San Francisco, mas a várias horas de distância, em Placerville, uma pequena cidade com menos de 10.000 habitantes no sopé da Sierra Nevadas. A cidade havia sido o epicentro da corrida do ouro na Califórnia em meados de 1800, mas agora era pouco mais que um ponto no mapa a meio caminho entre Sacramento e Lake Tahoe.

Loreen estava de férias em Las Vegas em 1992, o ano em que foi diagnosticado com HIV.

(Foto cortesia de Willenberg)

Ela tinha 38 anos, altura de 5'7 ", cabelo ruivo que ia até o meio das costas que o sol deixava uma mancha vermelha. Ela cresceu em uma parte difícil de Los Angeles, uma autodenominada surfista que largou o curso UCLA depois de alguns meses de faculdade aos 17 anos. Ela era uma leitora voraz, curiosa por mil coisas.

Mais de uma década de peregrinação levou Loreen a Placerville, onde ela fez amizade com um horticultor local que a ensinou muito sobre o comércio e a encorajou a abrir seu próprio negócio. Agora ela tinha uma pequena equipe projetando, construindo e mantendo paisagens em comunidades vizinhas. Ela era forte por cavar e plantar ao lado de sua tripulação, nunca pedindo que fizessem o que ela mesma não faria.

Os resultados do teste de HIV a abalaram (ela suspeita que adquiriu o vírus de sua então noiva) e ela respondeu em sua maneira típica, agachando-se silenciosamente e aprendendo tudo que podia sobre a doença ainda nova. Ela não contou a ninguém, exceto à família e alguns amigos íntimos, com medo de que outros pudessem evitar ela e seus negócios, ou até pior. Crianças com hemofilia e HIV foram proibidas de ir à escola em algumas partes do país. Uma família até teve sua casa bombardeada. O sigilo era uma obrigação em uma pequena comunidade onde as línguas podiam abanar.

O primeiro passo era encontrar um médico em quem pudesse confiar. Uma ligação para o Project Inform Hotline, um grupo de educação sobre a AIDS em San Francisco, identificou dois médicos em consultório particular que tratavam do HIV em Sacramento, a uma boa hora de carro de distância. Os voluntários da Hotline se tornariam uma tábua de salvação, seus primeiros professores no que se tornaria uma vida inteira de aprendizado sobre a doença.

Bruce Cohn era um jovem internista que trabalhava na prática privada. Trabalhar com pacientes com HIV "se tornou a melhor coisa que já fiz", lembrou ele em uma entrevista recente. "A maioria desses [pacientes] eram meus colegas que estavam ficando doentes, mais ou menos da mesma idade, então foi fácil de relacionar. Eu identifiquei, oh, poderia ser eu, e então havia muita conexão pessoal com os pacientes . "

Ele também foi movido pelo desafio intelectual. "Eu aprendia algo novo todos os dias, se quisesse, era aprender com esteróides." Primeiro, surgiram novas maneiras de tratar infecções oportunistas que atormentavam aqueles com sistema imunológico comprometido e, mais tarde, medicamentos antivirais para tratar o próprio HIV.

Ele se protegeu emocionalmente pensando nisso como "o envelhecimento e a morte comprimiram tudo que ficou mais intenso, mais curto. A doença deles era uma espécie de crise. As pessoas ficariam doentes e, se as tratássemos com eficácia, elas iriam melhorar. Não tão bem quanto elas eram antes, mas melhor. "

Quando Loreen começou a ver Cohn, suas células T CD4, a parte do sistema imunológico que o HIV infecta e se replica, eram ainda maiores do que se esperaria em uma pessoa normal e saudável e muitas vezes maiores do que o nível baixo que então existia diretrizes recomendadas para o início do tratamento. Além disso, os poucos medicamentos anti-HIV disponíveis não eram muito bons - o vírus costumava sofrer mutação na resistência a eles em um ano e, portanto, eram reservados para um último esforço. Ela e Cohn decidiram tirar sangue e monitorar o nível de seus CD4s junto com seus cuidados primários regulares. Primeiro a cada três meses, depois duas vezes por ano, ela dirigia de Placerville a Sacramento.

Loreen rastrearia os resultados de cada teste de laboratório de seu atendimento médico e, posteriormente, cada visita de pesquisa e procedimento. Primeiro eles preencheram um cartão de índice 3x5 que ela escondeu depois que seriam salvos em uma planilha de computador.

"Não acreditávamos no que estávamos vendo"

A contagem de CD4 em uma pessoa infectada com HIV típica não tratada diminui em 30 a 50 células por ano. Mas Loreen não se mexeu.

"Talvez houvesse algo estúpido acontecendo porque suas células T não estão indo para o sul como deveriam", Cohn disse a ela depois de alguns anos. Ele retestou Loreen várias vezes para confirmar o diagnóstico original e, a cada vez, os resultados do laboratório eram positivos para anticorpos. Não havia dúvida de que ela havia sido exposta ao HIV e seu sistema imunológico havia desenvolvido uma resposta ao vírus.

Ele também fez os testes de carga viral mais recentes e mais sensíveis quando eles foram disponibilizados, que medem o nível do próprio vírus no sangue, e ele não conseguiu encontrar nenhum. Mas Cohn não ligou muito, atribuindo isso à insensibilidade daqueles primeiros testes que estavam disponíveis para uso em cuidados médicos. Ele seguiu as diretrizes de tratamento da época, que se baseavam na contagem de CD4, não na carga viral. Os anos passaram e Loreen permaneceu robusta e saudável, trabalhando com sua equipe e as plantas que ela adorava.

Enquanto isso, os pesquisadores vasculhavam a extremidade esquerda da curva do sino da resposta ao HIV, identificando um grupo que eles apelidaram deselegantemente de não progressores de longo prazo (LTNPs), a maioria dos quais mais tarde seriam referidos como controladores. As pessoas respondem de maneira diferente a todas as doenças. A maioria fica no meio da curva e essa resposta média é usada para definir o curso da doença, mas há alguns em ambos os lados que progridem mais e outros menos rapidamente do que a média. O estudo desses valores discrepantes geralmente produz percepções que ajudam a compreender melhor a doença e a desenvolver tratamentos.

Um artigo inicial sobre HIV LTNPs foi publicado em 1995 e chamou a atenção de Cohn. Ele contou a Loreen sobre isso em sua próxima visita e sugeriu que os pesquisadores provavelmente iriam querer estudá-la algum dia. “Procuramos um estudo para os próximos sete ou oito anos”, diz ela.

Novos medicamentos anti-HIV começaram a chegar ao mercado nas nações desenvolvidas a partir de 1996. Eles levantariam a mortalha que cercava a doença e a tornariam crônica e controlável. Reduzir o estigma e a discriminação associados ao HIV demoraria mais para ceder.

Mas o medo continuou incomodando Loreen. Sua saúde física era excelente, mentalmente, ela estava um caco, ainda temerosa e ansiosa para que as pessoas descobrissem seu segredo e que ela adoecesse e morresse. Foi agravado pela menopausa.

As mulheres tiveram mais dificuldade do que os homens para lidar com o HIV, diz Cohn. "Foi mais vergonhoso, mais estigmatizante para eles, e eles tiveram menos apoio." A maioria dos primeiros serviços sociais e grupos de apoio foram construídos por e para homens gays. "As mulheres simplesmente não tinham as pessoas com quem se conectar ou compartilhar suas experiências ou histórias."

Loreen encontrou e foi aceita em um grupo de apoio principalmente para gays em Placerville. “Eles realmente me provocaram e disseram 'você é nossa mulher branca heterossexual simbólica'. Deus os abençoe. Sério. " Mas Loreen permaneceu saudável enquanto outros membros do grupo adoeciam e lidavam com os problemas de seus medicamentos. Eventualmente, eles sentiram que sua experiência era tão diferente que ela não pertencia e pediram que ela deixasse o grupo.

Não se adequar aos padrões normais da doença HIV carregava seus próprios fardos. Loreen chama isso de "uma dupla estigmatização" do HIV e "alienação de dentro da própria comunidade". Outros controladores teriam uma experiência semelhante e simplesmente manteriam sua condição incomum em segredo por décadas, à medida que o estresse se acumulava.

As pressões internas tornaram-se tão grandes que ela deixou a rocha de ancoragem de seu negócio e literalmente fugiu, mudando-se em rápida sucessão para Idaho, depois para Dallas e depois para Los Angeles. Só anos depois ela perceberia e reconheceria que estava procurando por um salvador, alguém para protegê-la do estigma e cuidar dela se ela adoecesse. "Eu era como um ímã de vagabundo, procurando por amor em todos os lugares errados. E muito bagunçado na minha cabeça." Ela voltou para Placerville e Cohn a ajudou a perceber que os problemas eram de relacionamento, não de saúde. Sua compreensão e um antidepressivo ajudaram Loreen a quebrar o ciclo e voltar aos trilhos.

Então, no outono de 2004, Loreen viu um pequeno anúncio em caixa na parte de trás da POZ, uma revista lançada na cidade de Nova York em 1994 para educar e construir uma comunidade para pessoas que vivem com HIV. O anúncio era do Partners AIDS Research Center do Massachusetts General Hospital, em Boston, e procurava LTNPs.

"Eu comecei a chorar porque sabia que eles estavam procurando por mim. Liguei para o Dr. Cohn no dia seguinte" para fazer os preparativos, relata Loreen. Eles queriam amostras de seu sangue para realizar uma série de experimentos. Ela estava tão ansiosa para ajudar que até pagou cerca de US $ 650 de seu próprio bolso para que as amostras de sangue fossem colhidas por seu médico "porque eu não tinha seguro", e onze frascos FedExed em novembro. E então ela esperou.

O telefonema veio em meados de fevereiro de 2005 de Florencia Pereyra, então pesquisadora no laboratório de Bruce Walker da Universidade de Harvard. “Parte do motivo pelo qual demoramos tanto para retornar a você e ao Dr. Cohn é que não acreditamos no que estávamos vendo”, disse ela a Loreen.

Ela perguntou se Loreen poderia voar para Boston para doar mais células sanguíneas, porque as células "se achatam" quando são enviadas e o laboratório precisa de células novas. Ah, e por falar nisso, eles não foram capazes de garantir o financiamento para levá-la até lá.

Loreen perguntou por que isso era tão importante? O que eles encontraram em sua doação de sangue original? “'Nós expusemos suas células de combate, suas células imunológicas, a diferentes proteínas virais'”, ela lembra Pereyra dizendo. “'E suas células estavam resistindo a cerca de 60 por cento de todos aqueles bandidos, em vez dos 20-30 por cento típicos.' Foi quando me dei conta de que havia algo realmente único sobre mim. " Suas células imunológicas eram excepcionalmente boas no combate ao HIV.

Ela foi fisgada.E em sua inocência e ânsia de ajudar, ela começou a ligar para pesquisadores locais da AIDS, perguntando se eles poderiam poupar algum dinheiro para levá-la para Boston. Foi como um jato de água fria saber que os cientistas não eram apenas uma grande família feliz e colaborativa, mas um grupo altamente competitivo lutando por uma quantia limitada de dólares para pesquisa. Loreen agora ri de sua ingenuidade inicial.

Sensação Intestinal

Mas ela soube de um estudo de pesquisa em seu próprio quintal na Universidade da Califórnia em Davis e ansiosamente saltou como doadora. A maior parte da pesquisa do HIV é feita com sangue porque é uma janela relativamente acessível, barata e indolor para a dinâmica da doença.

A grande desvantagem é que apenas uma pequena porcentagem das células T CD4 que são infectadas e expelem o HIV são encontradas no sangue, uma porção muito maior é encontrada no tecido linfóide no intestino. Isso faz sentido que a maioria dos germes aos quais estamos expostos venha através do que comemos e bebemos todos os dias, então o sistema imunológico concentra grande parte de sua atenção para enfrentar esses desafios no intestino.

Barbara Shacklett, da UC Davis, estava conduzindo o primeiro grande estudo da resposta imunológica ao HIV que analisou o que estava acontecendo no sangue e no intestino ao mesmo tempo. Ela queria que voluntários não dessem apenas uma amostra de sangue, mas também fizessem uma colonoscopia. Um tubo seria inserido no reto e pequenos pedaços de tecido intestinal seriam retirados ao longo do cólon para os cientistas analisarem.

Shacklett tem um charme de olhos arregalados e uma risada fácil que desmentem três anos e meio de pesquisa de HIV em Paris e depois passa por laboratórios em Nova York e São Francisco. Então, quase vinte anos atrás, ela montou seu próprio laboratório em Davis. O estudo foi importante e abriu novos caminhos na compreensão de que existem diferenças significativas em como o HIV se replica no intestino e o sangue simplesmente olhando para o sangue fornece uma imagem incompleta da doença.

“Loreen foi uma das primeiras duas controladoras de HIV que tivemos a oportunidade de estudar. Ela era uma participante de estudo muito disposta, uma espécie de voluntária de estudo perfeita”, Shacklett relembrou em uma conversa recente em seu escritório. "Mas por trás disso, ela estava muito, muito interessada na pesquisa em si, queria ler os artigos e assistir a algumas das conferências."

Loreen voltaria algumas vezes para procedimentos que removeram bem mais de uma centena de amostras de tecido. Ela recebeu um honorário de $ 100 por cada visita, algo que nem todos os estudos oferecem.

Uma coisa intrigou Shacklett Loreen não ter a forte resposta imunológica das células T que foi vista em outros controladores de HIV - era modesta na melhor das hipóteses. As células T constituem uma parte importante da resposta imune adaptativa, a segunda linha de defesa imune do corpo contra um patógeno invasor. Quando as células T encontram partes de uma bactéria ou vírus que foram treinados para identificar, elas os cercam, se expandem em número e secretam substâncias químicas que matam os invasores ou as células infectadas. Depois que o trabalho é concluído e o inimigo derrotado, não há sentido em desperdiçar energia e células T, então o sistema imunológico recua, reduzindo o número de células T e cochilando para esperar a próxima vez que houver uma ameaça.

Talvez o sistema imunológico tenha feito seu trabalho tão bem que o HIV não existia mais e as células T pudessem se dar ao luxo de relaxar. Talvez o corpo de Loreen tenha encontrado uma maneira não simplesmente de reduzir o número de vírus, mas de fazer o inimaginável e realmente eliminá-lo. Parecia uma hipótese maluca, mal considerada na época, mas com o passar dos anos e estudos adicionais documentaram o quão incomum era seu sistema imunológico, a hipótese se tornou menos rebuscada.

Procurando por pistas dentro da "caixa preta"

Bruce Walker, um médico e pesquisador de Harvard, inicialmente pensou que pessoas como Loreen - cujo sistema imunológico poderia controlar o vírus melhor do que a maioria dos outros - eram extremamente raras. Então, um dia, falando em Nova York em um curso de pós-graduação em HIV, ele perguntou se outras pessoas tinham visto esses pacientes e ficou chocado quando mais da metade dos médicos levantaram as mãos. “E eu disse, Oh meu Deus, isso não é tão raro”, ele contou.

Walker é alto e bonito à maneira do alter ego do Superman, Clark Kent, com queixo quadrado e óculos. O superpoder do fala suave está construindo colaborações e o que muitos consideram ser o principal centro de pesquisa de HIV do mundo, agora chamado de Instituto Ragon, em homenagem a seus principais benfeitores. Ele foi o primeiro pesquisador de HIV entre os quase 300 investigadores apoiados pelo Howard Hughes Medical Institute, a quinta maior fundação do mundo com uma doação de US $ 22,6 bilhões.

Ele havia sido estagiário e residente do Massachusetts General Hospital (MGH) na década de 1980, quando os primeiros casos de AIDS começaram a aparecer. Isso moldou sua decisão de se concentrar no HIV e, em particular, na busca por uma vacina. As falhas iniciais da vacina o levaram de volta à ciência básica e particularmente aos LTNPs do HIV, aquela pequena porção da curva do sino das pessoas infectadas cujo sistema imunológico poderia controlar o vírus melhor do que a maioria das outras pessoas.

Walker convenceu o financista de Wall Street Mark Schwartz e sua esposa Lisa a doar US $ 5 milhões para financiar um estudo de associação do genoma (GWAS) para tentar descobrir a genética de como algumas pessoas estavam controlando sua infecção pelo HIV. Especialistas do Instituto de Tecnologia de Massachusetts (MIT) colaborariam com o esforço.

Esse financiamento foi pago para levar Loreen a Boston em dezembro de 2005, cerca de um ano depois de ela ter enviado os frascos originais de sangue. Foi a primeira de muitas vezes que ela se encontrou com Walker. “Ele me convidou para falar em seu escritório e estava muito animado por estar formando essa coorte [de LTNPs]. Ele me contou sobre as dificuldades em nos encontrar porque éramos muito saudáveis. Disseram-me que eu era a participante número 10”, ela diz.

“Quando eu encontrei Loreen pela primeira vez, havia uma sensação de que a resposta estava ali para nós descobrirmos,” Walker relembrou. "Ela abrigou a resposta, mas era realmente uma caixa preta. E desde aquele primeiro encontro com ela, chegamos ao ponto em que acredito que entendemos como ela está fazendo isso e como outras pessoas estão fazendo isso. E Eu acredito que é algo sobre o qual podemos agir. "

O estudo GWAS foi uma grande tentativa de descobrir isso. A superfície das células do sistema imunológico é um conjunto confuso de proteínas que compõem o sistema do antígeno leucocitário humano (HLA), que governa a função imunológica. O HLA é determinado geneticamente, então Walker esperava que o estudo GWAS pudesse identificar variantes genéticas específicas que estavam associadas ao controle da infecção pelo HIV.

Funcionou. A análise identificou várias variações genéticas no sistema imunológico que estão fortemente associadas ao controle do vírus. Mas nenhum HLA é comum a todos os controladores e a presença de HLAs específicos não garante que uma pessoa possa controlar o vírus. Como exemplo, Loreen carrega algumas variantes de proteção do HLA, mas não outras. Portanto, a combinação é imperfeita. Isso "explica apenas 20 a 25 por cento" do controle, diz Walker. "Mas nos apontou na direção dessas células assassinas, as células T citotóxicas [células T CD8], sendo importantes."

Um poderoso senso de propósito

Aquela viagem a Boston foi a primeira vez que Loreen fez um tour por um laboratório, olhou através de um microscópio e viu como suas células estavam sendo colocadas em uso. “Acendeu-se uma luz no meu cérebro, compreendi o que estava a ver. Tive uma epifania”, recorda ela. “Eu realmente acho que foi nessa época que comecei a me livrar do medo” que a atormentava por 13 anos, desde o diagnóstico de HIV.

"Fiquei fascinado com a hipótese do estudo e lembro-me de dizer ao Dr. Walker naquele dia, 'você precisa encontrar mais de nós. É muito importante que você faça e eu vou ajudá-lo. Não sei exatamente como farei isso porque ainda estou vivendo e me escondendo como uma mulher soropositiva. Estou com medo de perder meu negócio se revelar minha condição de altamente conservadora, pequena, sopé da montanha da cidade. '"

“Eu prometi a ele então que vou fazer isso, vou dedicar o resto da minha vida natural ao trabalho”, ela se lembra de ter dito a Walker. "Vou precisar da sua ajuda porque não venho de uma formação biomédica. Sou um paisagista, sou um horticultor, essa é a minha vida. Nem terminei a faculdade." Ele sorriu, e o resto é história.

Poucos meses depois daquela primeira viagem a Boston, motivada pelo desejo de ajudar, Loreen formalizou sua compulsão em uma organização sem fins lucrativos que ela chamou de Fundação Zephyr LTNP. "Zephyr significa o vento do oeste", diz ela. Era o nome de tela que ela escondeu quando entrou pela primeira vez em fóruns sobre HIV na Internet. Ela mergulhou na leitura da literatura científica e médica.

Zephyr era essencialmente uma organização de uma mulher onde ela compartilhou os últimos artigos de periódicos que achou interessantes, construiu uma rede de colegas controladores de HIV e os encorajou a participarem de pesquisas. Loreen passava horas intermináveis ​​ao telefone, aconselhando controladores que se sentiam isolados e sozinhos, ajudando-os a construir um senso positivo de quem eram e com o que poderiam contribuir.

Saber que ela tinha uma biologia única que as pessoas queriam estudar "deu à sua vida algum significado, e isso foi tão incrível", disse Cohn, médico pessoal de Loreen por mais de uma dúzia de anos, enquanto ela fazia a transição para uma participação ativa em estudos de pesquisa.

A ética médica, e particularmente a lei dos EUA conhecida como HIPAA (Lei de Responsabilidade e Portabilidade de Seguro de Saúde de 1996), protege estritamente a privacidade dos pacientes e participantes do estudo. Isso limita por que e como os pesquisadores podem se comunicar com esses participantes. Infelizmente, isso também atua como uma barreira para pessoas como controladores que se sentem sozinhos e isolados. Estabelecer contatos e recrutar pessoas para esses tipos de estudos é difícil.

Através da atenção do público que ela trouxe aos controladores por meio da cobertura da mídia e em sites orientados ao HIV, como thebody.com, ela foi capaz de atrair e construir uma rede de controladores e educá-los, onde os pesquisadores podem ser restritos e geralmente não têm dinheiro ou equipe para investir na educação do paciente. É por isso que eles gostaram tanto de Loreen.

"Ela se envolveu completamente conosco e ajudou a tornar possível aquele estudo inicial de GWAS basicamente conectando-se com pessoas em todo o país, realmente servindo como um recrutador para nós, explicando o estudo, explicando a importância dele e fazendo com que as pessoas se tornassem se envolveram e contribuíram com amostras de sangue ", diz Walker.

As viagens para locais de pesquisa e o ativismo contra a AIDS aumentaram a tal ritmo para Loreen, todos os meses durante um ano, que ela decidiu fechar seu negócio e reduzir sua carga de viagens mudando-se para Sacramento no final de 2007. Ela costurou uma série de partes empregos a tempo para pagar as contas.

Talvez o ponto alto do Zephyr tenha sido uma pequena conferência que ela organizou no outono de 2009, que reuniu um punhado de pesquisadores estudando controladores e uma dúzia desses pacientes de várias cidades. Nunca antes tantos haviam estado na mesma sala.

Então, no outono de 2011, Loreen começou a fazer cursos universitários para fortalecer seu pensamento crítico sobre pesquisa médica e bioética, concluindo dois diplomas AA com distinção em 2017.

Visitando o National Institutes of Health

Loreen não gosta de meias medidas. Logo após sua viagem inicial a Boston, ela também se juntou à coorte de HIV no Instituto Nacional de Alergia e Doenças Infecciosas (NIAID), parte do National Institutes of Health (NIH). Segue como a doença progride nas pessoas, como ela pode afetar a saúde de forma mais ampla e os possíveis efeitos colaterais de longo prazo dos medicamentos que estão tomando. As visitas ao campus de Bethesda, Maryland são pelo menos uma vez por ano e contínuas. O grupo também inclui 142 LTNPs.

Stephen Migueles é um médico pesquisador sênior da coorte e o primeiro de sua família no sul da Flórida a ir para a faculdade. Como um homem assumidamente gay fazendo sua residência médica no Hospital da Universidade de Georgetown no início da década de 1990, no auge da epidemia de AIDS, ele ficou fascinado e apavorado com a experiência, "lutando para sair e me aceitar, minha família não me aceitando, e então ver todo mundo morrendo. Foi um momento muito difícil. "

Ele queria ser médico desde que se lembrava e não estava particularmente interessado em pesquisa porque não se achava inteligente o suficiente. Mas durante um rodízio no NIH, ele chamou a atenção de uma equipe sênior que o convenceu a fazer uma tentativa há 22 anos. Ele avançou no Serviço de Saúde Pública dos Estados Unidos para usar a águia de um capitão naval no colarinho. "O NIH parece uma família para mim e um lugar onde posso fazer algo significativo. Avançar a ciência para ajudar a encontrar uma cura", diz ele humildemente. Em uma época anterior, ele poderia ter se tornado um padre servindo lealmente à sua paróquia.

As matérias-primas com que Migueles e outros trabalham são células imunológicas que residem no corpo. Os pesquisadores os reúnem por meio de um procedimento chamado leucaferese. O sangue é retirado por uma agulha, alimentado por tubos em uma máquina especial que gira cerca de 100 milhões de células do sistema imunológico e retorna o resto do complexo sangüíneo esgotado para o corpo, ao longo de várias horas. As células imunológicas são então levadas a um laboratório onde são divididas em subconjuntos específicos que são estudados de perto.

Loreen passando por uma leucoferese no NIH em novembro de 2009. A máquina à direita está separando as células do sistema imunológico do resto de seu sangue para análises posteriores.

O procedimento sempre deixa Loreen exausta pelo resto do dia e no seguinte. Ela contraiu uma gripe no início desta primavera, logo após a última vez que teve leucaferese. Foi porque muitas de suas células imunológicas foram drenadas pelo procedimento que ela foi menos capaz de lutar contra a infecção? Os pesquisadores afirmam que não, que as células devem se substituir em um ou dois dias, mas a questão não é bem estudada. E, por segurança, a maioria dos protocolos de pesquisa permite esse tipo de doação apenas uma vez a cada três ou seis meses.

Dezenas de procedimentos diferentes ao longo dos anos em vários centros de pesquisa deixaram as veias finas de Loreen tão marcadas que o NIH parou de pedir que ela se submetesse a mais leucaferese para a ciência. Eles percebem que ela pode precisar de acesso imediato a essas veias para seus próprios cuidados médicos em algum momento no futuro.

O trabalho de Migueles se concentra nas células T CD8, "os assassinos do sistema imunológico". Ele diz que as células das pessoas que controlam o vírus não necessariamente reconhecem o vírus melhor do que os outros, em vez disso, as células funcionam melhor. Normalmente, as células T CD8 circundam uma célula T CD4 infectada com HIV, proliferam em números, então usam uma proteína chamada perforina para perfurar a membrana externa da célula e despejar granzima B, uma enzima que mata a célula.

Os progressores típicos nem mesmo fazem um trabalho muito bom no estágio de proliferação, diz ele, enquanto os controladores são muito eficientes em todas as etapas do processo. Curiosamente, com as vacinas candidatas contra o HIV que foram desenvolvidas, as células CD8 "proliferam de forma realmente exuberante, carregam seus grânulos de morte de maneira muito eficiente, mas não conseguem retirá-los" e colocá-los em uma célula CD4 infectada para matá-la. Uma vacina bem-sucedida terá que resolver esse quebra-cabeça.

“Eu sabia por nossas trocas antes de ela chegar aqui que Loreen seria uma grande personalidade”, diz Migueles. “Muitas das perguntas dela são muito do tipo, 'o que você acha que está acontecendo comigo?' mas existem questões mais amplas, o que sempre o torna muito admirável para mim. Ela voltava nas visitas de acompanhamento e tirava da bolsa um monte de papéis com destaque, com orelhas e anotações escritas, o que é um muito parecido comigo. "

Loreen encontrou outra alma gêmea e mentor em Migueles, unida pela curiosidade científica e pelo senso de serviço. Isso ficou claro durante sua última visita ao NIH em junho de 2019, quando o casal interrompia e completava as frases um do outro, assim como um casal de idosos faria.

Após sua visita inicial em 2006, Loreen havia voltado para casa apenas cerca de uma semana quando Migueles ligou novamente, perguntando quando ela poderia voltar, um tema recorrente em sua história. Poucos meses depois, ela estava de volta ao NIH assistindo com admiração um filme passando diante de seus olhos, mostrando suas próprias células CD8 destruindo células infectadas com HIV. "Eu estava dizendo coisas como, uau, isso é como ficção científica."

As células CD8 de Loreen fizeram esse trabalho muito bem. “Eu acho que ela é uma pessoa muito rara que está na cauda, ​​o extremo do espectro”, diz Migueles. "Eu não acho que ela está controlando por um mecanismo diferente, mas talvez seus CD8s tenham um pouco mais de força no início e isso ajudou a derrubar as coisas tanto que ela simplesmente não tem muitos vírus competentes de replicação por perto . " Talvez seja como juros compostos em economizar para a aposentadoria, onde uma pequena diferença no início do controle do vírus pode ter um grande efeito no futuro.

Então, no início de 2011, Migueles fez o surpreendente telefonema dizendo que alguns de seus resultados sugeriam que ela poderia realmente ter eliminado o vírus de seu corpo. Ele precisava que Loreen voltasse e doasse tecido de seu intestino para ver se eles podiam encontrar algum HIV remanescente ali. Loreen não teve que pensar duas vezes, ela viajou para Betesda no seu aniversário para o procedimento.

O artigo saiu em abril de 2012 na revista Sangue. Foi uma série de quatro estudos de caso de controladores de elite de HIV não identificados, um rótulo afixado àqueles que são mais capazes de controlar seu vírus. Os controladores de elite representam menos da metade de um por cento das pessoas infectadas com HIV. Um dos colegas de Migueles fez um esforço heróico para encontrar o HIV nas células T CD4 retiradas do sangue e do tecido intestinal de Loreen, mas não conseguiu detectar nenhum vírus completo integrado nos 184 milhões de genomas de células T CD4 amostrados.

Migueles não disse explicitamente no artigo que, ao contrário das outras três pessoas no estudo, ele pensava que Loreen havia eliminado completamente o vírus - ele é um cientista cauteloso demais. Ele sabe que a única maneira de provar isso de forma absoluta é por meio de uma autópsia em busca de traços do vírus em cada compartimento de tecido, incluindo seu cérebro. Mas lendo nas entrelinhas, ficou claro que ele acredita que é uma hipótese plausível.

O papel não fez muito barulho na época. Os cientistas ainda relutavam em aceitar que Timothy Ray Brown, o "Paciente de Berlim", pudesse ter sido curado da infecção. Brown estava se saindo bem com medicamentos anti-HIV até desenvolver leucemia, um câncer no sistema sanguíneo. O tratamento para a leucemia é um regime brutal de radiação e quimioterapia, que carrega uma alta taxa de mortalidade, para matar o sistema imunológico e substituí-lo por um transplante de medula óssea contendo células-tronco para desenvolver um sistema imunológico substituto.

Anteriormente, os pesquisadores haviam isolado o CCR5 como um co-receptor que o HIV usa para entrar e infectar as células T CD4. Posteriormente, eles identificaram um pequeno grupo de pessoas que carregam uma mutação genética, a deleção delta32, que não expressam o receptor CCR5 na superfície de suas células. Como resultado, as pessoas que carregam uma versão dupla dessa mutação, herdada de ambos os pais, são virtualmente imunes à infecção pelo HIV.

O médico que tratava de Brown decidiu fazer um experimento.Já que ele teve que substituir o sistema imunológico de Brown no tratamento do câncer, por que não tentar fazer isso com uma versão que também pode protegê-lo do HIV? A Alemanha tem o maior registro do mundo de doadores de medula óssea, mas ainda assim, entre aqueles milhões de doadores em potencial, apenas dois eram uma correspondência genética HLA geral próxima o suficiente para usar com Brown e também continham a mutação delta32 dupla que ele buscava.

A leucemia de Brown voltou e a série de procedimentos teve que ser repetida, mas eventualmente ele foi declarado livre do câncer e curado do HIV. A controvérsia permanece sobre a necessidade e a importância de vários aspectos do tratamento. No entanto, com o tempo, a comunidade médica passou a aceitar que ele foi a primeira pessoa a ser curada do HIV. Outras tentativas de tratamentos semelhantes não tiveram sucesso, embora alguns acreditem que o "Paciente de Londres", anunciado no início de 2019, também possa representar uma cura.

Mas em 2012, quando o artigo de Migueles foi publicado, a primeira sessão da Conferência Internacional de AIDS que usou a palavra "cura" ainda estava a alguns meses de distância. Portanto, pensar que alguém poderia ter alcançado a cura por conta própria - sem drogas ou qualquer um dos outros milagres da medicina moderna - era inimaginável para a maioria dos pesquisadores. Mesmo assim, o artigo ficou gravado na memória de vários cientistas e eles o mencionam em conversas sempre que Migueles apresenta sua pesquisa em uma conferência.

A conversa sobre uma cura veio rugindo nesta primavera em um artigo da equipe do Ragon Institute em Boston. Ele traçou um mapa topográfico de como as várias proteínas do HIV estão ligadas entre si. Alguns nós contêm apenas algumas conexões, enquanto outros contêm muitas mais. Os nós mais simples podem mudar de forma mais facilmente quando sob ataque do sistema imunológico e ainda assim realizar suas funções, enquanto os nós mais complexos são menos flexíveis, eles não podem sofrer mutação e ainda funcionar. O sistema imunológico dos controladores de HIV concentra suas energias nas conexões principais onde o vírus não pode sofrer mutação e não desperdiça seus esforços em nós menos importantes.

"Esta é a primeira vez que conseguimos diferenciar controladores de progressores com base em um parâmetro imunológico", diz Walker. "E o que é muito empolgante nisso é que não apenas fizemos uma observação, é uma observação que pode ser acionada, agora podemos tentar e replicar isso em outras pessoas." Ele reconhece que eles ainda não entendem como algumas pessoas podem fazer isso naturalmente, e está tentando descobrir como elas podem estimular outras a fazerem também.

Então, em julho deste ano, em uma grande conferência internacional de AIDS na Cidade do México, os pesquisadores de Ragon compararam as células de um "paciente de São Francisco" com outro controlador de elite e encontraram evidências escassas de HIV. Havia alguns fragmentos de RNA do HIV como evidência de infecção anterior, mas nenhum vírus completo capaz de se replicar. Eles chamaram de "cura funcional" da doença. Loreen reconheceu todos os pontos de dados como seus - ela era a paciente de San Francisco erroneamente rotulada. Mas ela não se importou, isso significava mais algumas semanas fora dos holofotes levando uma vida normal.

Um "Espaço Moral Difícil e Ambíguo"

A pesquisa médica é baseada na base do consentimento informado, em que um voluntário é informado dos riscos e benefícios potenciais de participar de um estudo e o faz de boa vontade, sem pressão. Loreen se familiarizou muito com esse processo ao ler os documentos de consentimento informado para cada uma das dezenas de estudos dos quais ela participou. Isso despertou um interesse crescente pela bioética.

Outra faísca veio de fora. "The Immortal Life of Henrietta Lacks" é um livro histórico e best-seller de Rebecca Skloot, publicado no início de 2010. Contava a história de uma pobre mulher negra que, em 1951, sem saber, era a fonte de células de câncer cervical que se transformaram em um linha celular perpétua (HeLa), que é uma ferramenta importante usada em muitas pesquisas biomédicas até hoje. Lacks nunca foi informada ou se beneficiou dessa contribuição antes de morrer. O livro aprofundou questões de raça, classe e ética médica que sustentam o que antes era uma prática aceita e ainda ressoa hoje.

Um controlador de HIV que Loreen fez amizade através da Fundação Zephyr enviou a ela uma versão digital do livro assim que foi lançado. Mas ler em uma tela não combinava com ela e Loreen comprou uma versão em capa dura, vasculhando os capítulos e enchendo-os com vários post-its.

"Embora minhas doações (e as de minha comunidade) tenham sido todas feitas de uma perspectiva altruísta, não posso deixar de pensar que minha comunidade cedeu nossos direitos a compensação futura (por estipêndios mínimos de $ 200 ou menos, dependendo do procedimento de doação e a instituição) para dados extremamente valiosos que podem contribuir para a cura de HIV / AIDS e outras doenças ", escreveu Loreen em um e-mail para Skloot no ano seguinte.

O livro também levou Loreen a Mark Yarborough, um bioeticista da UC Davis, que se tornaria um mentor nesta área. “Não é para demonizar, mas até certo ponto as pessoas estão em pesquisa biomédica pelo dinheiro”, diz Yarborough. A indústria farmacêutica quer trazer novos produtos lucrativos ao mercado, os pesquisadores querem avançar em suas carreiras e cada vez mais formar empresas para comercializar seu trabalho e até mesmo as universidades reivindicam patentes da pesquisa.

“A expectativa é que os doadores façam as coisas inteiramente pela bondade de seus corações, quando todos estão nisso por boas intenções, mas também têm muito interesse próprio em jogo”, diz ele. "Espera-se que os doadores sejam 100% altruístas, quando na verdade ninguém mais é 100% altruísta."

Yarborough ficou impressionada com a dedicação e o trabalho que Loreen fez por conta própria e por meio da Zephyr Foundation. Ela lutou com a pergunta: "Se eu tenho essa característica biológica única que pode dar uma contribuição importante para encontrar uma vacina, uma cura, um tratamento eficaz, como posso não ousar dizer sim a tudo e a todos?"

“Você se sente compelido a ajudar. Você acha que seria egoísmo não ajudar. Mas, ao mesmo tempo, é que sou uma pessoa humana”, diz Yarborough. "Ela sempre foi muito comedida na maneira como descrevia as coisas, mas estava lutando contra se eu estou sendo tratada de maneira adequada. Ela tinha a forte sensação de que deveria ser tratada de uma certa maneira, mas não sabia bem o que era isso . Acho que até hoje ela permanece obscura. Eu também permaneço obscuro. "

“É quase como um dever para mim”, disse Loreen certa vez enquanto estava deitada em uma cama de hospital no NIH durante uma leucaferese em 2009. “Estou deitada aqui hoje e estou pensando nos 40 milhões de pessoas no mundo que vivem com HIV e que sofrem. Quem precisa dos medicamentos, quem tem os efeitos colaterais deles. E aqui estou eu, basicamente intocado por ele fisicamente. É por isso que chamo isso de um dever. Estou convencido de que vamos cai fora."

Nos últimos anos, Yarborough convidou Loreen para falar em um curso obrigatório da escola de medicina em ética que ele leciona em um programa de pós-graduação que prepara as pessoas para uma carreira em pesquisa biomédica: os alunos incluem alunos de pesquisa médica e doutorado e professores juniores. "A sala fica muito quieta quando Loreen está falando porque as pessoas rapidamente se envolvem em suas histórias. Eles valorizam a oportunidade de fazer suas perguntas e há uma boa discussão depois."

“Ela se apresenta muito como uma colega e anos-luz à frente dos alunos de muitas maneiras. [Ela] esteve envolvida em doze ensaios clínicos e pode dar a você todas as publicações para as quais suas amostras contribuíram”, continua ele. "Considerando que essas pessoas, mesmo que sejam professores juniores, podem não ter participado de seu primeiro ensaio clínico ainda. Então, eles vêem Loreen como um colega, em oposição a alguém que não está no mesmo campo de jogo."

Mark Yarborough, bioeticista da UC Davis, convida Loreen para falar em um curso da faculdade de medicina sobre ética em pesquisa.

“O que se destaca para mim é como Loreen está vivendo com o espaço moral difícil e ambíguo em que está vivendo”, diz Yarborough. "E a jornada que tem sido para ela, a evolução em sua própria mente e seu próprio pensamento."

Indo a público

Loreen viu o circo da mídia que cercou Tim Brown quando seu nome foi divulgado em 2010 como a primeira pessoa a ser curada do HIV e ela não quis tomar parte nisso. "Assisti tudo sobre Tim Brown e não vou por aí. Não quero viver como Timothy Brown vive agora. Não quero a atenção. Vivo uma vida privada muito tranquila e gosto disso. . "

O que a mudou de ideia foi outra ligação do NIH. Os documentaristas estavam filmando uma série que acabaria sendo exibida no verão de 2017 no Discovery Channel como "First In Human: The Trials of Building 10," narrado pelo mais nerd da ciência da TV, Jim Parsons, estrela de "The Big Bang Theory". Depois de muita reflexão, ela concordou em ser filmada.

Mas o segmento não chegou ao corte final, talvez porque Loreen represente um mistério que ainda não foi traduzido em uma cura para os outros. Ela ficou desapontada. Mas uma barreira psicológica foi ultrapassada e ela percebeu que contar sua história era uma forma de chamar a atenção para os controladores e para a contribuição que eles poderiam dar para encontrar uma cura e talvez uma vacina preventiva para o HIV.

Loreen também percebeu, e mais importante ainda, internalizou, que ela não era mais a mesma pessoa que era em 1992. Ela sabe, por meio de registros meticulosamente mantidos, que ao longo dos anos ela doou para a ciência mais do que o equivalente a cada gota de sangue que corre através de seu corpo: 91 bilhões de células imunológicas por meio de 371 amostras de tecido intestinal de leucaphares coletadas em mais de uma dúzia de colonoscopias e endoscopias e incontáveis ​​swabbings, cutucadas e cutucadas associadas a exames médicos.

Essas experiências, além de anos lendo jornais científicos e indo a conferências, engajando-se com pesquisadores e educando outros controladores, a transformaram de uma paciente assustada em uma participante com poder no processo de pesquisa.

Loreen doando sangue em sua visita mais recente ao NIH, em junho de 2019.

Ela percebe que sua vida provavelmente mudará depois que sua história inteira se tornar pública, como a primeira pessoa conhecida a realmente vencer o HIV sem qualquer intervenção médica. E ela está resignada a pagar esse preço para ajudar a avançar na busca por uma cura.

Os pesquisadores acreditam que descobriram peças importantes, mas provavelmente não todas, de como o sistema imunológico de Loreen controla o HIV. Eles têm hipóteses de como podem gerar essa mesma capacidade em outros usando uma vacina terapêutica. Mas o HIV provou ser um adversário astuto nas últimas quatro décadas e seu sucesso não é garantido.

A única coisa que eles podem dizer com certeza é que Loreen estará ao lado deles, mesmo após a morte. Ela desejou que seu corpo pesquisasse e usa um pingente em volta do pescoço indicando o protocolo de como ele deve ser tratado, para que Migueles possa procurar em cada órgão cópias completas do vírus. Então, a ciência pode finalmente dissipar quaisquer dúvidas de que seu sistema imunológico superou completamente o HIV.


Katherine Brower


Principal:
Microbiologia
Mentor: Brian Wasko, Patologia

Contato: [email protected]

Projeto de pesquisa atual: Efeitos da disomeostase de ferro na ATPase vascular

Traduza seu trabalho para que todos possamos entender sua importância
Conforme os humanos envelhecem, a chance de desenvolver doenças como câncer e doenças cardíacas aumenta. Ao examinar o envelhecimento em nível genético, pode ser possível eliminar os efeitos do envelhecimento e diminuir a chance de desenvolver doenças relacionadas ao envelhecimento. Para fazer isso, minha pesquisa utiliza Saccharomyces cerevisiae, fermento e determina o efeito dos tipos de nutrientes disponíveis, como vitaminas e metais. Estou olhando especificamente para os genes e metais como ferro, zinco e manganês, que afetam a proteína Vacuolar ATPase devido à sua importância na regulação da morte celular e na remoção de proteínas mal dobradas. A ATPase vacuolar é importante no estudo do envelhecimento porque, conforme a célula envelhece, a função dessa enzima diminui.

Qual é o aspecto mais emocionante e / ou gratificante de sua experiência de pesquisa de graduação?
O aspecto mais gratificante de minha experiência em pesquisa de graduação foi a comunidade com a qual me envolvi dentro do laboratório. Como aluno transferido, estava preocupado em encontrar um grupo de alunos ao qual pudesse realmente pertencer. No entanto, depois de entrar no laboratório de pesquisa, comecei a ter um sentimento mais forte de pertencer a UW e criei memórias duradouras, amigos e desenvolvi habilidades profissionais mais fortes. Por experiência pessoal, outro benefício é que você pode encontrar seu parceiro.

Que conselho você daria a um aluno que está pensando em se envolver em pesquisa de graduação?
Eu recomendaria enfaticamente que qualquer pessoa interessada em se envolver em pesquisa de graduação fizesse isso. Embora possa ser assustador, participar de um laboratório de pesquisa é uma grande construção de caráter e uma experiência agradável.


Ciência Básica, Infraestrutura, Temas Unificadores

  • O objetivo do Psychiatric Genomics Consortium (PGC) é conduzir meganálises de dados genéticos do genoma para transtornos psiquiátricos. Em existência desde 2007, o grupo, o maior consórcio de pesquisadores em saúde mental até hoje, tem contribuído substancialmente para o avanço da nossa compreensão científica das contribuições genéticas para os transtornos psiquiátricos. O PGC Addictions foi estabelecido em 2012. O objetivo de nosso grupo é estudar o papel de variantes genéticas comuns e raras na etiologia do vício, variando de índices diagnósticos, índices quantitativos de uso, tratamento e recaída e integrar esses achados com resultados emergentes de outros esforços visando o uso de substâncias, saúde mental e resultados de neuroimagem. Como um grupo, propomos as seguintes vias para o plano estratégico de NIDA & rsquos. Suporte contínuo para genotipagem e sequenciamento de grandes repositórios de amostras bem caracterizadas para a identificação de variantes comuns e raras para vícios. Estudos em grande escala de esquizofrenia (PMC4112379) mostraram que o aumento do tamanho da amostra pode resultar em um aumento substancial no poder de detectar variações comuns associadas a traços comportamentais e psiquiátricos complexos e, mais recentemente, avaliações volumétricas do cérebro. O PGC já coletou a maioria das amostras de dependência com dados GWAS dos quais sabemos, no entanto, os números atuais de casos e controles (N = 12.397 / 28080 para o transtorno mais comum, dependência de álcool e muito menos para drogas ilícitas) são modesto. A experiência com outros distúrbios indica que um número muito maior de amostras será necessário. O suporte contínuo para genotipagem utilizando matrizes modernas e econômicas melhorará substancialmente nossa capacidade de identificar variantes que afetam o risco de vícios. Ressaltamos também a necessidade de que as amostras sejam bem caracterizadas para transtornos por uso de substâncias (TUS). Com o impulso sustentado para a medicina personalizada, o sequenciamento de amostras com avaliações refinadas de vícios é necessário (por exemplo, por SSAGA ou SSADDA ou do kit de ferramentas PhenX). Quando combinadas com GWAS e dados de exoma, as informações de sequência permitem o estudo em todo o espectro de frequências de alelos e tamanhos de efeito para genes que afetam o risco / proteção. Em particular, os dados baseados na família (incluindo pedigrees densos, trio familiar e estudos de pares de irmãos afetados) podem fornecer uma plataforma poderosa para o estudo de alelos mais raros e seu modo de transmissão. O suporte para a coleta e caracterização cuidadosa de novas amostras relacionadas a dependências é essencial. Além disso, encorajamos a fenotipagem adicional de coleções existentes quando o novo contato for possível, incluindo suporte para estudos longitudinais, particularmente durante os principais períodos de exposição e risco (por exemplo, adolescência). Estudos recentes (por exemplo, PMC3865158 PMC4233207) mostram que a caracterização cuidadosa de medidas de resultados (por exemplo, sintoma contagens, índices quantitativos durante períodos de uso pesado, como bebidas alcoólicas máximas, informações sobre a via de administração, oportunidade de exposição na população de controle) podem impactar a resolução de sinais genéticos. Embora os estudos sobre o tabagismo tenham obtido sucesso significativo com o uso de medidas ad hoc, como cigarros por dia, existem desafios conhecidos associados a essas medidas quando aplicadas a comportamentos de uso de substâncias ilícitas. São necessários esforços futuros de coleta de dados com o objetivo de reunir amostras com avaliações fenotípicas detalhadas de dependência. Suporte para genotipagem e fenotipagem de estudos longitudinais existentes e novos, incluindo estudos de famílias e bairros de alto risco, pode fornecer insights sem paralelo sobre a evolução dos comportamentos de dependência , da oportunidade de exposição à remissão / recaída. Isso também requer a medição detalhada tanto do autorrelato quanto do ambiente construído (por exemplo, GIS) e a interação entre a vulnerabilidade ambiental e a responsabilidade genética. Outra área potencial para crescimento substancial é o desenvolvimento de repositórios de amostras de tratamento genotipadas (por exemplo, metadona, buprenorfina) que seriam permitem a avaliação de moderadores genéticos dos resultados do tratamento. Estendendo estudos para grupos sub-representadosA maioria dos esforços genômicos anteriores se baseou em dados de participantes de descendência européia-americana (ou nativa americana). Dado o vasto desequilíbrio sócio-cultural e de ligação / diferenças haplotípicas entre caucasianos e outros ancestrais, o desenvolvimento de coortes de descendência afro-americana, mexicana-americana, nativa americana e asiática será essencial. Isso deve incluir a genotipagem e o sequenciamento de coleções bem caracterizadas já disponíveis, se o consentimento puder ser obtido, bem como novas coleções. Consistente com a literatura atual, é bastante provável que muitos alelos de risco sejam específicos da população. Para obter achados relevantes para tratamento posterior em uma população, pode ser necessário estudar amostras adequadamente alimentadas nessa população. Tal esforço deve ser acompanhado por colaborações internacionais que aproveitem dados de populações isoladas, grupos indígenas etc. Colaboração interagências do NIH que resultaria em estudos direcionados das contribuições genéticas para a comorbidade entre o vício e outros resultados de saúde mental. Apesar de evidências clínicas e epidemiológicas substanciais que as taxas de transtornos por uso de substâncias são consideravelmente elevadas em indivíduos com outras doenças psiquiátricas, e o apoio de estudos com gêmeos de que esses fenótipos compartilham etiologias genéticas parcialmente sobrepostas, os estudos genômicos sistemáticos dessa comorbidade são limitados (por exemplo, PMID24957864). Grandes amostras verificadas para outras psicopatologias, como no PGC, provavelmente incluirão um número substancial de indivíduos com avaliações clínicas detalhadas do vício. Deve-se priorizar o suporte para caracterizações adicionais de uso / abuso / dependência de substâncias em outras amostras, contribuições para genotipagem ou sequenciamento adicional, se necessário, e para análise de dados. Esforços semelhantes na integração de resultados de esforços recentes de neuroimagem (por exemploENIGMA, NCANDA) com descobertas emergentes de GWAS e o desenvolvimento de estudos neurogenéticos direcionados podem facilitar estudos de comportamento gene-cérebro. Apoio para análise secundária de grandes repositórios existentes de dados de dependência não minerados e para desenvolvimento e implementação de ferramentas metodológicas para estudos genômicos. testemunharam uma explosão em métodos poligênicos, incluindo pontuações de risco genético, análises de caminhos e redes, detecção de loci em todo o genoma que influenciam a covariância de traços cruzados, estimativa de herdabilidade a partir de dados em todo o genoma. Tais esforços requerem amostras maiores que estão disponíveis atualmente, mas requerem suporte de financiamento sustentado. Com GWAS emergentes e achados de sequenciamento, há uma forte necessidade de desenvolvimento de ferramentas metodológicas que possam ser usadas para (a) anotar resultados, incluindo integração de expressão epigenética / eQTL data (b) modelar interação gene-gene complexo e gene-ambiente (c) implementar outras abordagens sofisticadas (por exemplo, teoria dos gráficos). múltiplos consórcios financiados pelo NIDA e de outras plataformas analíticas (por exemplo, estudos funcionais do metacéfalo ENIGMA recentes, EEG / ERP) devem ser uma prioridade. Esses utilitários também devem permitir a fácil visualização das descobertas, anotações e download de estatísticas resumidas.

Limpando o nevoeiro: examinando mais de perto a avaliação e o feedback

Como seus alunos receberão, aceitarão e aplicarão feedback?

Quando penso em meus anos no ensino médio, lembro-me de redações, testes, questionários populares e tarefas ocasionais. Além de

Pelos projetos e laboratórios que fizemos em Física e Química, raramente fui chamado para fazer meu próprio projeto, refletir sobre como estava aprendendo ou sendo avaliado, e nunca conversei com um professor sobre meu aprendizado. No ano passado, trabalhei em uma unidade de Aprendizagem Baseada em Projetos onde dava feedback constante diariamente e os alunos criavam perguntas, investigavam assuntos de sua própria escolha e faziam conexões com o currículo. No final, entreguei a eles uma rubrica com uma nota e alguns comentários sobre ela. Como eles deveriam aprender com um pedaço de papel? Foi durante esta unidade, onde percebi que precisava reavaliar como eu dou e mais importante, usar feedback.

No processo de Design Thinking (veja a postagem de @ lmcbeth & # 8217s aqui), a peça de empatia é muito importante. Como faço para projetar um projeto que empurra os alunos do século 21 a envolver seus interesses e trabalhar seu próprio potencial? Então, como faço para criar um sistema de feedback que é construtivo e imediato com um processo de avaliação que permite a reflexão e aprendizagem do aluno? O ideal é aprender com as rubricas, comentários e feedback que forneço continuamente.

Meu objetivo é conceber um processo de feedback que seja mais imediato, possa ser aplicado a qualquer tipo de avaliação e seja claramente visível ao longo do caminho. Idealmente, eu & # 8217 gostaria de redesenhar minha sala de aula também & # 8211 com feedback e avaliação em mente.

Meu desafio & # 8211 talvez sejam dois planos de ação em um. O processo de design thinking me permitiu analisar meu problema e vê-lo com mais clareza. O feedback imediato por meio da colaboração na Coorte 21 era exatamente o que eu precisava.

Mais recentemente, entrei em contato com @ddoucet e com meu Diretor de Ensino e Aprendizagem (Dave Krocker) para discutir como tornar as rubricas e o feedback pós-avaliação mais eficazes. A partir dessas conversas, meu co-professor e eu redesenhamos a rubrica (uma ótima postagem sobre como construir uma rubrica mais significativa na Edutopia), pedimos aos alunos que enviassem autorreflexões com base em onde se sentaram & # 8211 Abaixo, No, ou Acima de padrão. A chave aqui era perguntar aos alunos & # 8216 por quê? & # 8221. Algumas respostas & # 8230

O porquê é tão importante. Eu respondi a todas as grandes questões & # 8211 Tive que desenvolver minhas próprias idéias. Reflexão sobre a aprendizagem. & # 8220 Fiz conexões & # 8221

Depois disso, conferenciamos com os alunos sobre sua rubrica e sua autorreflexão & # 8211; esse processo geralmente resultou em um momento & # 8216Ah ha & # 8217 para alguns dos alunos. Ficou claro para mim e para eles que há necessidade de mais instâncias de feedback ao longo do processo & # 8211 isso é algo em que preciso me concentrar e tem sido uma área de crescimento para mim já há algum tempo. De alguma forma, também quero redesenhar meu espaço na vida real e online para melhorar meu feedback e aumentar o aprendizado dos alunos. Certamente estou a caminho, mas muito mais crescimento está à frente.

Ao longo de nosso último F2F, a aplicação do modelo de design a esse problema trouxe à luz muitos novos insights e ideias. As numerosas conversas alimentaram uma nova apreciação de como a avaliação realmente deve ser. Um grande obrigado a @ksolowey, @gnichols, @lmcbeth, & amp @ddoucet junto com muitos outros no grupo da Coorte 21 que me deram ótimos comentários e ideias para seguir em frente.

No final do dia, ótimas avaliações são apenas o ponto de partida. O que eles fazem com seu feedback é onde o verdadeiro aprendizado e crescimento realmente acontecem.

Adoraria ouvir sua opinião sobre feedback e avaliação. Quais são as outras técnicas que você usa para garantir que o feedback seja realmente usado para aprimorar o aprendizado? Como você o torna consistente e oportuno?


Pesquisa Científica em Educação (2002)

No Capítulo 2, apresentamos evidências de que a pesquisa científica em educação se acumula da mesma forma que nas ciências físicas, da vida e sociais. Consequentemente, acreditamos que valeria a pena prosseguir com essa pesquisa para construir mais conhecimento sobre a educação e sobre as políticas e práticas educacionais. Até este ponto, entretanto, não abordamos as questões & ldquoO que constitui a pesquisa científica? & Rdquo e & ldquoA pesquisa científica em educação é diferente da pesquisa científica nas ciências sociais, da vida e físicas? & Rdquo Fazemos isso neste capítulo.

Essas são questões assustadoras que filósofos, historiadores e cientistas têm debatido por vários séculos (ver Newton-Smith [2000] para uma avaliação atual). Merton (1973), por exemplo, viu semelhanças entre as ciências. Ele descreveu a ciência como tendo quatro objetivos: universalismo, a busca pela organização de leis gerais, a busca por organizar e conceituar um conjunto de fatos relacionados ou ceticismo de observações, a norma de questionar e procurar explicações contrárias e comunalismo, a busca pelo desenvolvimento de uma comunidade que compartilha um conjunto de normas ou princípios para fazer ciência. Em contraste, alguns dos primeiros filósofos modernos (os positivistas lógicos) tentaram alcançar a unidade entre as ciências reduzindo todas elas à física, um programa que enfrentou dificuldades técnicas insuperáveis ​​(Trant, 1991).

Em suma, sustentamos que existem semelhanças e diferenças entre as ciências. Em um nível geral, as ciências compartilham muito em comum, um conjunto do que pode ser chamado de epistemológico ou fundamental

princípios que norteiam o empreendimento científico. Eles incluem a busca de compreensão conceitual (teórica), a apresentação de hipóteses empiricamente testáveis ​​e refutáveis, o desenvolvimento de estudos que testam e podem descartar contra-hipóteses concorrentes, o uso de métodos observacionais ligados à teoria que permitem que outros cientistas verifiquem sua precisão e o reconhecimento da importância de ambas as replicações independentes e generalização. É muito improvável que qualquer estudo possua todas essas qualidades. No entanto, o que une a investigação científica é a primazia do teste empírico de conjecturas e hipóteses formais usando métodos de observação bem codificados e projetos rigorosos, e submetendo os resultados à revisão por pares. É, na expressão de John Dewey & rsquos, & ldquocompetent inquérito & rdquo que produz o que os filósofos chamam & ldquoknowledge afirmações & rdquo que são justificadas ou & ldquowarred & rdquo por evidências empíricas pertinentes (ou em matemática, prova dedutiva). O raciocínio científico ocorre em meio à incerteza (muitas vezes quantificável) (Schum, 1994), suas afirmações estão sujeitas a desafio, replicação e revisão à medida que o conhecimento é refinado ao longo do tempo. O objetivo de longo prazo de grande parte da ciência é produzir teoria que possa oferecer um encapsulamento estável de & ldquofatos & rdquo que generalize além do particular. Neste capítulo, então, explicamos o que vemos como pontos comuns entre todos os empreendimentos científicos.

Quando nosso trabalho começou, tentamos distinguir as investigações científicas na educação daquelas nas ciências sociais, físicas e biológicas, explorando a filosofia da ciência e as ciências sociais, a condução das investigações das ciências físicas, da vida e sociais e a realização de pesquisas científicas na educação. Também pedimos a um painel de funcionários do governo sênior que financiam e gerenciam pesquisas em educação e ciências sociais e comportamentais, e um painel de estudiosos ilustres de psicometria, antropologia lingüística, economia do trabalho e direito, para distinguir os princípios de evidências em todos os campos (ver National Conselho de Pesquisa, 2001d). Em última análise, não conseguimos nos convencer de que, em um nível fundamental, além das diferenças em técnicas especializadas e objetos de investigação nas ciências individuais, uma distinção significativa poderia ser feita entre a pesquisa em ciências sociais, físicas e da vida e a pesquisa científica em educação. Às vezes pensávamos ter um exemplo que demonstraria a distinção, apenas para descobrir nossa hipótese refutada por evidências de que a distinção não era real.

Assim, a comissão concluiu que o conjunto de princípios orientadores que se aplicam à investigação científica na educação é o mesmo conjunto de princípios que

podem ser encontrados em toda a gama de investigação científica. Ao longo deste capítulo, fornecemos exemplos de uma variedade de domínios & mdashin ciência política, geofísica e educação & mdash para demonstrar essa natureza compartilhada. Embora não haja uma descrição universalmente aceita dos elementos da investigação científica, achamos conveniente descrever o processo científico em termos de seis princípios de investigação inter-relacionados, mas não necessariamente ordenados 1:

Faça perguntas significativas que possam ser investigadas empiricamente.

Vincule a pesquisa à teoria relevante.

Use métodos que permitam a investigação direta da questão.

Fornece uma cadeia de raciocínio coerente e explícita.

Replique e generalize os estudos.

Divulgue pesquisas para estimular o escrutínio e a crítica profissionais.

Escolhemos a frase & ldquoguiding princípios & rdquo deliberadamente para enfatizar o ponto vital que eles orientam, mas não fornecem um algoritmo para a investigação científica. Em vez disso, os princípios orientadores das investigações científicas fornecem uma estrutura que indica como as inferências, em geral, devem ser apoiadas (ou refutadas) por um núcleo de processos, ferramentas e práticas interdependentes. Embora qualquer estudo científico único possa não cumprir todos os princípios & mdash por exemplo, um estudo inicial em uma linha de investigação não terá sido replicado de forma independente & mdasha uma linha forte de pesquisa provavelmente o fará (por exemplo, consulte o Capítulo 2).

Também vemos os princípios orientadores como constituindo um código de conduta que inclui noções de comportamento ético. Em certo sentido, os princípios orientadores operam como normas em uma comunidade, neste caso uma comunidade de cientistas - eles são as expectativas de como a pesquisa científica será conduzida. Idealmente, cientistas individuais internalizam essas normas e a comunidade as monitora. De acordo com nossa análise, esses princípios da ciência são comuns ao estudo sistemático em disciplinas como astrofísica, ciência política e economia, bem como a campos mais aplicados, como medicina, agricultura e educação. Os princípios enfatizam objetividade, pensamento rigoroso, mente aberta e relatórios honestos e completos. Numerosos estudiosos

Por exemplo, os modos indutivo, dedutivo e abdutivo de investigação científica atendem a esses princípios em diferentes sequências.

comentaram sobre a cultura científica comum & ldquoconceptual & rdquo que permeia a maioria dos campos (ver, por exemplo, Ziman, 2000, p. 145 Chubin e Hackett, 1990).

Esses princípios atravessam duas dimensões do empreendimento científico: a criatividade, a especialização, os valores comuns e o bom senso das pessoas que & ldquodo & rdquo ciência e princípios orientadores generalizados para a investigação científica. O restante deste capítulo apresenta os valores comuns da comunidade científica e os princípios orientadores do processo que permitem o florescimento de investigações científicas bem fundamentadas.

A COMUNIDADE CIENTÍFICA

A ciência é uma & ldquoforma de vida & rdquo (para usar a expressão do filósofo Ludwig Wittgenstein [1968]) e as normas da comunidade levam tempo para serem aprendidas. Investigadores habilidosos geralmente aprendem a conduzir investigações científicas rigorosas somente depois de adquirir os valores da comunidade científica, ganhando experiência em vários subcampos relacionados e dominando diversas técnicas investigativas ao longo de anos de prática.

A cultura da ciência promove a objetividade por meio da aplicação das regras de sua & ldquoforma de vida & rdquo & mdashsuch como a necessidade de replicabilidade, o fluxo irrestrito de crítica construtiva, a conveniência de arbitragem cega & mdashas, ​​bem como através de esforços combinados para treinar novos cientistas em certos hábitos mentais. Por hábitos mentais, entendemos coisas como dedicação à primazia da evidência, à minimização e contabilização de vieses que podem afetar o processo de pesquisa e ao pensamento disciplinado, criativo e aberto. Esses hábitos, juntamente com a vigilância da comunidade como um todo, resultam em um quadro de pesquisadores que podem envolver diferentes perspectivas e explicações em seu trabalho e considerar paradigmas alternativos. Talvez acima de tudo, as normas impostas pela comunidade garantam, tanto quanto é humanamente possível, que cientistas individuais - embora não necessariamente felizes por serem provados errados e estejam dispostos a abrir seu trabalho a críticas, avaliações e possíveis revisões.

Outra norma crucial da & ldquoforma científica da vida & rdquo, que também depende de sua eficácia na fiscalização comunitária, é que os cientistas devem ser éticos e honestos. Esta afirmação pode parecer banal, até ingênua. Mas o conhecimento científico é construído pelo trabalho de indivíduos e, como qualquer outra empresa, se as pessoas que conduzem o trabalho não são abertas e sinceras,

pode facilmente vacilar. Sir Cyril Burt, um notável psicólogo que estuda a hereditariedade da inteligência, é um exemplo disso. Ele acreditava tão fortemente em sua hipótese de que a inteligência era altamente hereditária que ele & ldquodoctored & rdquo dados de estudos com gêmeos para apoiar sua hipótese (Tucker, 1994 Mackintosh, 1995) que a comunidade científica reagiu com horror quando essa transgressão veio à tona. Exemplos de tal conduta antiética em campos como a pesquisa médica também estão bem documentados (ver, por exemplo, Lock e Wells, 1996).

Um conjunto diferente de questões éticas também surge nas ciências que envolvem pesquisas com animais e humanos. O envolvimento de seres vivos no processo de pesquisa inevitavelmente levanta questões éticas difíceis sobre uma série de riscos potenciais, que vão desde questões de confidencialidade e privacidade até lesões e morte. Os cientistas devem pesar os benefícios relativos do que pode ser aprendido contra os riscos potenciais para os participantes humanos da pesquisa, enquanto eles se empenham em uma investigação rigorosa. (Consideramos essa questão mais detalhadamente nos Capítulos 4 e 6.)

PRINCÍPIOS DE ORIENTAÇÃO

Ao longo deste relatório, argumentamos que a ciência é uma investigação competente que produz afirmações garantidas (Dewey, 1938) e, em última análise, desenvolve uma teoria que é apoiada por evidências pertinentes. Os princípios orientadores que se seguem fornecem uma estrutura de como inferências válidas são apoiadas, caracterizam os fundamentos sobre os quais os cientistas criticam uns aos outros e trabalham e, em retrospectiva, descrevem o que os cientistas fazem. A ciência é um empreendimento criativo, mas é disciplinado por normas comunitárias e práticas aceitas para avaliar as conclusões e como elas foram alcançadas. Esses princípios evoluíram ao longo do tempo a partir de lições aprendidas por gerações de cientistas e estudiosos da ciência que continuamente refinaram suas teorias e métodos.

PRINCÍPIO CIENTÍFICO 1Faça perguntas significativas que podem ser investigadas empiricamente

Este princípio tem duas partes. A primeira parte diz respeito à natureza das questões colocadas: a ciência avança colocando questões significativas sobre o mundo com respostas potencialmente múltiplas que levam a hipóteses ou conjecturas que podem ser testadas e refutadas. A segunda parte diz respeito a como essas questões são colocadas: elas devem ser colocadas de tal forma que seja

possível testar a adequação de respostas alternativas por meio de observações cuidadosamente projetadas e implementadas.

Significância da pergunta

Um aspecto crucial, mas tipicamente subestimado, de uma investigação científica bem-sucedida é a qualidade da questão colocada. Passar do palpite para a conceituação e especificação de uma pergunta válida é essencial para a pesquisa científica. Na verdade, muitos cientistas devem sua fama menos à sua capacidade de resolver problemas do que à sua capacidade de selecionar questões perspicazes para investigação, uma capacidade que é criativa e disciplinada:

A formulação de um problema é freqüentemente mais essencial do que sua solução, que pode ser apenas uma questão de habilidade matemática ou experimental. Levantar novas questões, novas possibilidades, olhar velhas questões de um novo ângulo, requer imaginação criativa e marca um avanço real na ciência (Einstein e Infeld, 1938, p. 92, citado em Krathwohl, 1998).

As perguntas são colocadas em um esforço para preencher uma lacuna no conhecimento existente ou para buscar novos conhecimentos, para buscar a identificação da causa ou causas de alguns fenômenos, para descrever fenômenos, para resolver um problema prático ou para testar formalmente uma hipótese. Uma boa pergunta pode reformular um problema antigo à luz de novas ferramentas ou técnicas disponíveis, metodológicas ou teóricas. Por exemplo, o cientista político Robert Putnam desafiou a sabedoria aceita de que o aumento da modernidade levou à diminuição do envolvimento cívico (ver Quadro 3-1) e seu trabalho também foi desafiado. Uma pergunta também pode ser um novo teste de uma hipótese sob novas condições ou circunstâncias, de fato, estudos que replicam trabalhos anteriores são essenciais para resultados de pesquisa robustos que se aplicam a ambientes e objetos de investigação (ver Princípio 5). Uma boa pergunta pode levar a um forte teste de uma teoria, por mais explícita ou implícita que a teoria possa ser.

O significado de uma questão pode ser estabelecido com referência a pesquisas anteriores e teorias relevantes, bem como à sua relação com afirmações importantes pertencentes a políticas ou práticas. Desta forma, o conhecimento científico cresce à medida que novos trabalhos são adicionados ao & mdashand integrado com & mdash o corpo de material que veio antes dele. Este corpo de conhecimento inclui theo-

CAIXA 3-1
A modernização sinaliza o fim da comunidade cívica?

Em 1970, o cientista político Robert Putnam estava em Roma estudando a política italiana quando o governo decidiu implementar um novo sistema de governos regionais em todo o país.Essa situação deu a Putnam e seus colegas a oportunidade de iniciar um estudo de longo prazo sobre como as instituições governamentais se desenvolvem em diversos ambientes sociais e o que afeta seu sucesso ou fracasso como instituições democráticas (Putnam, Leonardi e Nanetti, 1993). Com base em uma estrutura conceitual sobre o & ldquo desempenho institucional & ldquo, Putnam e seus colegas realizaram três ou quatro ondas de entrevistas pessoais com funcionários do governo e líderes locais, seis pesquisas nacionais, medidas estatísticas de desempenho institucional, análise da legislação pertinente de 1970 a 1984, a experimento único na capacidade de resposta do governo e estudos de caso aprofundados em seis regiões de 1976 a 1989.

Os pesquisadores encontraram evidências convergentes de diferenças marcantes por região com profundas raízes históricas. Os resultados também lançam dúvidas sobre a visão então predominante de que o aumento da modernidade leva à diminuição do envolvimento cívico. & ldquoAs áreas menos cívicas da Itália são precisamente as tradicionais aldeias do sul. O ethos cívico das comunidades tradicionais não deve ser idealizado. A vida em grande parte da Itália tradicional hoje é marcada por hierarquia e exploração, não por compartilhar e compartilhar & rdquo (p. 114). Em contraste, & ldquoAs regiões mais cívicas da Itália & mdash são as comunidades onde os cidadãos se sentem capacitados a se envolver em deliberações coletivas sobre as escolhas públicas e onde essas escolhas são traduzidas mais plenamente em políticas públicas eficazes & mdash incluem algumas das vilas e cidades mais modernas da península. A modernização não sinaliza o fim da comunidade cívica & rdquo (p. 115).

As descobertas de Putnam e seus colegas sobre a influência relativa do desenvolvimento econômico e das tradições cívicas no sucesso democrático são menos conclusivas, mas o peso das evidências favorece a afirmação de que a tradição cívica é mais importante do que a riqueza econômica. Este e os trabalhos subsequentes sobre capital social (Putnam, 1995) levaram a uma enxurrada de investigações e controvérsias que continuam até hoje.

ries, modelos, métodos de pesquisa (por exemplo, projetos, medições) e ferramentas de pesquisa (por exemplo, microscópios, questionários). Na verdade, a ciência não é apenas um esforço para produzir representações (modelos) de fenômenos do mundo real, indo da natureza para signos abstratos. Embutidos em sua prática, os cientistas também se envolvem no desenvolvimento de objetos (por exemplo, instrumentos ou práticas), portanto, o conhecimento científico é um subproduto tanto das atividades tecnológicas quanto das atividades analíticas (Roth, 2001). Uma revisão das teorias e pesquisas anteriores relevantes para uma questão em particular pode simplesmente estabelecer que ela não foi respondida antes. Uma vez que isso seja estabelecido, a revisão pode ajudar a moldar respostas alternativas, o desenho e a execução de um estudo, iluminando se e como a questão e conjecturas relacionadas já foram examinadas, bem como identificando o que se sabe sobre amostragem, configuração e outros contexto importante. 2

O trabalho de Donald Stokes & rsquo (Stokes, 1997) fornece uma estrutura útil para pensar sobre questões importantes que podem promover o conhecimento e o método científicos (ver Figura 3-1). No Quadrante Pasteur e rsquos, ele forneceu evidências de que a concepção de conhecimento baseado em pesquisa movendo-se em uma progressão linear da ciência fundamental para a ciência aplicada não reflete como a ciência tem avançado historicamente. Ele forneceu vários exemplos que demonstram que, em vez disso, muitos avanços na ciência ocorreram como resultado da pesquisa inspirada em & ldquouse & rdquo, que se baseia simultaneamente na pesquisa básica e aplicada. Stokes (1997, p. 63) cita Brooks (1967) sobre trabalho básico e aplicado:

O trabalho direcionado a objetivos aplicados pode ter um caráter altamente fundamental, pois tem um impacto importante na estrutura conceitual ou na perspectiva de um campo. Além disso, o fato de a pesquisa ser de tal natureza que possa ser aplicada não significa que não seja também básica.

Reconhecemos que importantes descobertas científicas às vezes são feitas quando um observador competente nota um fenômeno estranho ou interessante pela primeira vez. Nesses casos, é claro, não existe literatura anterior para moldar a investigação. E novos campos e disciplinas precisam começar de algum lugar. Nossa ênfase na vinculação a literatura anterior neste princípio, então, se aplica geralmente a domínios e campos relativamente estabelecidos.


Assista o vídeo: GWAS p-values and FWER (Dezembro 2022).