Em formação

Pesquisa de interações proteína-proteína

Pesquisa de interações proteína-proteína


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Usei STRING db para encontrar todas as interações da proteína precursora APP. O que eu preciso especificamente é de uma confirmação (apoiada por alguns artigos e experimentos nele). Mas uma quantidade significativa de interatores tem apenas a confirmação do "Banco de Dados" (principalmente retransmitindo em dados Reactome e KEGG). Pesquisar nesses bancos de dados não me dá artigo nem mesmo a presença dessas proteínas em um caminho (o que é estranho). Como posso obter os dados? Desde já, obrigado!


Você pode tentar usar o banco de dados de interação molecular IntAct. Os dados neste banco de dados são baseados em:

  • dados da literatura ou de depósitos diretos de dados por curadores especialistas
  • <300 mil interações binárias em 2011, desenvolvidas pela equipe de serviços de proteômica da EBI
  • referência recente: Aranda et al. '10

Isso também é mencionado no resumo do artigo de Aranda et al.'10:

IntAct é um banco de dados e um kit de ferramentas de interação molecular de dados abertos. Os dados são extraídos da literatura ou de deposições diretas de dados por curadores especialistas seguindo um modelo de anotação profunda que fornece um alto nível de detalhe. Em setembro de 2009, IntAct contém mais de 200.000 evidências de interação binária com curadoria. Em resposta ao crescente volume de dados e solicitações do usuário, o IntAct agora oferece uma visão em duas camadas dos dados de interação. A interface de pesquisa permite ao usuário desenvolver consultas complexas de forma iterativa, explorando a anotação detalhada com vocabulários hierárquicos controlados. Os resultados são fornecidos em qualquer estágio em uma visualização tabular simplificada. As visualizações especializadas permitem então 'ampliar' a anotação completa de interações, interatores e suas propriedades. O código-fonte IntAct e os dados estão disponíveis gratuitamente

Além disso, você pode usar oProvasguia em String (Suponho que você já tenha tentado isso, mas no caso de você não ter):

Você pode então clicar emExperimentos, então algo como isto aparecerá:
Você pode ver Como as (por exemplo, ensaio de complexo reconstituído) e você pode ver de que artigo de onde vem essa interação se você clicar em um item da tabela:


O banco de dados STRING mostra a rede de interação proteína-proteína e pontuações de acordo com a presença e ausência de verificação experimental, que pode ser ensaio de protease, coimunoprecipitação de isca, ensaio ocidental, etc.

se precisar de mais confirmação, você deve ler o máximo possível de artigos relacionados ao APP.


Mapeamento em grande escala das interações proteína-proteína humana por espectrometria de massa

*Autor correspondente. O Instituto de Biologia de Sistemas de Ottawa, Universidade de Ottawa, BMI, 451 Smyth Road, Ottawa, Ontário, Canadá K1H 8M5. Tel .: +1 613 562 5800 ramal 8674 Fax: +1 613 562 5655 E-mail: [email & # 160 protegido]

O mapeamento das interações proteína-proteína é uma ferramenta inestimável para compreender a função da proteína. Aqui, relatamos o primeiro estudo em grande escala de interações proteína-proteína em células humanas usando uma abordagem baseada em espectrometria de massa. O estudo mapeia interações de proteínas para 338 proteínas de isca que foram selecionadas com base em doenças conhecidas ou suspeitas e associações funcionais. A imunoprecipitação em grande escala de versões marcadas com Flag dessas proteínas, seguida por análise LC-ESI-MS / MS, resultou na identificação de 24.540 potenciais interações de proteínas. Falsos positivos e acertos redundantes foram filtrados usando critérios empíricos e uma pontuação de confiança de interação calculada, produzindo um conjunto de dados de 6463 interações entre 2235 proteínas distintas. Este conjunto de dados foi posteriormente validado usando interações de proteínas humanas previstas e publicadas anteriormente. A mineração em profundidade do conjunto de dados mostra que ele representa uma fonte valiosa de novas interações proteína-proteína com relevância para doenças humanas. Além disso, por meio de nossa análise preliminar, relatamos muitas novas interações de proteínas e associações de vias.


Proteína e # x27 Interações de proteína

As proteínas interagem continuamente entre si para determinar o destino da célula. Consequentemente, um exame de apenas quando essas interações proteína-proteína ocorrem e como elas são controladas é essencial para compreender o mecanismo molecular dos processos biológicos, elucidar a base molecular das doenças e identificar alvos potenciais para intervenções terapêuticas. Em Interações proteína-proteína: métodos e aplicações, os principais especialistas descrevem em detalhes suas técnicas bioquímicas, biofísicas, genéticas e computacionais altamente bem-sucedidas para estudar essas interações. Seus métodos prontamente reproduzíveis demonstram como identificar parceiros de interação de proteínas, medir qualitativa ou quantitativamente as interações proteína-proteína, monitorar as interações proteína-proteína à medida que ocorrem em células vivas e determinar interfaces de interação. As técnicas descritas utilizam uma variedade de tecnologias de ponta, incluindo ressonância de plasma de superfície (SRP), transferência de energia de ressonância de fluorescência (FRET), polarização de fluorescência (FP), calorimetria de titulação isotérmica (ITC), dicroísmo circular (CD), complementação de fragmento de proteína ensaios (PCA), vários sistemas de dois híbridos e abordagens baseadas em proteômica e bioinformática, como o programa Scansite para análise computacional. Cada protocolo testado pelo tempo inclui uma introdução básica que descreve o princípio por trás da técnica, listas de equipamentos e reagentes e dicas para solucionar problemas e evitar armadilhas conhecidas.
Autoritário e altamente prático, Interações proteína-proteína: métodos e aplicações oferece aos investigadores iniciantes e experientes uma gama completa de ferramentas poderosas necessárias para decifrar como as proteínas interagem para formar redes biológicas, bem como para desvendar interações proteína-proteína em doenças no busca de novos alvos terapêuticos.

"Este livro é completo e repleto de informações. O volume é de alto valor prático e é totalmente recomendado a todos os bioquímicos." - Cell Biochemistry and Function

"O livro é bem equilibrado e fácil de usar. Vale a pena o custo de aquisição." - ChemBioChem

"Este ... volume descreve de forma abrangente uma variedade de abordagens baseadas em biofísica, biologia celular e biologia molecular para a análise de interações proteína-proteína. ... Este volume é recomendado como uma apresentação sólida sobre os fundamentos da análise de interação de proteínas, adequada para graduados cursos de química biofísica e para os investigadores novos na área que gostariam de obter uma base sólida…. " (Wayne F. Patton, Proteomics, Edição 6, 2006)


Notas de rodapé

Resumo de uma frase: Uma ferramenta baseada na deslocalização dependente de rapamicina permite que as interações proteína-proteína sejam visualizadas e quantificadas dentro Nicotiana Benthamiana células epidérmicas da folha.

O autor responsável pela distribuição de materiais essenciais aos resultados apresentados neste artigo, de acordo com a política descrita nas Instruções para Autores (www.plantcell.org) é: Daniël Van Damme (daniel.vandammepsb.vib-ugent.be).

Esta é uma versão atualizada do manuscrito que agora é aceita no The Plant Cell.


Fundo

As interações físicas proteína-proteína têm sido estudadas extensivamente por causa de seu papel crucial no controle de processos biológicos centrais, como a divisão celular e suas implicações em uma variedade de doenças humanas, incluindo o câncer. Uma coleção de técnicas experimentais está disponível para caracterizar as interações proteína-proteína, algumas delas são mais adequadas para determinar complexos estáveis, enquanto outras são geralmente consideradas melhores para detectar interações transitórias. O uso de abordagens proteômicas em grande escala para obter experimentalmente informações de interação de proteínas resultou em uma fonte adicional de dados de interação. Além disso, técnicas de bioinformática baseadas em informações sequenciais, estruturais ou evolutivas foram desenvolvidas para prever interações de proteínas binárias.

Para capturar e fornecer acesso eficiente às informações subjacentes, anotações de interação estruturada foram armazenadas em bancos de dados públicos. Esses bancos de dados variam em profundidade de anotação e tipo de interações, mas uma característica comum é que as anotações são extraídas principalmente por curadores humanos de publicações relevantes. Alguns bancos de dados de interação, como o banco de dados de interação proteína-proteína humana HPRD (Human Protein Reference Database) [1], HomoMINT (inferred human network) [2] e MIPS (Munich Information Center for Protein Sequences) [3], focam em certos táxons e armazenar principalmente informações para proteínas humanas ou de mamíferos. Existem também bancos de dados de interação mais especializados, como PDZBase [4], que é restrito a proteínas com um domínio PDZ, ou Reactome [5], que se concentra em interações relacionadas a vias biológicas. Os bancos de dados de interação MINT (Molecular Interactions Database) [6] e IntAct [7] contêm o maior número de interações proteína-proteína humana direta não redundante, excedido em número apenas por HPRD. Eles também fornecem referências bibliográficas relevantes para as interações individuais, juntamente com o método de detecção de interação experimental usado como evidência de apoio [8].

Embora a maioria dos bancos de dados de interação forneça links para identificadores SwissProt para suas proteínas de interatores, para comparar anotações derivadas de bancos de dados diferentes, bem como para compartilhar o esforço de anotação, tanto um formato de anotação padrão quanto termos de vocabulário controlado que descrevem o contexto experimental são cruciais. O padrão Proteomics Standards Initiative Molecular Interaction (PSI-MI) foi desenvolvido para facilitar um esforço de anotação coordenado para interações de proteínas usando termos de vocabulário controlado e fornecendo um formato comum como estrutura [9]. Sistemas de recuperação mais eficientes de interações biológicas contidos em artigos científicos são demandados não apenas por usuários especializados, como curadores de bancos de dados biológicos, mas também pela comunidade de biologia em geral. A fim de melhorar a eficiência da localização de artigos relevantes para a curadoria pelos curadores do Banco de Dados de Interação Biomolecular (BIND), um sistema de extração chamado PreBIND baseado em classificadores de máquina de vetores de suporte (SVM) para detectar artigos relevantes para a interação foi desenvolvido [10].

Uma série de métodos tem sido proposta para extrair associações biológicas da literatura. Alguns deles obtêm associações gerais, enquanto outros se concentram em certas categorias de associação biologicamente relevantes (por exemplo, interações de proteínas, interações genéticas [regulação de genes] ou associação de palavras-chave funcionais de produtos de genes [anotações funcionais]) [11, 12].

Em geral, duas abordagens de linha de base para extrair relações biológicas podem ser identificadas, embora muitos dos sistemas publicados anteriormente sejam, na verdade, estratégias híbridas que combinam recursos de ambos. As abordagens são chamadas de análise de associação local e análise de associação global.

A análise de associação local ou abordagem centrada no artigo tenta extrair interações binárias para proteínas que ocorrem em um contexto textual predefinido, geralmente correspondendo a frases ou passagens de texto. Para determinar se as entidades co-ocorrentes exibem um relacionamento de interação, características contextuais adicionais são consideradas. Alguns deles dependem, por exemplo, do uso de palavras-chave de interação, verbos ou quadros semânticos, ou de técnicas de aprendizado de máquina para classificar frases de acordo com sua relevância de interação ou mesmo exploração de regras sintáticas para detectar relações de interação. Algumas dessas abordagens integram módulos que tratam da negação ('A [não] interage com B') que invertem o significado de um predicado. Outras abordagens podem detectar enumerações de várias menções a proteínas em uma única frase. A vantagem da abordagem centrada no artigo é que ela geralmente fornece sentenças relevantes para a interação, úteis para a interpretação humana, e pode dar suporte à detecção de novas interações de proteínas com apenas uma única evidência de citação. Como esse tipo de abordagem extrai interações diretas junto com a evidência textual de apoio, pode servir para melhorar a consistência da anotação, bem como facilitar a atualização da anotação.

A análise de associação global, ou extração de interação multi-documento, tenta explorar a coocorrência recorrente de proteínas dentro de uma coleção de documentos ou passagens, a fim de detectar pares de interação de proteínas [13]. A força ou confiabilidade dos pares de interação extraídos pode ser calculada com base na análise estatística de coocorrência. Uma rede de interação pode, portanto, ser extraída fornecendo uma visão geral da biologia de sistemas globais que também captura relações indiretas que vão além de um único documento. Esta estratégia é mais adequada para capturar interações de proteínas comumente conhecidas, que foram extensivamente estudadas com uma coleção de citações de apoio. Uma desvantagem dessa abordagem é que ela não é direta para a interpretação humana.

A maioria dos métodos implementados extrai informações de interação apenas dos resumos e títulos do PubMed, e não dos artigos em texto completo correspondentes, obtendo resultados que não são diretamente comparáveis ​​com as informações contidas em bancos de dados de interação, que acessam todos os documentos. Outra limitação é que a maioria deles aborda apenas aspectos muito restritos do pipeline de anotação de interação, o que fornece resultados um tanto artificiais que não aumentam para lidar com aplicativos reais. Entre os aspectos frequentemente negligenciados estão os meandros do processo inicial de seleção do artigo, bem como a ligação das proteínas do interator ao seu identificador de banco de dados correspondente, uma etapa que é frequentemente referida como 'normalização'. Além disso, nenhuma estratégia de mineração de texto relatada anteriormente distingue entre interações verificadas experimentalmente e declarações de interação que carecem de confirmação experimental. Esse aspecto é crucial, porque a maioria dos bancos de dados de anotação biológica fornece um qualificador de evidência para cada registro de anotação. Para o BioCreative II, desenvolvemos uma tarefa de mineração de texto para a extração de anotações de interação proteína-proteína da literatura e avaliamos as submissões em relação a um 'padrão ouro' com curadoria manual realizado por anotadores de banco de dados especialistas.

Os principais objetivos apresentados ao conceber a tarefa de interação proteína-proteína (PPI) foram os seguintes.

1. Determine o desempenho das ferramentas de mineração de texto de última geração na extração de PPIs, em comparação com a curadoria manual.

2. Fornecer aos sistemas participantes recursos úteis para treinar e testar os sistemas de extração de interação de proteínas.

3. Explore quais abordagens são bem-sucedidas e práticas.

4. Analisar as principais dificuldades e aspectos que influenciam o desempenho dos sistemas de extração de PPI.

5. Promova o desenvolvimento de ferramentas úteis para extrair interações proteína-proteína do texto.

Os sistemas de extração de interação de proteínas publicados anteriormente não têm configurações de avaliação diretamente comparáveis ​​para permitir a realização de estudos de comparação e benchmark consistentes, e também produzem resultados que não são comparáveis ​​com os resultados dos esforços de anotação de banco de dados manual (principalmente devido à falta de proteína do interator normalização). A tarefa BioCreative II PPI foi realizada para permitir a comparação de várias estratégias em um conjunto de dados de referência comum com base em coletas de dados preparadas por especialistas do domínio e em linha com o conteúdo e estratégia de anotação de bancos de dados de interação.

Tarefa de interação proteína-proteína

A tarefa PPI compreendeu quatro subtarefas, cada uma das quais se preocupava com um aspecto particular do pipeline de anotação de interação.

1. Subtarefa de artigo de interação (IAS): classificação e classificação de resumos PubMed, com base em se eles são relevantes para a anotação de interação de proteínas ou não.

2. Subtarefa de pares de interação (IPS): extração de pares de interação proteína-proteína binários de artigos de texto completo. As proteínas são anotadas com seu identificador SwissProt exclusivo correspondente.

3. Subtarefa do método de interação (IMS): extração do método de detecção de interação usado para caracterizar as interações de proteínas descritas em artigos de texto completo. Os métodos de detecção de interação devem ser caracterizados em termos de identificadores de ontologia MI correspondentes. Eles constituem a evidência experimental para a interação.

4. Subtarefa de frases de interação (ISS): recuperação das passagens de evidências textuais que descrevem / resumem a interação.

As equipes participantes receberam uma coleção de dados de treinamento para cada subtarefa para construir e treinar seus sistemas de mineração de literatura durante o período de junho a outubro de 2006. Em seguida, durante a fase de teste, os participantes tiveram que fornecer submissões para pelo menos um dos PPI subtarefas dentro de um curto período de tempo predefinido (& lt2 semanas, para minimizar a possibilidade de uma tentativa de anotação manual). A Figura 1 fornece um fluxograma comparativo do processo de anotação de interação manual proteína-proteína com a extração automática baseada em texto dentro do contexto da tarefa BioCreative II PPI.

Anotação de interação proteína-proteína manual versus automatizada. É apresentada uma comparação entre o processo de anotação de interação manual proteína-proteína (PPI) e a extração automática de interações de proteínas no contexto da tarefa PPI do BioCreative II.


Projeto Interactome Humano

Um dos objetivos de longo prazo do CCSB é gerar um primeiro mapa de referência da rede do interactome proteína-proteína humana. Para alcançar este objetivo, estamos mapeando as interações de proteína-proteína binárias interrogando sistematicamente todas as combinações de pares de produtos de genes previstos em espaços de busca definidos usando tecnologias em escala de proteoma. Nossa abordagem é mapear interações de proteína-proteína binária de alta qualidade usando um ensaio de dois híbridos de levedura primário (Y2H) seguido por validação ortogonal por ensaios binários alternativos. Atualmente, concluímos dois esforços em escala de proteoma (HI-I-05 e HI-II-14) com base nas coleções de ORF clonadas do Gateway disponíveis no momento desses experimentos (http://horfdb.dfci.harvard.edu ) Outros esforços para otimizar nosso pipeline e comparar a qualidade de nossos mapas também levaram à produção de mapas sistemáticos, embora de tamanho relativamente menor (Venkatesan-09 e Yu-11). Em 2013, extraímos, filtramos e comparamos dados de interação de 7 bancos de dados públicos para extrair um conjunto de dados de literatura binária de alta qualidade (Lit-BM-13) que compreende todas as interações proteína-proteína que são binárias e suportadas por pelo menos duas peças rastreáveis de evidências (publicações e / ou métodos).

Todos os conjuntos de dados individuais são descritos em mais detalhes aqui abaixo e estão disponíveis gratuitamente para a comunidade de pesquisa por meio do mecanismo de busca ou por download. Dados preliminares de projetos em andamento também são descritos, mas estão disponíveis apenas para usuários registrados para download aqui.

HI-I-05: Nossa primeira iteração no mapeamento do interactome humano (Rual et al Nature 2005) exibiu um espaço (Espaço I) de

8.000 ORFs correspondentes a

7.000 genes, e identificados

2.700 interações binárias de alta qualidade. Este espaço de busca representa

12% do espaço de pesquisa completo, assumindo um total de

20.000 genes codificadores de proteínas e limitando o escopo a uma variante por gene. Este conjunto de dados está disponível gratuitamente para a comunidade de pesquisa por meio do mecanismo de busca ou por download.

HI-II-14: A segunda fase do projeto de interação humana (Rolland et al Cell 2014) gerou um conjunto de dados de

14.000 interações binárias seguindo duas telas de uma matriz de

13.000 x 13.000 proteínas (Espaço II). Este espaço de pesquisa cobre

42% do espaço de busca completo, um aumento de mais de 3 vezes em relação à nossa primeira tentativa. Este conjunto de dados está disponível gratuitamente para a comunidade de pesquisa por meio do mecanismo de busca ou por download.

HI-III: A próxima fase do projeto do interactome humano está em andamento. A coleção de ORF humana que está sendo rastreada foi expandida para

17.500 genes únicos (Espaço III) e capas

77% do espaço de busca completo. A lista de genes sendo rastreados é fornecida aqui. Os dados preliminares produzidos por este esforço contínuo são fornecidos como pré-publicação para usuários registrados aqui.

Venkatesan-09: Para estimar a cobertura e o tamanho do interactoma humano (Venkatesan et al Métodos Nat 2009), quatro telas Y2H foram realizadas em um conjunto de

1.800 proteínas de fusão DB-X (ou iscas, representando

1.700 genes únicos) contra

1.800 proteínas AD-Y (ou presas, representando

1.800 genes únicos), correspondendo a

10% dos genes disponíveis e

1% de todo o espaço de pesquisa. Este conjunto de dados contém

200 interações Y2H de alta qualidade e estão disponíveis gratuitamente para a comunidade de pesquisa por meio do mecanismo de busca ou por download.

Yu-11: Para desenvolver um novo protocolo de mapeamento interativo Stitch-seq, uma tela Y2H foi realizada dentro do Espaço II (Yu et al Métodos Nat 2011). Stitch-seq combina costura PCR com sequenciamento de última geração e aumenta a eficiência e a relação custo-benefício da triagem Y2H. O conjunto de dados resultante contém

1.200 interações entre proteínas codificadas por

1.100 genes humanos. Este conjunto de dados está disponível gratuitamente para a comunidade de pesquisa por meio do mecanismo de busca ou por download.

Espaço de teste: para desenvolver, otimizar e avaliar melhorias para o pipeline de mapeamento usado para esforços contínuos (HI-III), doze telas independentes e recíprocas em um espaço de busca de

1.800 genes foram completados, constituindo

1% de todo o espaço de pesquisa. Os dados preliminares produzidos por este esforço contínuo são fornecidos como pré-publicação para usuários registrados aqui.

Conjunto de dados de literatura não sistemáticos de alta qualidade

Lit-BM-13: Em 2013, extraímos dados de interação de BIND, BioGRID, DIP, HPRD, MINT, IntAct e PDB para gerar um conjunto de dados de literatura binária de alta qualidade que compreende

11.000 interações proteína-proteína que são binárias e apoiadas por pelo menos duas evidências rastreáveis ​​(publicações e / ou métodos) (Rolland et al Cell 2014). Embora este conjunto de dados não resulte de uma investigação sistemática do espaço de busca interativo e, portanto, deva ser usado com cautela para qualquer análise de topologia de rede, ele representa interações valiosas para estudos direcionados e está disponível gratuitamente para a comunidade de pesquisa por meio do mecanismo de busca ou via download .


Pesquisa de interações proteína-proteína - Biologia

As interações proteína-proteína (PPIs) estão se tornando cada vez mais relevantes na patologia de muitas doenças, incluindo o câncer. A questão, no entanto, é desenvolver uma maneira eficaz de direcioná-los. Os últimos avanços em métodos de direcionamento de PPIs são projetados para superar os desafios que limitam os métodos convencionais. Targeting PPIs oferece outro alvo terapêutico potencial para doenças com perfis biológicos complexos.

Significado terapêutico dos PPIs

Os PPIs são parte integrante da fisiologia dos organismos vivos, como complexos que controlam as vias biológicas mediadas por proteínas. Os processos celulares críticos, incluindo a replicação e tradução do DNA, não podem ocorrer sem proteínas funcionais específicas. A rede de PPIs, conhecida como interactome, é essencial para facilitar mecanismos moleculares importantes como transdução de sinal e morte celular.

PPIs disfuncionais podem criar problemas, no entanto, e foram identificados na patologia de uma infinidade de doenças. Compreender o mecanismo dos PPIs e desenvolver métodos para direcionar os aberrantes tem sido uma estratégia-chave no desenvolvimento de medicamentos. O raciocínio por trás dessa estratégia é que os alvos clássicos de drogas em doenças como o câncer são frequentemente enzimas e receptores, portanto, os PPIs representam um alvo terapêutico atraente devido ao fato de que os alvos terapêuticos atuais são tipicamente baseados em proteínas.

Desafios atuais e abordagens convencionais na segmentação de PPIs

Em comparação com a abordagem clássica de descoberta de drogas de moléculas pequenas, a modulação de PPIs é mais desafiadora. Enquanto os alvos como os receptores contêm um local de ligação do ligante óbvio para as moléculas do fármaco interagirem, os PPIs compreendem uma estrutura mais complexa. Os pontos a seguir resumem esses desafios:

• Os PPIs possuem uma associação de alta afinidade devido ao arranjo dos resíduos de aminoácidos. Isso torna um desafio para moléculas pequenas inibir a interação forte.

• A superfície dos PPIs, conhecida como interface, é normalmente plana com um número limitado de ranhuras. Isso torna difícil a ligação de pequenas moléculas especificamente projetadas.

• A interface é altamente hidrofóbica, portanto, quaisquer compostos que contenham água seriam repelidos.

A interface plana continua sendo o principal desafio para o desenvolvimento de moduladores PPI. Em comparação com proteínas como enzimas, que possuem sítios de ligação para ligantes complementares, a interface se mostra difícil de encontrar uma molécula compatível. No entanto, pontilhando a interface são áreas de resíduos de aminoácidos que contribuem para a energia livre de ligação, conhecidas como pontos quentes. Essas regiões são críticas para ótimas interações entre proteínas. A importância dos pontos quentes prova ser necessário desenvolver métodos que projetem moduladores PPI que sejam complementares aos pontos quentes das interfaces PPI.

Um exemplo de método que visa PPIs é a triagem virtual. Um dos principais problemas no desenvolvimento de moduladores de PPI é identificar os PPIs associados à doença e se eles são & # 8216'druggable 'entre os milhares disponíveis. A triagem virtual pode analisar superfícies de proteínas para localizar o local de ligação.

A partir daqui, os locais de ligação são classificados em duas categorias que determinam se uma abordagem baseada na estrutura ou no ligante é necessária. É um método popular em biologia de sistemas, exigindo menos compostos para serem rastreados em bioensaios, reduzindo tempo e custo. Apesar desses benefícios, a triagem virtual relata altas taxas de falsos positivos ao identificar PPIs específicos, o que limita seu uso apenas à triagem inicial.

Novas abordagens para otimizar PPIs: atendendo a uma demanda clínica

A prevalência de PPIs aberrantes em doenças como o câncer reforça a necessidade de desenvolver estratégias para melhor direcionar esses componentes biológicos. Um recente artigo de pesquisa clínica destaca a importância do direcionamento de PPIs em células-tronco de câncer. Uma rede PPI foi construída a partir de nove marcadores de células-tronco do cólon, a fim de identificar potenciais alvos genéticos em pacientes. A combinação do banco de dados PPI e os "perfis de genes de alto rendimento" # 8217 revelou um agrupamento de genes relacionados às células-tronco do câncer de cólon (CSCs).

Do cluster, a proteína TMEM17 foi identificada como um novo gene relacionado ao CSC, cuja depleção pode “suprimir a proliferação de células de câncer colorretal (CRC) e sensibilizar as células CRC para a quimioterapia. A identificação do TMEM17 dentro de uma rede de PPI estabelece um alvo terapêutico para o tratamento de CRC, o que destaca ainda mais o potencial de direcionamento de PPIs como uma estratégia eficaz no câncer.

Um método amplamente utilizado de detecção de PPIs é o Yeast-two-hybrid (Y2H), que foi recentemente otimizado para superar os desafios de métodos como a triagem virtual. De acordo com uma publicação de 2021, “… avanços recentes tornaram possível gerar e analisar redes PPI em todo o genoma em massa, acoplando Y2H com tecnologia de sequenciamento de próxima geração (NGS)”.

A combinação de NGS com Y2H é uma das mudanças inovadoras recentes do Y2H original. Este método inovador agora aproxima a tecnologia do desenvolvimento de redes PPI de todo o genoma. Apesar das mudanças promissoras para otimizar esses métodos, ainda existem desafios que precisam ser enfrentados. Um dos principais problemas com o Y2H, como a triagem virtual, é o número de falsos positivos que ocorrem com a autoativação de genes repórter induzíveis por Y2H. Isso ocorre quando o domínio de ligação ou ativação de DNA ativa a transcrição de “genes repórter Y2H, independentemente da presença de qualquer PPI”.

Um estudo publicado recentemente foi capaz de superar esse problema, no entanto, desenvolvendo um tipo de seleção negativa condicional para rastrear falsos positivos. Isso representa uma etapa significativa no direcionamento de PPIs: ao remover a alteração de falsos positivos, o Y2H pode identificar com mais precisão os PPIs alvo em estados de doença.

Os métodos em evolução de direcionamento de PPIs destacam a necessidade de integrar informações estruturais 3D à biologia de sistemas. Nas redes PPI, as proteínas são definidas como nós que são conectados por bordas (interações), porém não há referência à estrutura das proteínas, nem ao mecanismo das interações envolvidas. A introdução de métodos computacionais, no entanto, pode ser usada para “interrogar essas interações” que podem complementar a “evidência experimental disponível”. A adição de informações estruturais permite um entendimento mais informado sobre a funcionalidade dessas redes PPI.

O que isso significa para a pesquisa clínica?

O desenvolvimento contínuo de métodos direcionados aos PPIs permite aos pesquisadores obter melhores insights sobre o impacto das micro alterações de proteínas específicas e o impacto em uma escala macro com a manifestação de doenças. Especialmente em oncologia, o direcionamento aos PPIs abre a porta para o desenvolvimento de drogas terapêuticas com maior seletividade e especificidade para rivalizar com o tratamento convencional.

Para discutir esses tópicos mais com especialistas do setor e para garantir que você permaneça atualizado sobre as últimas novidades em desenvolvimento clínico, inscreva-se na mesa redonda do PPI do diretor sênior de Química Medicinal Robert Hilgraf & # 8217s em Reuniões de Estratégia de Química Medicinal e Biologia da Proventa International, marcadas para 25 de maio de 2021.

Charlotte Di Salvo, Redatora Médica Júnior
Proventa International


Fundo

As regulamentações gênicas descrevem as interações entre os genes durante a atividade celular. Por meio da regulação, os genes orquestram o nível de mRNA sintetizado e, assim, controlam a expressão de outros genes e as taxas nas quais as proteínas são produzidas, eventualmente decidindo o estado da célula. Os microarranjos de expressão gênica (GE) fornecem dados quantitativos ou semiquantitativos sobre o estado da célula em um momento e condição específicos. Por dados de GE de "engenharia reversa", as interações regulatórias entre os genes podem ser identificadas e a rede regulatória de genes pode ser mapeada usando métodos computacionais [1, 2].

A grande maioria das abordagens de análise funcional para modelar dados de microarray GE assumem que genes com perfis de expressão semelhantes têm funções celulares semelhantes [3–5]. Uma via molecular é um conjunto de genes que se ativam juntos para realizar uma tarefa específica e, portanto, compartilham perfis de expressão semelhantes. Neste artigo, usamos um método baseado em dados - o agrupamento baseado em modelo - para modelar genes em caminhos distintos. Especificamente, modelamos cada caminho como um modelo gaussiano, pois permite modelar correlações entre expressões gênicas de uma forma orientada por dados. É mais adequado para situações em que o conhecimento prévio das vias regulatórias é desconhecido. Além disso, como os genes participam naturalmente de mais de uma via regulatória, o agrupamento suave é usado para permitir que os genes possam ter membros em várias vias. Assim, adotamos o modelo de mistura gaussiana (GMM) nos dados de GE para que diferentes vias regulatórias possam ser identificadas.

The rationale behind clustering is that co-expressed genes, i.e., genes in the same cluster are more likely to be functionally related and belong to the same cluster. However, regulatory processes of the genes in a cluster could not necessarily be direct as it could refer to an indirect regulation via proteins, metabolites, or ncRNAs. In cases where two interaction partners are transcription factors or where two proteins are in the same complex, the interactions are direct. In order to identify indirect regulations in GRN, evidences from multiple data sources should be used. For example, medical literature, protein-protein interaction (PPI) data, gene ontology, etc., have all been used to supplement wet lab data in the inference of GRN [6–9]. When more than one source are available, an essential step is to optimally combine evidences from multiple sources to derive a coherent GRN [10–12].

Since proteins are products of genes, protein interactions provide useful evidence for gene regulation. PPIN data have been fused with GE data for GRN inference in previous studies [13–17]. Most of these works considered only binary links of PPIN: if the link is consistent with the predicted edge from GE, the link is accepted as a true regulation. This approach throws away valuable information, so an accurate quantitative scoring scheme is needed to evaluate consistency between PPIN and gene regulation. On the other hand, existing PPINs are sparse and many real protein interactions are missing in current PPIN databases. Suggested by previous PPI prediction works [18, 19], there exist a large number of interactions between proteins in complexes, which have not yet been observed or recorded in current PPIN. We therefore propose a heuristic to quantitatively extend sparse PPIN by using transitive linkages. We then propose a novel way to score protein interactions by combining topological properties of extended PPIN and correlations of GE. Our experiments demonstrate that transitive protein interactions indeed play an important role in predicting protein interactions. We fuse the extended PPIN scores with GE data, using a Gaussian hidden Markov model (GHMM) to identify gene regulatory pathways, which are found to more consistent with PPIN than those produced by GMM. We further refine PPIN confidence scores by including gene interaction scores from GHMM, which makes the PPIN score more consistent with the existing GRN.

Since there exists no widely accepted model that universally fits GE data well [20–23], and different models capture different GE properties leading to different or complementary GRN structures [21], fusion of different models should lead to better GRN. The GHMM identifies regulatory pathways and obtain possible interacting genes by considering linear correlations between genes but misses conditional dependencies, i.e., non-linear relations, among genes in the same regulatory pathway. The Bayesian network (BN) model is good at capturing these conditional dependences but suffers from poor computational efficiency. We thus propose a systematic probabilistic framework that fuse these two models and derive coherent GRN closer to biological reality. Specifically, our framework takes a coarse-to-fine approach: GHMM generates regulatory pathways (i.e., a coarse GRN having high coverage) and obtains refined interaction scores, both of which are then used to constrain the GRN structure of a BN model (i.e., the Bayesian Gaussian mixture model). This generates GRN that are of good coverage and high precision. Furthermore, GRN structural constrains help greatly reduce the search space for BGM model, thereby reducing the overall computational complexity. Figure 1 shows the flow chart of our GRN inference process.

Overall Model. Step 1: A Gaussian mixture model (GMM) is used to soft-cluster gene expression (GE) data. Step 2: A heuristic is proposed to quantitatively extend the sparse protein-protein interactions by using transitive linkages. A novel way is then proposed to score protein interactions by combining topological properties of extended protein-protein interaction network (PPIN) and GE correlations. Step 3: A Gaussian Hidden Markov Model (GHMM) is used to identify gene regulatory pathways and refine interaction scores, both of which are then used as structural priors to constrain the model of GRN. Step 4: Lastly, the GRN from GE is refined using a Bayesian Gaussian Mixture (BGM) model by including the structural priors derived from Step 3


Resumo

Protein–protein interactions (PPIs) are important in all aspects of cellular function, and there is interest in finding inhibitors of these contacts. However, PPIs with weak affinities and/or large interfaces have traditionally been more resistant to the discovery of inhibitors, partly because it is more challenging to develop high-throughput screening (HTS) methods that permit direct measurements of these physical interactions. Here, we explored whether the functional consequences of a weak PPI might be used as a surrogate for binding. As a model, we used the bacterial ATPase DnaK and its partners DnaJ and GrpE. Both DnaJ and GrpE bind DnaK and catalytically accelerate its ATP cycling, so we used stimulated nucleotide turnover to indirectly report on these PPIs. In pilot screens, we identified compounds that block activation of DnaK by either DnaJ or GrpE. Interestingly, at least one of these molecules blocked binding of DnaK to DnaJ, while another compound disrupted allostery between DnaK and GrpE without altering the physical interaction. These findings suggest that the activity of a reconstituted multiprotein complex might be used in some cases to identify allosteric inhibitors of challenging PPIs.


Resumo

Protein complexes are fundamental for understanding principles of cellular organizations. As the sizes of protein–protein interaction (PPI) networks are increasing, accurate and fast protein complex prediction from these PPI networks can serve as a guide for biological experiments to discover novel protein complexes. However, it is not easy to predict protein complexes from PPI networks, especially in situations where the PPI network is noisy and still incomplete. Here, we study the use of indirect interactions between level-2 neighbors (level-2 interactions) for protein complex prediction. We know from previous work that proteins which do not interact but share interaction partners (level-2 neighbors) often share biological functions. We have proposed a method in which all direct and indirect interactions are first weighted using topological weight (FS-Weight), which estimates the strength of functional association. Interactions with low weight are removed from the network, while level-2 interactions with high weight are introduced into the interaction network. Existing clustering algorithms can then be applied to this modified network. We have also proposed a novel algorithm that searches for cliques in the modified network, and merge cliques to form clusters using a "partial clique merging" method. Experiments show that (1) the use of indirect interactions and topological weight to augment protein–protein interactions can be used to improve the precision of clusters predicted by various existing clustering algorithms and (2) our complex-finding algorithm performs very well on interaction networks modified in this way. Since no other information except the original PPI network is used, our approach would be very useful for protein complex prediction, especially for prediction of novel protein complexes.


Assista o vídeo: Chcesz lepszą sylwetkę? MUSISZ TO wiedzieć o BIAŁKU (Outubro 2022).