Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

bioinformatica:protocolo_leishmania [2016/05/13 16:04] (atual)
aracnus criada
Linha 1: Linha 1:
 +====== Protocolo Cytoscape ======
  
 +===== Instalação =====
 +
 +  - O instalador do //​Cytoscape//​ pode ser baixado a partir da página http://​cytoscape.org/​download.php. A página detecta o sistema operacional utilizado e oferece um botão de download da versão apropriada. Para baixar versões para outros sistemas operacionais,​ utilize o link "Other platforms"​ logo abaixo dessa mesma página. É necessário ter o //Java// versão 7 ou superior para executar a versão atual do //​Cytoscape//​. Existe um link para o //Java// nessa mesma página, logo abaixo do botão de download do //​Cytoscape//​.
 +  - Terminado a transferência do software, abra um terminal e vá até o diretório onde ele foi salvo.
 +  -- Execute o instalador com o comando:
 +  ..
 +  ..''​bash <​nome_do_instalador>''​
 +  ..
 +  .. Por padrão, o nome do arquivo é //​Cytoscape//,​ seguido pelo número da versão mais a plataforma e a extensão. Por exemplo, a versão 3.2.1 para //​GNU/​Linux//​ tem o seguinte nome: //​Cytoscape_3_2_1_unix.sh//​.
 +  - Siga as instruções do instalador, lembrando que, como usuário comum, só será possível instalar o programa dentro do seu próprio //home//.
 +  - Após a instalação,​ o //​Cytoscape//​ aparecerá como um item no menu de aplicativos.
 +
 +===== Tratamento de dados de Leishmania =====
 +
 +Como padronização para a execução desses procedimentos,​ todos os arquivos de dados referentes a esse protocolo serão armazenados no diretório //​ppi-leishmania//,​ situado dentro do diretório //home// do usuário. Sempre que for necessária a indicação do caminho completo do diretório, será usada a notação //​~/​ppi-leishmania//​ (sendo "​~"​ a notação indicativa do diretório //home// individual do usuário).
 +
 +Por isso, como procedimento inicial, crie o diretório //​~/​ppi-leishmania//​ com o comando:
 +
 +''​mkdir ~/​ppi-leishmania''​
 +
 +==== Preparação dos dados ====
 +
 +=== Obtenção e tratamento dos dados da rede de referência ===
 +
 +Para esse protocolo foi utilizada a versão 10 do //STRING//. É possível que ocorram discrepâncias nos procedimentos caso o //STRING// passe por alguma atualização.
 +
 +  - Entre no site do //STRING//, através da URL http://​string-db.org.
 +  - Clique no link "​Download"​.
 +  - Nessa página é possível selecionar o organismo do qual se deseja baixar a rede de interações. Procure pela caixa de texto onde está escrito "​choose an organism"​. Digite "​Leishmania infantum JPCM5" (sem as aspas) e clique no botão "​Update"​. Com isso a tela será recarregada e os links atualizados para esse organismo em particular. Baixe o arquivo "​435258.protein.links.detailed.v10.txt.gz"​.
 +  -- Descompacte o arquivo com o comando:
 +  ..
 +  ..''​gunzip 435258.protein.links.detailed.v10.txt.gz''​
 +  ..
 +  -- O arquivo descompactado contém toda a rede de interações de proteínas de //​Leishmania infantum// JPCM5 disponíveis no //STRING//. As informações sobre as interações vieram de diversas fontes e com variados graus de confiança. Para esse protocolo foram consideradas somente as interações que possuam um score maior ou igual a 900, nas categorias //​experiments//​ ou //​databases//​. Esse score é considerado ótimo pela classificação do //STRING//. Para essa filtragem, utilize o seguinte comando:
 +  ..
 +  ..<code bash>awk '​($7>​900 || $8>900) {print $1"​\t"​$2"​\t"​$7"​\t"​$8"​\t"​$10}'​ < 435258.protein.links.detailed.v10.txt | sed '​s/​435258.XP/​XP/​g'​ > leishmania_protein_links_detailed-experimental_900_or_database_900.txt</​code>​
 +  ..
 +  ..Com isso será gerado o arquivo "​leishmania_protein_links_detailed-experimental_900_or_database_900.txt",​ contendo os dados já filtrados. Esse arquivo será utilizado como base para a construção da rede no //​Cytoscape//​.
 +
 +=== Filtragem dos dados de expressão gênica ===
 +
 +  -- Os dados de origem são os do grupo 1B, ou seja, resultado da comparação de duas cepas de //​Leishmania infantum chagasii//, uma resistente, tratada com 0,06 mg/ml de antimonial trivalente, e uma sensível, não tratada. Esses dados foram extraídos da planilha "​LcSbR-0.06--vs--LcWTS-0.xlsx",​ gerando-se um arquivo CSV. Desse arquivo CSV, precisamos somente das colunas do identificador no NR (//Subject name - NR//), ao valor relativo da expressão gênica (//​log2FoldChange//​),​ do identificador no //​TriTrypDB//​ (//​GeneID//​) e da descrição do //subject name// (//Subject description//​). Para isso utilize o seguinte //script//:
 +  ..
 +  ..<code bash>sed -e '​s/​gi|.*|XP/​XP/;​s/​|\t/​\t/'​ LcSbR-0.06_vs_LcWTS-0-DE-pvalueadj_0.05.csv | awk 'BEGIN { FS = "​\t"​ } ; {if ($11 ~ /XP.*/ || $2 = "​baseMean"​) {print $10"​\t"​$3"​\t"​$1"​\t"​$12}}'​ > LcSbR-0.06_vs_LcWTS-0-DE-pvalueadj_0.05-filtered.txt</​code>​
 +  .. Com isso será gerado o arquivo "​LcSbR-0.06_vs_LcWTS-0-DE-pvalueadj_0.05-filtered.txt",​ com as colunas isoladas e já reordenadas. Esse arquivo será utilizado para localizar as proteínas na rede gerada.
 +
 +==== Montagem da rede no Cytoscape ====
 +
 +=== Inclusão da rede principal ===
 +
 +  - Abra o //​Cytoscape//​.
 +  - Na tela de boas-vindas,​ selecione a opção "From Network File..."​ que está na divisão "Start New Session"​. Na janela que se abre, vá até o diretório "​ppi-leishmania",​ que está dentro do seu diretório "​home"​ e abra o arquivo "​leishmania_protein_links_detailed-experimental_900_or_database_900.txt"​. Caso a tela de boas-vindas não apareça, ou você já tenha aberto o programa anteriormente,​ vá até o menu "​File",​ selecione a opção "​Import",​ em seguida, "​Network"​ e, por fim, "​File..."​ (que também é acessível pelo atalho ''​Ctrl+L''​) e abra o mesmo arquivo descrito acima.
 +  - Aparecerá uma nova tela onde serão definidos os detalhes da rede a ser montada. Na seção "​Interaction Definition"​ selecione "​Column 1" para a opção "​Source Interaction"​ e "​Column 2" para "​Target Interaction"​. Deixe "​Interaction Type" como "​Default Interaction"​ e clique em "​Ok"​. Os dados serão abertos e montados em uma grid.
 +  - Como o banco de dados do //STRING// considera as relações entre as proteínas como bi-direcionais,​ todos as informações de arestas são duplicadas, gerando redundância de dados. Isso não é necessário para essa análise. Para remover a duplicação,​ vá até o menu "​Edit"​ e selecione a opção "​Remove Duplicate Edges"​. Na janela que se abre, clique em "​leishmania_protein_links_detailed-experimental_900_or_database_900.txt"​ e seleciona a opção "​Ignore edge direction"​. Após isso, clique em "​Ok"​. Aguarde algum tempo (variável dependendo do poder de processamento da máquina) e, ao final, aparecerá a mensagem com o número de duplicações que foram eliminadas. Durante o processamento,​ não aparecerá nenhuma mensagem indicativa.
 +  - É necessário alterar o layout de visualização da rede, uma vez que o grid impossibilita a perceção da topologia da rede. Para isso, vá até o menu "​Layout",​ selecione a opção "​yFiles Layouts"​ e, depois, "​Organic"​. Aparecerá um indicativo de processamento e, ao final, o novo layout estará pronto.
 +
 +=== Inclusão dos dados de expressão gênica ===
 +
 +  - Iremos agora acrescentar os dados de expressão gênica à rede principal. Para isso, vá até o menu "​File",​ selecione a opção "​Import",​ em seguida, "​Table"​ e, por fim, "​File..."​. Provavelmente você já estará no diretório correto ("/​home/​ppi-leishmania"​). Caso não esteja, vá até ele e abra o arquivo "​LcSbR-0.06_vs_LcWTS-0-DE-pvalueadj_0.05-filtered.txt"​. Na janela que se abre, não é necessário alterar nenhum dado, simplesmente clique em "​Ok"​.
 +  - Nesse monento o //​Cytoscape//​ irá procurar por correspondências entre os nomes das proteínas do novo arquivo com as da rede original, acrescentando os dados presentes no novo arquivo à tabela da rede já existente. Dessa forma, as proteínas diferencialmente expressas poderão ser destacadas na rede principal e será possível efetuar uma série de processamentos com esses dados.
 +  - É interessante isolarmos a rede formada pelos nós que representam os genes diferencialmente expressos. Para isso, geraremos duas novas redes: uma somente com esses nós e outra com esses nós e seus primeiros vizinhos, para tentarmos contextualizar a vizinhança desses genes diferencialmente expressos. Para ambas devemos, inicialmente,​ selecionar na "Node table" todos os genes que foram diferencialmente expressos. Para simplificar esse processo, basta clicar na coluna "​GeneID"​ duas vezes, para que ela fique ordenada. Uma vez que somente os genes diferencialmente expresso possuem esse valor, eles serão separados dos outros e poderão ser facilmente selecionados. Clique em qualquer um dos valores selecionados com o botão direito do mouse e selecione a opçao "​Select nodes from selected rows". Dessa forma, na representação gráfica da rede, somente os nós correspondentes aos genes diferencialmente expressos serão marcados. A partir daí partimos para a construção de cada uma das novas redes:
 +    - **Somente nós diferencialmente expressos:​** vá até o menu "​File"​ -> "​New"​ -> "​Network"​ -> "From selected nodes, all edges" (ou utilize as teclas de atalho ''​Ctrl+N''​). Será gerada uma nova rede. Renomeie-a para "​somente DE" e, em seguida altere o seu layout de visualização para "​Organic",​ conforme explicado no item 5 do tópico "​Inclusão da rede principal"​ acima.
 +    - **Nós diferencialmente expressos e vizinhos:** volte à rede original, que está com os nós selecionados. Com ela aberta, vá até o menu "​Select"​ -> "​Nodes"​ -> "First neighbors of selected nodes" -> "​Undirected"​ (ou utilize as teclas de atalho ''​Ctrl+6''​). Com isso os nós adjacentes aos selecionados também serão selecionados. Após isso, gere uma nova rede baseada na seleção conforme a instrução acima e renomeie-a para "DE + vizinhos"​ e, em seguida altere o seu layout de visualização para "​Organic",​ conforme explicado no item 5 do tópico "​Inclusão da rede principal"​ acima.
 +
 +  ​
 +
 +=== Análise de ontologia ===
 +
 +  - Inicialmente é necessário selecionar o agrupamento para o qual será efetuada a busca no //Gene Ontology//. Nesse protocolo, utilizaremos o agrupamento que apresentou somente genes super-representados,​ associados a quinases. Selecione-os na própria rede.
 +  - Abra o //BiNGO//, a partir do menu //Apps//.
 +  - Na tela de configurações que aparecerá, inicialmente daremos um nome (livre) para o agrupamento,​ no campo //Cluster name://.
 +  - Uma vez que o //BiNGO// não inclui, na sua instalação padrão, os dados de anotação de //​Leishmania infatum//, eles devem incluídos manualmente. Para isso, na opção "​Select organism/​annotation:",​ selecione "​Custom..."​ e, na janela que se abre, procure pelo arquivo "​gene_association_linfantum.goa"​ e confirme sua seleção. O caminho completo para esse arquivo aparecerá abaixo de "​Select organism/​annotation:"​.
 +  -- Os outros parâmetros devem estar definidos conforme a imagem abaixo:
 +  ..{{:​protocolos:​bingo_settings.png?​nolink|}}
 +  - Será gerada uma nova rede, dessa vez com os dados do //Gene Ontology//.
  • bioinformatica/protocolo_leishmania.txt
  • Última modificação: 2016/05/13 16:04
  • por aracnus