PROJETOS

MettleRNASeq (R)

Resumo: Pacote em R para análise de dados de RNA-Seq complexos e exploração de relações gênicas com técnicas de aprendizado de máquina. O MettleRNASeq foi pensado para cenários em que a análise tradicional de expressão diferencial (DGE) perde poder estatístico por exemplo, poucos replicados ou alta variabilidade. Ele combina um esquema de classificação sob medida, mineração de regras de associação e análises de correlação complementares para identificar genes-chave que distinguem condições experimentais e enfatizar relações entre genes.

Repositório no GitHub

HighSPA — High-Performance Selection Pressure Analysis

Resumo: Framework escalável para análises de pressão seletiva, construído sobre o Parsl para orquestrar workflows em ambientes HPC heterogêneos. O HighSPA executa em paralelo análises de múltiplos datasets em uma única rodada, distribuindo tarefas por vários nós. Ele automatiza etapas como alinhamento de sequências, conversão de formatos, inferência filogenética e teste de modelos evolutivos. Oferece dois workflows: ParslCodeML (PAML/CodeML) e ParslHyPhy (HYPHY). Na implementação atual, as tarefas mesmo as que suportam multithreading rodam em modo single-thread, e o paralelismo vem do agendamento baseado em tarefas do Parsl para escalar eficientemente entre nós.

  • Base tecnológica: Parsl (parallel scripting)
  • Workflows: ParslCodeML (PAML/CodeML) e ParslHyPhy (HYPHY)
  • Pipeline: alinhamento → conversão de formato → filogenia → testes de modelos
  • Paralelismo: tarefas single-thread; paralelismo por tasks distribuídas em múltiplos nós
  • Entrada/Saída: pasta com arquivos multi-FASTA; execução por arquivo, preservando a hierarquia

Repositório no GitHub

RNA-seq Scientific Workflow

Resumo: Workflow científico para RNA-Seq utilizando a biblioteca de parallel scripting Parsl. Focado em execuções escaláveis em ambientes distribuídos de alto desempenho e em análises de expressão gênica diferencial (DGE), com ênfase em otimização de desempenho.

  • Base tecnológica: Parsl (Parallel Scripting Library)
  • Referência: Cruz, L.; Coelho, M.; Terra, R.; Carvalho, D.; Gadelha, L.; Osthoff, C.; Ocaña, K. (2021). Workflows Científicos de RNA-Seq em Ambientes Distribuídos de Alto Desempenho: Otimização de Desempenho e Análises de Dados de Expressão Diferencial de Genes. Anais do XV Brazilian e-Science Workshop, p. 57–64. DOI: 10.5753/bresci.2021.15789

Repositório no GitHub

HP2NET — High-Performance Phylogenetic Network

Resumo: Framework para construção de redes filogenéticas em ambientes de Alto Desempenho (HPC). Motivado por cenários de evolução reticulada (eventos não-árvore), o HP2NET coordena um fluxo de processamento que integra múltiplos programas, pacotes e pipelines para reconstruir redes filogenéticas enraizadas explícitas. São explorados dois métodos de referência PhyloNetworks e PhyloNet , cujos algoritmos são custosos e demorados, exigindo orquestração eficiente de workflows para reduzir makespan e ociosidade de recursos.

  • Domínio: Filogenia, evolução reticulada, redes filogenéticas
  • Métodos/Softwares: PhyloNetworks, PhyloNet
  • Ambiente: HPC com execução coordenada de workflows
  • Objetivo: Integrar ferramentas e scripts, paralelizar por datasets e otimizar o uso de recursos em nós múltiplos

Repositório no GitHub

  • OS PROJETOS EM ANDAMENTO PODEM SER VISUALIZADOS AQUI