Integration of Sabio-RK to the Reactome Graph Database for Efficient Gathering of Cell Signaling Pathways Ronaldo Nogueira de Sousa, Marcelo Batista de Lima Junior, Cristiano Campos, Vivian Constantino, Cássia Sanctos, Hugo Aguirre Armelin, Marcelo Da Silva Reis |
HTP SurflexDock: a web tool for Structure-Based Virtual Screening analysis based on the Ensemble Docking protocol João Luiz de Almeida Filho, Jorge H. Fernandez |
Aprendizado Ativo Aplicado ao Diagnóstico de Lesões Dermatológicas Lucas Batista, Fernando Cruz, Pedro Henrique Bugatti, Priscila Tiemi Maeda Saito |
A comparação de sequências genéticas é uma operação fundamental da Bioinformática, sendo executada milhares de vezes, todos os dias, ao redor do mundo. O algoritmo Smith-Waterman (SW) é um dos algoritmos mais usados para tal propósito pois obtém o resultado ótimo. No entanto, os tempos de execução podem ser muito extensos para sequências longas, já que o algoritmo possui complexidade quadrática (O(n^2)), onde n é o tamanho das sequências. De maneira a obter resultados mais rápido, várias ferramentas que implementam estratégias paralelas foram propostas na literatura. Mesmo com esses avanços, a comparação de cromossomos completos, compostos de centenas de milhões de caracteres, com o algoritmo SW, ainda é uma tarefa muito desafiadora, que requer altíssimo poder de computação. Nessa palestra, apresentaremos primeiramente a nossa ferramenta paralela MASA-CUDAlign, que incorpora mecanismos sofisticados como execução em paralelogramo, execução ortogonal, poda de blocos, especulação e distribuição estática/dinâmica de trabalho. Vamos mostrar que, em 2016, a professora Alba Melo e seu aluno de doutorado Edans Sandes receberam o Prêmio Capes de Teses em Ciência da Computação pela ferramanta MASA-CUDAlign. Mostraremos também que, em 2021, a última versão da nossa ferramenta (MASA-CUDAlign-MultiBP) obteve o melhor desempenho da literatura mundial, em um supercomputador com 512 GPUs (placas gráficas). A seguir, vamos apresentar os desafios para se executar a ferramenta MASA-CUDAlign na nuvem AWS, usando instâncias GPU do tipo spot. Ao final, discutiremos trabalhos que estão sendo desenvolvidos e as questões em aberto.
Alba Cristina Magalhães Alves de Melo concluiu sua Graduação em Processamento de Dados em 1986 na Universidade de Brasília (UnB), seu Mestrado em Ciência da Computação na UFRGS em 1991 e seu Doutorado em Informática no Institut National Polytechnique de Grenoble (INPG), França, in 1996. Em 2008, Alba Melo fez posdoc na University of Ottawa, Canadá. Em 2011, ela foi Cientista Convidada na Université Paris-Sud, França; em 2013 fez um Estágio Sênior na Universitat Politècnica de Catalunya, Espanha, e em 2018 foi Cientista Convidada no Institut National Polytechnique de Grenoble, França. Desde 1997, Alba Melo trabalha na Universidade de Brasília (UnB), onde é Professora Titular desde 2016. Atualmente, ela é Pesquisadora PQ 1C do CNPq, IEEE Senior Member e Conselheira da Sociedade Brasileira de Computação (SBC). Seus interesses de pesquisa incluem: computação de alto desempenho, computação em cloud e bioinformática. Alba Melo orientou 7 Teses de Doutorado e 23 Dissertações de Mestrado além de diversos trabalhos de Graduação e de Iniciação Científica, todos concluídos com sucesso. Uma das Teses orientadas pela Prof. Alba recebeu o Prêmio Capes de Tese em Ciência da Computação em 2016. Alba Melo possui uma atuação intensa nas comunidades internacional e nacional de computação de alto desempenho, tendo sido program chair/track chair das conferências internacionais (IEEE IPDPS e Supercomputing) e nacionais (SBAC-PAD) mais prestigiosas da área . A Prof. Alba é também Editora Associada dos periódicos IEEE Transactions on Computers, Journal of Parallel and Distributed Computing e Future Generation Computer Systems.
Satellite images and deep learning for the prediction of socioeconomic indicators in the Vale do Ribeira Jeaneth Machicao, Iago da Costa, Enrico Triñanes, Pedro Luiz Pizzigatti Corrêa |
Identification of the North Brazil Current through spatial motifs in fixed time slices Ricardo Castro, Vinicius Monteiro, Rafaelli Coutinho, Heraldo Borges Filho, Eduardo Ogasawara |
Detecção de Discurso de Ódio: Homofobia Andrey Souza, Eduardo Nakamura, Fabíola Guerra Nakamura |
Classificação Automática de Petições Iniciais Usando Classificadores Combinados Matheus Serrão Marinato, Antonio Fernando Lavareda Jacob Junior, Fabio Lobato, Omar Cortes |
Avaliação de abordagens semi-supervisionadas aplicadas a redes neurais convolucionais Cristiano Bassani, Priscila Tiemi Maeda Saito, Pedro Henrique Bugatti |
Análise e Classificação Automática de Nódulos em Raízes de Cultivares de Soja Eber Pacanhela, Artur Rondina, Marco Nogueira, Mariangela Hungria, Priscila Tiemi Maeda Saito, Fabrício Lopes |
Avaliação de Sistemas de Reconhecimento de Fala Robustos a Ruídos Provenientes de Maquinário da Indústria do Petróleo Vinícius Nunes, Julio Duarte |
A construção e disponibilização de modelos de aprendizado de máquina (ML) e de aprendizado profundo (DL) têm modificado significativamente a atividade científica. A partir do processamento dos dados capturados por diversos instrumentos, modelos baseados em aprendizagem auxiliam cientistas em predições sobre o comportamento de fenômenos, no diagnóstico de doenças e mesmo na disponibilização de informações para a população, como em modelos de classificação de plantas. Com o crescente número de aplicações para as técnica de ML e DL, surge a necessidade de sistemas que apóiem o ciclo de vida de modelos e dados. Neste sentido, MLSystem é uma classe de sistemas que apareceram recentemente com o objetivo de apoiar a construção e disponibilização de modelos baseados em aprendizagem. As funções cobertas por sistemas do tipo MLSystem variam um tanto, mas podemos considerar em geral uma ou mais funcionalidades, além da atividade de base de construção de modelos, incluindo: pre-processamento de dados, Automação paramétrica, Seleção de Modelos, Combinação de modelos automática etc. Além de apresentar de uma maneira abrangente essa classe de sistemas, nesta palestra apresentaremos também o sistema Gypscie que vem sendo desenvolvido no DEXL/LNCC, assim como um de seus aspectos mais salientes associado à composição de modelos espaço-temporais.
Pesquisador do Laboratório Nacional de Computação Científica desde 2009, onde fundou o Data Extreme Lab (DEXL). Foi Prof. Visitante na Universidade Nacional de Singapura, Departamento de Ciência da Computação, entre Março e Julho de 2020. Tem formação em Matemática, Modalidade Informática, pela Universidade Estadual do Rio de Janeiro, em 1987, e Mestrado e Doutorado em Informática pela PUC-Rio, em 1996 e 2001, respectivamente. Foi Posdoc na Ecole Polytechnique Federal de Lausanne, na Suiça, entre 2004 e 2008. Tem como interesse de pesquisa a Gerência e Análise de Grandes Volumes de dados (Big Data), Gerência de Modelos de Aprendizagem e Aprendizado Profundo. É membro da ACM e SBC. Participa do comitê de programa das conferências: VLDB 2021, SIGMOD2021 e SBBD 2022. Foi Coordenador Geral do Simpósio Brasileiro de Banco de Dados em 2015 e Coordenador Geral da 44ª International Conference on Very Large Data Bases, em 2018. O pesquisador é membro do Comitê Diretivo da Comissão Especial de Banco de Dados (CEBD), foi coordenador de programa de artigos curtos e longos do SBBD, e coordenador geral da CEBD no período entre 2020-2021.
A Multi-Agent Architecture for Distributed Data Mining System Omar Cortes, Gustavo Oliveira, Josenildo da Silva, Luciano Coutinho |
Open Science-Based Framework for Controlled Experiments in Software Engineering André F. R. Cordeiro, Edson Oliveira Jr., Luiz Fernando Capretz |
Towards a graphical tool for modeling scientific workflows’ provenance according to the W3C PROV standard Marcos Alves Vieira, Sergio Carvalho |
An Ontology for Supporting Digital Forensics Controlled Experiments: Early Stages of Development Thiago Silva, Edson Oliveira Jr. |
O XVI Brazilian e-Science Workshop (BreSci) 2022 tem como objetivo colaborar com os esforços de e-Ciência propondo um fórum amplo de discussão sobre os temas envolvidos no desenvolvimento de infraestrutura de software em apoio às ciências como uma nova plataforma de pesquisa e experimentação científica.
Nas últimas décadas, observamos uma revolução no desenvolvimento das ciências provocada pelo apoio de métodos computacionais. Os métodos computacionais têm se estabelecido como um terceiro pilar da ciência, ao lado da teoria e da experimentação. A ciência de apoio computacional à experimentação científica é chamada de e-Ciência (do inglês e-Science).
Nesse novo modo de fazer ciência, pesquisadores exploram grandes coleções de dados, além de utilizar, por meio de uma rede de alto desempenho, recursos computacionais em larga escala, que podem estar geograficamente distribuídos. Estas novas demandas impõem grandes desafios a serem enfrentados, relacionados à modelagem e ao gerenciamento de dados científicos, software e de todo o conhecimento envolvido.
Recentes avanços em pesquisa em Computação – incluindo apoio à modelagem de workflows em diferentes níveis de abstração, ontologias, inteligência artificial e aprendizado de máquina, serviços web semânticos, processamento de alto desempenho, computação em nuvem, grades computacionais, modelagem de recursos, gerência de componentes de software, banco de dados distribuídos e paralelos, proveniência de dados e processos, curadoria de dados, entre outros – podem ajudar na solução dos desafios de e-Science.
O XVI Brazilian e-Science Workshop (BreSci) tem como objetivo colaborar com os esforços de e-Ciência propondo um fórum amplo de discussão sobre os temas envolvidos no desenvolvimento de infraestrutura de software em apoio às ciências como uma nova plataforma de pesquisa e experimentação científica.
Em 2022, além das contribuições de áreas tradicionais ligadas à e-Ciência, o workshop visa apoiar as iniciativas em Ciência de Dados que possam ser transferidas para a melhoria das Ciências. Dessa forma, o BreSci convida também pesquisadores e profissionais a enviarem suas contribuições relacionadas a projetos envolvendo a Ciência de Dados, como uma das modernas vertentes de processamento, manipulação e análise de informação em larga escala.
Os tópicos de interesse do XVI BreSci incluem, mas não estão limitados, aos listados a seguir.
Trilha Principal:
O XVI BreSci aceita submissões de artigos longos ou curtos, com limites máximos de 8 e 4 páginas, respectivamente. Os artigos devem ser escritos em Português ou Inglês, e devem ser escritos obedecendo ao modelo sugerido pela SBC (Sociedade Brasileira de Computação). Os trabalhos submetidos devem ser inéditos e incluir resultados ainda não publicados.
Todos os artigos (longos e curtos) serão revisados por pares de acordo com os seguintes critérios: adequação ao escopo do workshop, relevância, qualidade técnica, clareza, originalidade e resultados. Os autores devem identificar o(s) tópico(s) sendo abordado(s) no artigo para auxiliar o comitê do programa no processo de revisão. A presença de resultados, embora fortemente recomendada, não é um requisito para a submissão do trabalho.
Cada manuscrito deve ser submetido eletronicamente, em arquivo PDF, via site de submissão JEMS (https://jems.sbc.org.br/home.cgi?c=4008).
Para que um artigo aceito seja apresentado e incluído nos anais do evento, é necessário que ao menos um dos autores do artigo realize a sua inscrição no evento na categoria profissional. Cada inscrição na categoria profissional dá direito à publicação de um único artigo, considerando qualquer um dos eventos-base ou eventos-satélite do CSBC. Autores com mais de um artigo aprovado em qualquer evento do CSBC deverão pagar uma “taxa de publicação” por artigo adicional. O valor dessa taxa pode ser visto na página de inscrições do CSBC 2022.
Os artigos aceitos serão publicados na SBC Open Lib, a biblioteca digital da SBC, na série Anais do Brazilian e-Science Workshop (BreSci), ISSN 2763-8774, disponível em https://sol.sbc.org.br/index.php/bresci. Todos os artigos serão indexados com DOI.
Serão selecionados os melhores artigos longos entre os apresentados e publicados nos anais do BreSci 2022. A seleção será realizada com base na qualidade dos trabalhos e na qualidade das apresentações realizadas durante o evento. Versões estendidas dos trabalhos selecionados serão convidados para submissão no Journal of Information and Data Management (JIDM), ISSN 2178-7107, https://sol.sbc.org.br/journals/index.php/jidm.
Os autores desses trabalhos selecionados serão convidados a preparar e submeter suas versões ampliadas para revisão com pelo menos 30% de conteúdo inédito. As versões estendidas dos trabalhos selecionados serão convidados para a submissão de uma seção especial do JIDM dedicada ao BreSci 2022. Esses trabalhos deverão ser submetidos em inglês, respeitando o formato e regras de revisão definidos pela revista.
Será dado um certificado para o melhor trabalho (artigo longo) e uma Menção Honrosa (artigo curto).
O comitê de programa é formado por professores e/ou pesquisadores de diversas instituições de ensino e com atuação na área de e-Ciência.
Organizadores Gerais:
Coordenação do comitê de programa:
Apoio local:
Comitê Diretivo
Comitê de Programa
Em caso de dúvidas, favor enviar e-mail copiando os organizadores danielcmo@ic.uff.br e paschoal@utfpr.edu.br.