BreSci XVI Brazilian e-Science Workshop

curva-2022

Programação

Integration of Sabio-RK to the Reactome Graph Database for Efficient Gathering of Cell Signaling Pathways
Ronaldo Nogueira de Sousa, Marcelo Batista de Lima Junior, Cristiano Campos, Vivian Constantino, Cássia Sanctos, Hugo Aguirre Armelin, Marcelo Da Silva Reis
HTP SurflexDock: a web tool for Structure-Based Virtual Screening analysis based on the Ensemble Docking protocol
João Luiz de Almeida Filho, Jorge H. Fernandez
Aprendizado Ativo Aplicado ao Diagnóstico de Lesões Dermatológicas
Lucas Batista, Fernando Cruz, Pedro Henrique Bugatti, Priscila Tiemi Maeda Saito

A comparação de sequências genéticas é uma operação fundamental da Bioinformática, sendo executada milhares de vezes, todos os dias, ao redor do mundo. O algoritmo Smith-Waterman (SW) é um dos algoritmos mais usados para tal propósito pois obtém o resultado ótimo. No entanto, os tempos de execução podem ser muito extensos para sequências longas, já que o algoritmo possui complexidade quadrática (O(n^2)), onde n é o tamanho das sequências. De maneira a obter resultados mais rápido, várias ferramentas que implementam estratégias paralelas foram propostas na literatura. Mesmo com esses avanços, a comparação de cromossomos completos, compostos de centenas de milhões de caracteres, com o algoritmo SW, ainda é uma tarefa muito desafiadora, que requer altíssimo poder de computação. Nessa palestra, apresentaremos primeiramente a nossa ferramenta paralela MASA-CUDAlign, que incorpora mecanismos sofisticados como execução em paralelogramo, execução ortogonal, poda de blocos, especulação e distribuição estática/dinâmica de trabalho. Vamos mostrar que, em 2016, a professora Alba Melo e seu aluno de doutorado Edans Sandes receberam o Prêmio Capes de Teses em Ciência da Computação pela ferramanta MASA-CUDAlign. Mostraremos também que, em 2021, a última versão da nossa ferramenta (MASA-CUDAlign-MultiBP) obteve o melhor desempenho da literatura mundial, em um supercomputador com 512 GPUs (placas gráficas). A seguir, vamos apresentar os desafios para se executar a ferramenta MASA-CUDAlign na nuvem AWS, usando instâncias GPU do tipo spot. Ao final, discutiremos trabalhos que estão sendo desenvolvidos e as questões em aberto.


Alba Melo

UnB

Alba Cristina Magalhães Alves de Melo concluiu sua Graduação em Processamento de Dados em 1986 na Universidade de Brasília (UnB), seu Mestrado em Ciência da Computação na UFRGS em 1991 e seu Doutorado em Informática no Institut National Polytechnique de Grenoble (INPG), França, in 1996. Em 2008, Alba Melo fez posdoc na University of Ottawa, Canadá. Em 2011, ela foi Cientista Convidada na Université Paris-Sud, França; em 2013 fez um Estágio Sênior na Universitat Politècnica de Catalunya, Espanha, e em 2018 foi Cientista Convidada no Institut National Polytechnique de Grenoble, França. Desde 1997, Alba Melo trabalha na Universidade de Brasília (UnB), onde é Professora Titular desde 2016. Atualmente, ela é Pesquisadora PQ 1C do CNPq, IEEE Senior Member e Conselheira da Sociedade Brasileira de Computação (SBC). Seus interesses de pesquisa incluem: computação de alto desempenho, computação em cloud e bioinformática. Alba Melo orientou 7 Teses de Doutorado e 23 Dissertações de Mestrado além de diversos trabalhos de Graduação e de Iniciação Científica, todos concluídos com sucesso. Uma das Teses orientadas pela Prof. Alba recebeu o Prêmio Capes de Tese em Ciência da Computação em 2016. Alba Melo possui uma atuação intensa nas comunidades internacional e nacional de computação de alto desempenho, tendo sido program chair/track chair das conferências internacionais (IEEE IPDPS e Supercomputing) e nacionais (SBAC-PAD) mais prestigiosas da área . A Prof. Alba é também Editora Associada dos periódicos IEEE Transactions on Computers, Journal of Parallel and Distributed Computing e Future Generation Computer Systems.

Satellite images and deep learning for the prediction of socioeconomic indicators in the Vale do Ribeira
Jeaneth Machicao, Iago da Costa, Enrico Triñanes, Pedro Luiz Pizzigatti Corrêa
Identification of the North Brazil Current through spatial motifs in fixed time slices
Ricardo Castro, Vinicius Monteiro, Rafaelli Coutinho, Heraldo Borges Filho, Eduardo Ogasawara
Detecção de Discurso de Ódio: Homofobia
Andrey Souza, Eduardo Nakamura, Fabíola Guerra Nakamura
Classificação Automática de Petições Iniciais Usando Classificadores Combinados
Matheus Serrão Marinato, Antonio Fernando Lavareda Jacob Junior, Fabio Lobato, Omar Cortes

Avaliação de abordagens semi-supervisionadas aplicadas a redes neurais convolucionais
Cristiano Bassani, Priscila Tiemi Maeda Saito, Pedro Henrique Bugatti
Análise e Classificação Automática de Nódulos em Raízes de Cultivares de Soja
Eber Pacanhela, Artur Rondina, Marco Nogueira, Mariangela Hungria, Priscila Tiemi Maeda Saito, Fabrício Lopes
Avaliação de Sistemas de Reconhecimento de Fala Robustos a Ruídos Provenientes de Maquinário da Indústria do Petróleo
Vinícius Nunes, Julio Duarte

A construção e disponibilização de modelos de aprendizado de máquina (ML) e de aprendizado profundo (DL) têm modificado significativamente a atividade científica. A partir do processamento dos dados capturados por diversos instrumentos, modelos baseados em aprendizagem auxiliam cientistas em predições sobre o comportamento de fenômenos, no diagnóstico de doenças e mesmo na disponibilização de informações para a população, como em modelos de classificação de plantas. Com o crescente número de aplicações para as técnica de ML e DL, surge a necessidade de sistemas que apóiem o ciclo de vida de modelos e dados. Neste sentido, MLSystem é uma classe de sistemas que apareceram recentemente com o objetivo de apoiar a construção e disponibilização de modelos baseados em aprendizagem. As funções cobertas por sistemas do tipo MLSystem variam um tanto, mas podemos considerar em geral uma ou mais funcionalidades, além da atividade de base de construção de modelos, incluindo: pre-processamento de dados, Automação paramétrica, Seleção de Modelos, Combinação de modelos automática etc. Além de apresentar de uma maneira abrangente essa classe de sistemas, nesta palestra apresentaremos também o sistema Gypscie que vem sendo desenvolvido no DEXL/LNCC, assim como um de seus aspectos mais salientes associado à composição de modelos espaço-temporais.


Fabio Porto

LNCC

Pesquisador do Laboratório Nacional de Computação Científica desde 2009, onde fundou o Data Extreme Lab (DEXL). Foi Prof. Visitante na Universidade Nacional de Singapura, Departamento de Ciência da Computação, entre Março e Julho de 2020. Tem formação em Matemática, Modalidade Informática, pela Universidade Estadual do Rio de Janeiro, em 1987, e Mestrado e Doutorado em Informática pela PUC-Rio, em 1996 e 2001, respectivamente. Foi Posdoc na Ecole Polytechnique Federal de Lausanne, na Suiça, entre 2004 e 2008. Tem como interesse de pesquisa a Gerência e Análise de Grandes Volumes de dados (Big Data), Gerência de Modelos de Aprendizagem e Aprendizado Profundo. É membro da ACM e SBC. Participa do comitê de programa das conferências: VLDB 2021, SIGMOD2021 e SBBD 2022. Foi Coordenador Geral do Simpósio Brasileiro de Banco de Dados em 2015 e Coordenador Geral da 44ª International Conference on Very Large Data Bases, em 2018. O pesquisador é membro do Comitê Diretivo da Comissão Especial de Banco de Dados (CEBD), foi coordenador de programa de artigos curtos e longos do SBBD, e coordenador geral da CEBD no período entre 2020-2021.

A Multi-Agent Architecture for Distributed Data Mining System
Omar Cortes, Gustavo Oliveira, Josenildo da Silva, Luciano Coutinho
Open Science-Based Framework for Controlled Experiments in Software Engineering
André F. R. Cordeiro, Edson Oliveira Jr., Luiz Fernando Capretz
Towards a graphical tool for modeling scientific workflows' provenance according to the W3C PROV standard
Marcos Alves Vieira, Sergio Carvalho
An Ontology for Supporting Digital Forensics Controlled Experiments: Early Stages of Development
Thiago Silva, Edson Oliveira Jr.

Sobre o evento

O XVI Brazilian e-Science Workshop (BreSci) 2022 tem como objetivo colaborar com os esforços de e-Ciência propondo um fórum amplo de discussão sobre os temas envolvidos no desenvolvimento de infraestrutura de software em apoio às ciências como uma nova plataforma de pesquisa e experimentação científica.

Chamada de Trabalhos

Nas últimas décadas, observamos uma revolução no desenvolvimento das ciências provocada pelo apoio de métodos computacionais. Os métodos computacionais têm se estabelecido como um terceiro pilar da ciência, ao lado da teoria e da experimentação. A ciência de apoio computacional à experimentação científica é chamada de e-Ciência (do inglês e-Science).

Nesse novo modo de fazer ciência, pesquisadores exploram grandes coleções de dados, além de utilizar, por meio de uma rede de alto desempenho, recursos computacionais em larga escala, que podem estar geograficamente distribuídos. Estas novas demandas impõem grandes desafios a serem enfrentados, relacionados à modelagem e ao gerenciamento de dados científicos, software e de todo o conhecimento envolvido.

Recentes avanços em pesquisa em Computação – incluindo apoio à modelagem de workflows em diferentes níveis de abstração, ontologias, inteligência artificial e aprendizado de máquina, serviços web semânticos, processamento de alto desempenho, computação em nuvem, grades computacionais, modelagem de recursos, gerência de componentes de software, banco de dados distribuídos e paralelos, proveniência de dados e processos, curadoria de dados, entre outros – podem ajudar na solução dos desafios de e-Science.

O XVI Brazilian e-Science Workshop (BreSci) tem como objetivo colaborar com os esforços de e-Ciência propondo um fórum amplo de discussão sobre os temas envolvidos no desenvolvimento de infraestrutura de software em apoio às ciências como uma nova plataforma de pesquisa e experimentação científica.

Em 2022, além das contribuições de áreas tradicionais ligadas à e-Ciência, o workshop visa apoiar as iniciativas em Ciência de Dados que possam ser transferidas para a melhoria das Ciências. Dessa forma, o BreSci convida também pesquisadores e profissionais a enviarem suas contribuições relacionadas a projetos envolvendo a Ciência de Dados, como uma das modernas vertentes de processamento, manipulação e análise de informação em larga escala.

Tópicos de interesse

Os tópicos de interesse do XVI BreSci incluem, mas não estão limitados, aos listados a seguir.

 

Trilha Principal:

 

  • Ambientes de experimentação
  • Aprendizado de máquina e Redes Neurais/Deep Learning
  • Arquiteturas orientadas a serviços
  • Ciência de Redes
  • Computação em grade, nuvem, névoa e borda
  • Data analytics em Dados Científicos e/ou Abertos
  • Ecossistemas de software
  • Explainable AI (IA explicável)
  • Extração de conhecimento a partir de fontes heterogêneas de dados
  • Gerência de acesso a dados científicos e abertos
  • Gerência de dados em larga escala
  • Gerência de workflows
  • Gestão de conhecimento em larga escala
  • IoT – Internet das Coisas
  • Infraestrutura para aplicações
  • Modelos de dados para dados científicos e/ou abertos
  • Modelos e técnicas para ciência colaborativa
  • Ontologias e bancos de dados para dados científicos e/ou abertos
  • Organizações virtuais
  • Processos de experimentação em larga escala
  • Proveniência de dados e processos
  • Sistemas autonômicos e auto-organizados
  • Técnicas de paralelismo baseado em dados
  • Tecnologias habilitadoras
  • Teorias e modelos
  • Tolerância a falhas, confiabilidade e disponibilidade
  • Visualização de dados
  • Web semântica

Trilha de Aplicações:

  • Agricultura
  • Astronomia
  • Biodiversidade
  • Bioinformática
  • Ciência da saúde e forense
  • Ciência da Vida
  • Clima, ciência ambiental e da terra
  • Física
  • Humanidades e Ciências sociais
  • Química

Instruções para submissão

O XVI BreSci aceita submissões de artigos longos ou curtos, com limites máximos de 8 e 4 páginas, respectivamente. Os artigos devem ser escritos em Português ou Inglês, e devem ser escritos obedecendo ao modelo sugerido pela SBC (Sociedade Brasileira de Computação). Os trabalhos submetidos devem ser inéditos e incluir resultados ainda não publicados.

Todos os artigos (longos e curtos) serão revisados por pares de acordo com os seguintes critérios: adequação ao escopo do workshop, relevância, qualidade técnica, clareza, originalidade e resultados. Os autores devem identificar o(s) tópico(s) sendo abordado(s) no artigo para auxiliar o comitê do programa no processo de revisão. A presença de resultados, embora fortemente recomendada, não é um requisito para a submissão do trabalho.

Cada manuscrito deve ser submetido eletronicamente, em arquivo PDF, via site de submissão JEMS (https://jems.sbc.org.br/home.cgi?c=4008).

Datas Importantes

  • Limite para submissão dos trabalhos: 15/03 31/03 07/04 (final)
  • Divulgação dos resultados: 06/05 10/05
  • Envio das versões finais dos artigos: 20/05
  • Prazo de Inscrição dos autores: 20/05

Inscrição de autores

Para que um artigo aceito seja apresentado e incluído nos anais do evento, é necessário que ao menos um dos autores do artigo realize a sua inscrição no evento na categoria profissional. Cada inscrição na categoria profissional dá direito à publicação de um único artigo, considerando qualquer um dos eventos-base ou eventos-satélite do CSBC. Autores com mais de um artigo aprovado em qualquer evento do CSBC deverão pagar uma “taxa de publicação” por artigo adicional. O valor dessa taxa pode ser visto na página de inscrições do CSBC 2022.

Publicação de trabalhos

Os artigos aceitos serão publicados na SBC Open Lib, a biblioteca digital da SBC, na série Anais do Brazilian e-Science Workshop (BreSci), ISSN 2763-8774, disponível em https://sol.sbc.org.br/index.php/bresci. Todos os artigos serão indexados com DOI.

Edição Especial JIDM

Serão selecionados os melhores artigos longos entre os apresentados e publicados nos anais do BreSci 2022. A seleção será realizada com base na qualidade dos trabalhos e na qualidade das apresentações realizadas durante o evento. Versões estendidas dos trabalhos selecionados serão convidados para submissão no Journal of Information and Data Management (JIDM), ISSN 2178-7107,  https://sol.sbc.org.br/journals/index.php/jidm.

Os autores desses trabalhos selecionados serão convidados a preparar e submeter suas versões ampliadas para revisão com pelo menos 30% de conteúdo inédito. As versões estendidas dos trabalhos selecionados serão convidados para a submissão de uma seção especial do JIDM dedicada ao BreSci 2022. Esses trabalhos deverão ser submetidos em inglês, respeitando o formato e regras de revisão definidos pela revista.

Premiações

Será dado um certificado para o melhor trabalho (artigo longo) e uma Menção Honrosa (artigo curto).

Organização

O comitê de programa é formado por professores e/ou pesquisadores de diversas instituições de ensino e com atuação na área de e-Ciência.

Organizadores Gerais:

  • Daniel de Oliveira (UFF)
  • Alexandre Rossi Paschoal (UTFPR)

Coordenação do comitê de programa:

  • Daniel de Oliveira (UFF)
  • Alexandre Rossi Paschoal (UTFPR)

Apoio local:

  • Daniel de Oliveira (IC/UFF)
  • Maria Luiza Falci (IC/UFF)

Comitê Diretivo

  • Daniel Cardoso Moraes de Oliveira (UFF): co-chair 2022 
  • Alexandre Rossi Paschoal (UTFPR): co-chair 2022
  • Fabrício Martins Lopes (UTFPR): co-chair 2021
  • Victor Ströele de Andrade Menezes (UFJF): co-chair 2021 
  • Marcio Katsumi Oikawa (UFABC): co-chair 2020
  • Eduardo Soares Ogasawara (CEFET/RJ): co-chair 2019

Comitê de Programa 

  • Alex Vieira (UFJF)
  • Alexandre Paschoal (UTFPR) – co-chair 2022
  • Ana Carolina Guimaraes (FIOCRUZ)
  • Anderson Soares (UFG)
  • André Fujita (USP)
  • André Kashiwabara (UTFPR)
  • André Ponce de Leon F. de Carvalho  (ICMC/USP)
  • Bruno Schulze (LNCC)
  • Carla Osthoff (LNCC)
  • Claudia Bauzer Medeiros (UNICAMP) 
  • Cristina Boeres (UFF)
  • Daniel Cordeiro (USP)
  • Daniel de Oliveira (UFF) – co-chair 2022
  • Danilo Sanches (UTFPR)
  • Diego Brandão (CEFET/RJ)
  • Diogo Tschoeke (UFRJ)
  • Douglas Macedo (UFSC)
  • Eduardo Bezerra (CEFET/RJ)
  • Eduardo Dalcin (Inst. Pesq. Jardim Botânico do RJ) 
  • Eduardo Ogasawara (CEFET/RJ)
  • Fabio Porto (LNCC)
  • Fabrício Martins Lopes (UTFPR)
  • Fernanda Campos (UFJF)
  • Gilberto Pastorello (Lawrence Berkeley National Laboratory).
  • Helio Pedrini (UNICAMP)
  • Jairo Souza (UFJF)
  • Joao Setubal (USP)
  • José Antonio Macêdo (UFC)
  • José Maria David (UFJF)
  • Kary Ocaña (LNCC)
  • Kele Belloze (CEFET/RJ)
  • Kelly Braghetto (USP)
  • Leonardo Azevedo (IBM Research Brazil)
  • Liliane Santana Oliveira Kashiwabara (UTFPR)
  • Luciano Digiampietri (USP)
  • Luiz Manoel Rocha Gadelha Júnior (LNCC)
  • Marcelo Reis (Instituto Butantã)
  • Marcio Dorn (UFRGS)
  • Marcio Oikawa (UFABC)
  • Mario Dantas (UFJF)
  • Maristela Holanda (UnB)
  • Marta Mattoso (COPPE/UFRJ)
  • Patricia Plentz (UFSC)
  • Pedro Henrique Bugatti (UTFPR)
  • Priscila Tiemi Maeda Saito (UTFPR)
  • Rafaelli Coutinho (CEFET/RJ)
  • Raquel Minardi (UFMG)
  • Regina Braga (UFJF)
  • Renato Tinos (USP)
  • Ronaldo Goldschmidt (IME)
  • Saulo Villela (UFJF)
  • Sergio Manuel Serra da Cruz (UFRRJ)
  • Sylvio Barbon Junior (UEL)
  • Thiago Emmanuel Pereira (UFCG)
  • Victor Ströele (UFJF)
  • Vinod Rebello (UFF)

Contato

Em caso de dúvidas, favor enviar e-mail copiando os organizadores danielcmo@ic.uff.br e ​​paschoal@utfpr.edu.br.