Abstract is missing.
- Apresentação e OrganizaçãoCarlos Eduardo Santos Pires, Elaine Parros Machado de Sousa. [doi]
- Aprendizado Federado Incremental e Sensível ao Risco para Modelos de Ranqueamento em Cenários com Distribuições Heterogêneas de DadosGestefane Rabbi, Celso França, Daniel Xavier de Sousa, Thierson Couto Rosa, Jussara M. Almeida, Marcos André Gonçalves. 1-14 [doi]
- Explorando uma Nova Métrica para Calcular a Precisão Acurada de Resultados de Blocagem em Tarefas de Resolução de EntidadesDimas Cassimiro Nascimento, Vítor Alan Bezerra Silva. 15-27 [doi]
- Enhancing ML Explainability with Multi-Agent LLMs: A Context-Aware XAI ApproachRenato Okabayashi Miyaji, Pedro L. P. Corrêa. 28-41 [doi]
- Uma Arquitetura para Big Data Geoespacial de Dispositivos IoT com Níveis Heterogêneos de MobilidadeDennis Sávio Silva, Maristela Holanda. 42-55 [doi]
- Dataflow Analysis of Serverless Scientific Applications using Provenance DataMarcello W. M. Ribeiro, Ubiratam de Paula Junior, Liliane N. O. Kunstmann, Yuri Frota, Isabel Rosseti, Daniel de Oliveira 0001. 56-69 [doi]
- Uso de Shadow Pipelines para Garantir a Adequação de Pipelines ETL à LGPDRaíza Albuquerque, Marcos Bedo, José Maria Monteiro, Lenora Schwaitzer, Daniel de Oliveira 0001. 70-83 [doi]
- Detecting Anomalous Vessel Trajectories: A Collaborative Clustering-Based ApproachCláudio Vasconcelos Ribeiro, Marcos Bedo, Ronaldo dos Santos Mello, Aline Paes, Daniel de Oliveira 0001. 84-97 [doi]
- Exploiting Surrogate Submodular and Cost-Effective Lazy Forward Algorithms for Calibrated RecommendationsDiego Corrêa da Silva, Joel Machado Pires, Frederico Araújo Durão. 98-111 [doi]
- Analysis of online and offline classification algorithms for human activity recognition using IMU sensorsBrena Rodrigues Machado, Regis Pires Magalhães, Lívia Almada Cruz, Críston Pereira de Souza, César Lincoln Cavalcante Mattos, José Antônio Fernandes de Macêdo. 112-125 [doi]
- Heuristic-Guided Text-to-SQL Translation with LLMs: Optimizing Natural Language Interfaces for Relational DatabasesLaura Petrola, Angelo Brayner, Wellington Franco. 126-139 [doi]
- Leis de Escala para Text-to-SQL: Um Estudo sobre a Relação entre Tamanho e Desempenho de Modelos de LinguagemLetícia O. Silva, Paulo H. C. Silva, Fabrício A. Silva. 140-153 [doi]
- Desigualdades Educacionais no Brasil: Uma Análise por Clusterização de Indicadores Educacionais e de Desempenho EscolarMatheus L. de Melo Silva, Lívia Almada Cruz, Regis Pires Magalhães, Tatieures Gomes Pires, José Antônio Fernandes de Macêdo, Rossana Maria de Castro Andrade. 154-167 [doi]
- Mineração de Dados para Caracterizar Indivíduos Hipertensos com Doenças Cardiovasculares no BrasilGustavo Costa, Luis Enrique Zárate Gálvez. 168-181 [doi]
- Governança de Dados em Sistemas-de-Sistemas: Uma Abordagem Orientada à Dados de ProveniênciaJéssica Monçôres de Almeida, Vanessa Braganholo, Daniel de Oliveira 0001. 182-195 [doi]
- Leveraging Large Language Models for Time Series Prediction on Low-Frequency DataRodrigo Parracho, Fernando Alexandrino, Matheus de Souza Figueiredo, Lucas Pereira da Silva, Bruno Dutra de Macedo, Arthur Lamblet Vaz, Davi Louback, Victor Coculilo Desouzart, Rebecca Salles, Fábio Porto 0001, Diego Carvalho 0001, Eduardo S. Ogasawara. 196-208 [doi]
- Fine-Tuning Detection Criteria for Enhancing Anomaly Detection in Time SeriesEdson Pinto Sobrinho, Jéssica Souza, Janio Lima, Lucas Giusti Tavares, Eduardo Bezerra 0002, Rafaelli Coutinho, Laís Baroni, Esther Pacitti, Fábio Porto 0001, Kele T. Belloze, Eduardo S. Ogasawara. 209-221 [doi]
- Redução da Subjetividade na Identificação da Variação do Nível de Valores de Ativos FinanceirosJosé J. R. Cordeiro, Arlino H. M. de Araújo, Victor Gabriel C. Rodrigues, Guilherme A. Avelino. 222-235 [doi]
- Efficient Reuse of Metric Indexes for Multi-resolution QueriesRodrigo César Arboleda, Agma Juci Machado Traina, Caetano Traina Jr.. 236-249 [doi]
- Aprimorando Geração Aumentada por Recuperação via Ajuste Fino Sequencial de Modelos de Linguagem PequenosRonaldinho Vega Centeno Olivera, Frances Albert Santos, Júlio Cesar dos Reis, Allan Mariano de Souza. 250-263 [doi]
- Muitas Classes Desbalanceadas? Não Classifique - Ranqueie! Uma Abordagem Baseada em Retrieval-Augmented Generation (RAG)-labels para Classificação Textual Multi-classeCelso França, Ian Nunes, Thiago Salles, Washington Cunha, Gabriel Jallais, Leonardo Rocha 0001, Marcos André Gonçalves. 264-277 [doi]
- Agente Autônomo Guiado por LLM para Extração de NotíciasJoão V. C. Neres de Sousa, Lucas M. Mingardo, Carlos E. T. Freire, Agma J. M. Traina, Caetano Traina Júnior. 278-288 [doi]
- Nova Base de Dados Brasileira para Sistemas de Recomendação de Artigos CientíficosJoão Vitor Felipe dos Santos, Ricardo Marçal de Andrade Nascimento, Adriano César de Melo Camargo, Sérgio Daniel Carvalho Canuto, Gustavo de Assis Costa, Daniel Xavier de Sousa. 289-302 [doi]
- Repositório de Dados para Ciência Aberta na Região AmazônicaAndré N. Maia, Caio N. Maia, Pedro L. P. Corrêa. 303-315 [doi]
- KV-RAPTOR: Scalable Tree-Structured Retrieval with KV Cache Compression for Question-Answering SystemsJoão Gabriel Junqueira da Silva, Sávio S. T. de Oliveira, Lucas Alexandria Alves, Nicolás Eiris, Arlindo R. Galvão Filho. 316-329 [doi]
- OndePublicar.com: A Collaborative Web Platform about Academic Events and Journals Accepting Paper SubmissionsWilliam Jones Beckhauser, Renato Fileto. 330-343 [doi]
- eTRUMiner: Mining Multivariate Temporal Rules from Heterogeneous and Incomplete Time SeriesEliane Karasawa, Elaine P. M. Sousa. 344-356 [doi]
- Unveiling Power on Combining Prompt Engineering Techniques: An Experimental Evaluation on Code GenerationCristofer Girardi, Damires Yluska de Souza Fernandes, Alex Sandro da Cunha Rêgo. 357-370 [doi]
- Tudo em Todo Lugar ao Mesmo Tempo: Rastreabilidade de Dados em Cidades Inteligentes por meio de ProveniênciaMaria Luiza Furtuozo Falci, Débora B. Pina, Liliane N. O. Kunstmann, Vanessa Braganholo, Daniel de Oliveira 0001. 371-384 [doi]
- Intervening in problematic data regions to improve machine learning modelsGregully Willian, Fábio Porto 0001, Eduardo H. M. Pena. 385-398 [doi]
- Effectiveness of Small and Large Language Models for PL/SQL Bad Smell DetectionVinicius Ferreira de Sousa, Cláudio de Souza Baptista, André Luiz Firmino Alves, Hugo Feitosa de Figueirêdo. 399-412 [doi]
- Mitigando Impactos de Distribuições Não-IID em Aprendizagem Federada para Sistemas de RecomendaçãoArthur Negrão, Guilherme C. R. e Rocha, Lucas G. dos Santos, Pedro Igor de Souza Malaquias, Rodrigo C. Pedrosa, Reinaldo Silva Fortes, Pedro Silva 0004. 413-426 [doi]
- TWIX: Balancing Fairness and Utility in Item Exposure for Recommendation SystemsMaria de Lourdes Maia Silva, Iago C. Chaves, André L. C. Mendonça, Eduardo Rodrigues Duarte Neto, Javam de Castro Machado. 427-440 [doi]
- Abordagem de migração de bases relacionais para bases orientadas a documentos apoiada por LLMLuan Felipe Marmentini, Evandro Miguel Kuszera. 441-454 [doi]
- Advanced Chunking Techniques: a Novel Approach for Semantic SplittersBernardo Ramos Toresan, Viviane Pereira Moreira, Felipe Soares Fagundes Paula, Luciana Regina Bencke. 455-465 [doi]
- Equitable Diabetes Diagnosis: Tackling Ethnic and Gender DisparitiesLívia Ruback, Luisa Felix, Ariel Soares Teles. 466-478 [doi]
- Language Models are not a Panacea: Combining them with Domain Knowledge and Efficient Indexes for Entity LinkingDaniel Lucas Albuquerque, Vitória S. Santos, Pedro Nack, Renato Fileto, Carina F. Dorneles. 479-492 [doi]
- Domínio Delimitado, Ódio Exposto: O Uso de Prompts para Identificação de Discurso de Ódio Online com LLMsLaryssa Paiva, Gabriel Assis, Annie Amorim, Luiz Gustavo Dias, Aline Paes, Daniel de Oliveira 0001. 493-506 [doi]
- Estudo Comparativo de Banco de Dados NoSQL para Gerenciamento de Séries Espaço-TemporaisLuís Eduardo Damasceno, Melise Maria Veiga de Paula, Vanessa Cristina Oliveira de Souza, Flávio Belizário da Silva Mota. 507-520 [doi]
- Data Dependent Itemset Mining Under Local Differential PrivacyRenan R. Oliveira, José S. Costa Filho, José Maria Monteiro, Javam de Castro Machado. 521-534 [doi]
- Uma Avaliação Comparativa entre o DepreBERTBR e Modelos de Linguagem para Classificação de Textos DepressivosAyrton Douglas Rodrigues Herculano, Laerty Santos da Silva, Damires Yluska de Souza Fernandes, Alex Sandro da Cunha Rego. 535-548 [doi]
- Particionamento Dinâmico Espaço-Temporal para Séries de Dados MatriciaisGeovani P. Santos, Daniel S. Kaster. 549-562 [doi]
- Dinâmicas de Grupos de WhatsApp da Extrema Direita no Brasil: Uma Análise Comparativa Pré e Pós-Eleição de 2022Fernanda Ferreira do Nascimento, José Maria Monteiro, Javam C. Machado. 563-575 [doi]
- Twinscie-Prov: Gerenciando a Proveniência sobre o Ciclo-de-vida de ML no Sistema TwinscieJúlia Neumann Bastos, Fábio Porto 0001, Fábio Levy Siqueira, Edson S. Gomi, Ismael Santos 0001, Rodrigo A. Barreira, Isabela Guimarães Siqueira, Eduardo S. Ogasawara. 576-588 [doi]
- QualiBus: implementando métricas de qualidade para dados de transporte coletivoRafael Luciano L. Silva, Diêgo de A. Correia, Letícia A. Mendes, Ruan T. de Melo, Fábio J. Coutinho. 589-601 [doi]
- Scalable privacy-preserving record linkage: Evaluating MultiBit tree indexing in AtyimoVictor Orrico, Fernanda Eustáquio, Bethânia Almeida, Mirlei Moura Da Silva, Robespierre Pita. 602-615 [doi]
- Algoritmo Paralelo Eficiente para Ordenação Chave-ValorMichel B. Cordeiro, Rodrigo Morante Blanco, Wagner M. Nunan Zola. 616-629 [doi]
- Uma Abordagem para a Gestão da Linhagem de Dados HeterogêneosHudson A. B. da Silva, José Eduardo M. Jochem, João V. dos Santos, Eduardo F. R. de Sousa, Ronaldo dos Santos Mello, Carina F. Dorneles, Renato Fileto. 630-643 [doi]
- Training-Free Hybrid Evidence Retrieval for Question Answering: Dynamic Fusion of Knowledge-Graph Triples and Dense Text EmbeddingsOtávio Calaça Xavier, Anderson da Silva Soares. 644-657 [doi]
- Database Modeling Automation from Natural Language RequirementsJúlia O. K. Menezes, Cláudio E. C. Campelo. 658-670 [doi]
- Análise de Sentimentos em Avaliações de Livros Utilizando a API Gemini para Recomendação PersonalizadaFagner Silva, Sebastião E. Alves Filho, Raul Benites Paradeda, Lenardo Chaves e Silva. 671-684 [doi]
- Criando Portfólios de Alto Desempenho: Otimização de Portfólios de Ativos de Alta Volatilidade Através da Previsão de Retorno Baseada em CNN+BiLSTMIsrael R. Soares, Sérgio Daniel Carvalho Canuto. 685-698 [doi]
- Data-level sampling for dealing with imbalanced datasets: better protection against membership inference attacksKarla F. C. da Silva, Antônio de Abreu Batista Júnior, Jesús P. Mena-Chalco, Luciano R. Coutinho. 699-710 [doi]
- Subnational Foreign Trade Data in Latin America: Diagnostic, Challenges, and Technical PathwaysFelipe Ramon de Britto Redondo, Orlando da Silva Junior. 711-724 [doi]
- Preliminary Ranking-Based Selection for Optimized Retriever Configuration in RAG SystemsSalvador Ludovico Paranhos, Jonatas Novais Tomazini, Sávio Salvarino Teles de Oliveira, Celso Gonçalves Camilo-Junior, Sávio Salvarino Teles de Oliveira. 725-738 [doi]
- Enhancing Text-to-SQL with In-Context Learning: A Multi-Agent Approach Based on CHESSRenato Okabayashi Miyaji, Rafael M. Fernandes, Krysthian F. Martins, Jorge Melegati, Pedro L. P. Corrêa. 739-745 [doi]
- Aplicação do Modelo ARIMA no Vertica para Previsão da Velocidade do VentoGabriel Ciriaco Fornitano, Flávio Belizário Mota, Vanessa Cristina Oliveira de Souza, Arcilan T. Assireu, Melise Maria Veiga de Paula. 746-752 [doi]
- RPAs e Data Lakes para a Indústria 4.0: Um Estudo de Caso de Ecossistema de Dados IntegradosArthur Lucas dos S. Bezerra, Iranildo S. Batalha, Luís Ricardo A. Filho, Clarice M. Almeida, Matheus Inácio N. Dantas, Nelson Alexandre Gouvêa. 753-759 [doi]
- How Culture Shapes Customers: A Cross-Continent Analysis of Apps Reviews Using NLP TechniquesMaria Fernanda Azolin Kotsifas, Ricardo Lüders, Thiago H. Silva 0001. 760-766 [doi]
- Análise Teórica do Impacto de Dados Faltantes em Atributos Sensíveis sobre a Métrica de Fairness p%-ruleDimas Cassimiro do Nascimento, Daliton da Silva, Luis Filipe Alves Pereira. 767-773 [doi]
- Arquitetura Agnóstica para Transcrição, Armazenamento e Análise de Áudios Operacionais no Setor Elétrico Utilizando Serviços de Nuvem e ElasticsearchPatrícia C. Wang, Maurício S. Magalhães, Hugo D. Rebelo, Leonardo T. Vianna, Hugo R. V. Portuita, Tássio Simioni, Rodrigo M. Rocha. 774-780 [doi]
- Assessing the impact of missing value mechanisms on anomaly detection in healthcare wearable dataAfonso M. S. Lima. 781-787 [doi]
- Quando os Erros Informam: Apoio ao Diagnóstico de Diabetes em Cenários de Alta IncertezaSamuel Norberto Alves, Celso França, Regina T. I. Bernal, Crizian S. Gomes, Oluwatoyin Joy Omole, Deborah Malta, Marcos André Gonçalves, Jussara M. Almeida. 788-794 [doi]
- Drift Detection for Identifying Training Patterns Prior to Performance Improvement in RunnersNathália Tito, Lucas Giusti Tavares, Glauco Fiorott Amorim. 795-801 [doi]
- Collaborative Classification for Object Labeling on Expansible DatasetsBruno Padilha, João Eduardo Ferreira. 802-808 [doi]
- Avaliando as Limitações e Potenciais do Algoritmo k-Vizinhos Mais Próximos (kNN) na Imputação de Dados ClínicosIzadora Monken Ganem, Guilherme Dal Bianco, José Carlos Serufo Filho, Luciano R. S. de Lima, Leonardo Rocha 0001, Marcos André Gonçalves. 809-815 [doi]
- Representação Probabilística de Trajetórias Veiculares como Entrada para Redes Neurais ArtificiaisBianca Lahm Gomes, Kame Haung Zhu. 816-822 [doi]
- Metadata Management in Data Mesh: Toward Federated Discovery and GovernanceRafael H. Suguimoto, Paulo Meirelles, Kelly Rosa Braghetto. 823-829 [doi]
- Data Augmentation for Medical Image Segmentation: A Comparative Analysis of Traditional Techniques and Synthetic Data GenerationMariana Aya Suzuki Uchida, Erikson Júlio De Aguiar, Caetano Traina Jr., Agma J. M. Traina. 830-836 [doi]
- Estudo do Impacto de Dados Sintéticos e Paráfrases na Mitigação do Desbalanceamento em Tarefas de Classificação de Textos em Português com Baixa AmostragemCláudio M. V. de Andrade, Gestefane Rabbi, Raiane Asevedo, Julia Paes, Isaias José Ramos de Oliveira, Adriana S. Pagano, Zilma S. N. Reis, Marcos André Gonçalves. 837-843 [doi]
- ARANI: Uma Abordagem Baseada em Linha de Experimento para Preservação de Privacidade em Data LakesThiago Jordão, Marcos Bedo, Daniel de Oliveira 0001. 844-850 [doi]
- Quantifying the RAG Advantage: A Multi-Metric Benchmark for LLM-based Code GenerationGabriel Souza Baggio, Gabriel Machado Lunardi, Guilherme Medeiros Machado, José Palazzo Moreira de Oliveira. 851-857 [doi]
- Towards Enabling the Analysis of Visual Exploration Processes through Interaction ProvenanceLyncoln S. de Oliveira, Gustavo Moreira, Fabio Miranda 0004, Marcos Lage, Daniel de Oliveira 0001. 858-864 [doi]
- A Data Augmentation and Validation Pipeline for Improving Emotion Classification in Mobile App ReviewsKalidsa B. de Oliveira, Gabriel Machado Lunardi, Williamsom Silva, Thiago L. T. da Silveira, Adriano Q. de Oliveira. 865-871 [doi]
- DiveScan: um módulo para Recuperação de dados por Similaridade com Diversidade em PostgresAnna Júlia Costa Lauton, Agma Juci Machado Traina, Caetano Traina Jr.. 872-878 [doi]
- Subdomain Identification Strategies for Efficient Machine Learning ModelsSamuel R. Torres, Rocío Zorrilla, Raphael de Freitas Saldanha, Victor Riberiro, Eduardo H. M. Pena, Fábio Porto 0001. 879-885 [doi]
- UniChat: Arquitetura e Avaliação de um Agente RAG de Baixo Custo para o Contexto UniversitárioAna Clara Boniatti Bordin, Gabriel Machado Lunardi, Eduardo Kessler Piveta, Leonardo Emmendorfer. 886-892 [doi]
- Large Language Models para detecção de conluios em licitaçõesJorge N. S. Pavão, Diego N. Brandão, Kele T. Belloze. 893-899 [doi]
- Adaptando Indicadores para Avaliação da Saúde de Projetos de Infraestrutura Científica: Uma Aplicação de Business Intelligence nas Linhas de Luz do SiriusDante Paes Brito, Mauri P. dos S. Júnior, Marcelo M. Xavier. 900-906 [doi]
- PANDORA: Sistema Estatístico para Previsão de Eventos Climáticos ExtremosLuís Fernando Cezar dos Santos, Flávia Maristela Santos Nascimento. 907-913 [doi]
- Utilização do Apache Superset para Visualização Escalável de Dados Educacionais Públicos: Um Estudo de Caso com o Censo EscolaJoão Pedro V. Ramalho, João A. Silveira, Thales Gabriel C. de Lima, Mateus S. Herbele, Josiney de Souza, Guilherme Alex Derenievicz, Letícia M. Peres, Simone Dominico. 914-920 [doi]
- Um Estudo Comparativo de Estratégias de Seleção de Exemplos para In-Context Learning aplicado à Classificação Automática de Texto com Grandes Modelos de LinguagemGabriel Prenassi, Guilherme Fonseca, Davi Reis, Washington Cunha, Marcos André Gonçalves, Leonardo Rocha 0001. 921-927 [doi]
- Pondere e Expanda: Impacto e Limitações de Representações Contextual-Esparsas na Modelagem de TópicosAna Cláudia Machado, Celso França, Ian Nunes, Marcos André Gonçalves, Leonardo Rocha 0001. 928-934 [doi]
- Extração Automática de Atributos de Sinais de Emissão Acústica com Redes Neurais Autocodificadoras para Predição de Integridade em TubulaçõesBernardo Dutra, Antônio Neves, Marcos Carvalho, Sérgio Daniel Carvalho Canuto, Jorge Wanderley Ribeiro, Rodrigo Pires, Douglas Soares dos Santos, André Lopes Gama da Fonseca, Jussara M. Almeida, Marcos André Gonçalves. 935-941 [doi]
- A Comparative Analysis of Denoising Methods for Deep Learning-Based Audio Event Detection in Noisy Agricultural EnvironmentsAndré Moreira Souza, Guilherme Augusto Moreira, Lucas Eduardo Gulka Pulcinelli. 942-948 [doi]
- Estendendo Consultas Contínuas por Abrangência aos Dados MétricosEnzo Seraphim, Thatyana F. P. Seraphim, Lúcio F. D. Santos, Edmilson Marmo Moreira, Luiz Olmes Carvalho. 949-955 [doi]
- Entity Matching com Large Language Models: estudo comparativo com abordagem de Entity BlockingRodolfo Bolconte Donato, Tiago Brasileiro Araújo. 956-962 [doi]
- Exploring Temporal Text-to-SQL Challenges in Brazilian Portuguese: Lessons from Educational DataKarina de Carvalho Fróes, Kelly Rosa Braghetto. 963-969 [doi]
- Pipeline Distribuído para Análise Espacial em Larga Escala: Avaliação da Regra 3 do Índice 3-30-300 em Fortaleza com Apache Spark e SedonaLucas L. Silva, Marta C. González, Lucas F. A. Babadopulos, Jorge Barbosa Soares, Lara Sucupira Furtado. 970-976 [doi]
- Addressing Database-Related Issues in Digital Social Network Data AnalysisAlexandre Heine, Mariana Porto Barreto, Rodrigo Motta Ferreira, Edward Hermann Haeusler, Sérgio Lifschitz. 977-983 [doi]
- Deep Learning for Urban Flood Prediction: An LSTM Model Integrating Satellite Reanalysis and Historical Weather Data in CuritibaLucas Iuri dos Santos, Luiz C. Gomes-Jr. 984-990 [doi]