DATA MINING IN ORGANIC GEOCHEMISTRY: CASE STUDY IN POTIGUAR BASIN

Mineração de dados na Geoquímica Orgânica: estudo de caso na Bacia Potiguar

  • Sarah BARRÓN TORRES Pontifical Catholic University (PUC-Rio)
  • Ítalo de Oliveira MATIAS Pontifical Catholic University (PUC-Rio)
  • Francisco Fábio de Araújo PONTE Pontifical Catholic University (PUC-Rio)
  • Erica Tavares de MORAIS Petrobras Research and Development Center (CENPES)
  • Ygor dos Santos ROCHA Petrobras Research and Development Center (CENPES).
  • Mario Duncan RANGEL Petrobras Research and Development Center (CENPES).
  • Fabiano Galdino LEAL Petrobras Research and Development Center (CENPES).

Resumo

A quantidade de dados provenientes de análises geoquímicas de amostras coletadas em poços de petróleo cresce simultaneamente ao investimento no setor de exploração e produção. Por outro lado, o tratamento e a interpretação desses resultados ainda é muito dependente de especialistas, e demanda tempo. Com a geração de extensas bases de dados, a mineração de dados se apresenta como uma boa alternativa para explorá-los por meio de métodos estatísticos e computacionais, proporcionando diferencial tecnológico e agilidade ao sistema. De forma experimental, com dados de 200 óleos da Bacia Potiguar, essas ferramentas foram implementadas, com a consequente sugestão de um fluxo de trabalho que, ao final, pôde retornar uma precisão razoável na previsão da classificação genética das amostras. Usando escalonamento multidimensional (MDS) e agrupamentos (dos tipos dendrograma e k-means) de 60 atributos iniciais, o conjunto ideal foi reduzido para 26. Aplicando aprendizado de máquinas, 92,50% de acurácia mediana foram obtidos no algoritmo de Árvore de Decisão, 95,00% na Floresta Aleatória e 87,50% em Rede Neural Artificial. Comparando a uma análise previamente apresentada na literatura pertinente, os benefícios em termos de eficiência podem ser percebidos com a adoção da metodologia aqui proposta.

 

Palavras-chave: Geoquímica Orgânica; Mineração de dados; Estatística multivariada; Fluxo de Trabalho.

Biografia do Autor

Sarah BARRÓN TORRES, Pontifical Catholic University (PUC-Rio)

Pontifical Catholic University (PUC-Rio), Informatics Division, Software Engineering Laboratory (LES). Rua Marquês de São Vicente, 225 - Gávea, Rio de Janeiro - RJ, Brazil.

Ítalo de Oliveira MATIAS, Pontifical Catholic University (PUC-Rio)

Pontifical Catholic University (PUC-Rio), Informatics Division, Software Engineering Laboratory (LES). Rua Marquês de São Vicente, 225 - Gávea, Rio de Janeiro - RJ, Brazil.

Francisco Fábio de Araújo PONTE, Pontifical Catholic University (PUC-Rio)

Pontifical Catholic University (PUC-Rio), Informatics Division, Software Engineering Laboratory (LES). Rua Marquês de São Vicente, 225 - Gávea, Rio de Janeiro - RJ, Brazil.

Erica Tavares de MORAIS, Petrobras Research and Development Center (CENPES)

Petrobras Research and Development Center (CENPES). Avenida Horácio Macedo, 950 – Cidade Universitária, Ilha do Fundão, Rio de Janeiro – RJ, Brazil.

Ygor dos Santos ROCHA, Petrobras Research and Development Center (CENPES).

Petrobras Research and Development Center (CENPES). Avenida Horácio Macedo, 950 – Cidade Universitária, Ilha do Fundão, Rio de Janeiro – RJ, Brazil. 

Mario Duncan RANGEL, Petrobras Research and Development Center (CENPES).

Petrobras Research and Development Center (CENPES). Avenida Horácio Macedo, 950 – Cidade Universitária, Ilha do Fundão, Rio de Janeiro – RJ, Brazil. E-mails: mduncan@petrobras.com.br

Fabiano Galdino LEAL, Petrobras Research and Development Center (CENPES).

Petrobras Research and Development Center (CENPES). Avenida Horácio Macedo, 950 – Cidade Universitária, Ilha do Fundão, Rio de Janeiro – RJ, Brazil. E-mail: fabianoleal@petrobras.com.br

Publicado
2022-05-25