DEV Community

Cover image for Plataforma Scylax e a Análise de Dados sobre Pesquisas Acadêmicas
Lisandra Melo
Lisandra Melo

Posted on

Plataforma Scylax e a Análise de Dados sobre Pesquisas Acadêmicas

Pesquisa Acadêmica e o Scylax

O processo de realização de pesquisas científicas é parte imperiosa durante a formação acadêmica. Visto que, tal processo fomenta o desenvolvimento da construção de conhecimento, promovendo a concretização do que se é proposto em sala de aula de forma interdisciplinar e palpável, possibilitando assim a atuação universitária sob os três pilares da universidade: ensino, pesquisa e extensão. Nesse sentido, é notável que pesquisas acadêmicas são bases fundamentais para o exercício adequado de centros acadêmicos universitários.

“Art. 207. As universidades [...] obedecerão ao princípio da indissociabilidade entre ensino, pesquisa e extensão.” (Constituição Federal, 1988)

Nessa perspectiva, é notável que o que se é produzido nas pesquisas acadêmicas constitui-se de dados de elevada relevância para a análise da qualidade e da circunstância de universidades ou quaisquer outros centros educacionais. Para agrupar todos esses dados, foi desenvolvida a plataforma Scylax, que tem como objetivo fornecer informações sobre pesquisas relacionadas a docentes, instituições, centros, departamentos e diversos outros membros componentes da universidade.

Características do Scylax

A plataforma obtém dados a partir de plataformas como Lattes, Scopus e Orcid e diante dos dados fornecidos fornece a visualização de informações como: total de produções, Qualis de produções, quantidade de produções com colaboração, áreas de pesquisa e tipo de pesquisa. Além disso, o Scylax fornece a funcionalidade de comparação de informações entre pesquisadores ou organizações educacionais.

Com ela também é possível visualizar e extrair informações relevantes a respeito das pesquisas por pesquisadores e instituições de ensino de forma prática e rápida. Esses dados, por sua vez, podem ser usados por diversas organizações e seus membros para avaliar o impacto e alcance de suas produções, a relevância de suas colaborações e áreas correlatas aos temas estudados.

Sendo assim, a ferramenta funciona como um acurado medidor de desempenho acadêmico, onde diversas instituições de pesquisa, que necessitem de dados de diferentes plataformas, podem recorrer seja para avaliar um candidato a bolsa ou reconhecer os trabalhos de maior destaque e relevância.

Possibilidades com os Dados

Sabemos que os dados que estejam brutos, ou seja, não estão dispostos de maneira organizada e analisados de maneira isolada não apresentam qualquer fundamento. Por isso, é necessário o processamento e relacionamento desses dados, a fim de gerar informação.

Contudo, há dois principais problemas na produção de informação, o primeiro deles é a coleta de dados: geralmente os dados são gerados em formatos, estruturas e tamanhos diferentes. O segundo problema é como será feito o armazenamento dessas informações: é preciso que os dados estejam bem estruturados para facilitar seu uso nas bases de dados.

Pensando nisso, existe um processo chamado ETL, que vem de Extract, Transform e Load (Extração, Transformação e Carregamento). ETL é um processo de integração de dados, relacionando dados de diversas fontes e gerenciando o armazenamento em um banco de dados centralizado.

As etapas da ETL:

  • Extração
    Na etapa de extração os dados brutos são coletados de sua fonte original, por meio de API, banco de dados, raspagem ou outros sistemas. Esses dados são ajustados e unificados,e ficam na espera de serem transformados.

  • Transformação
    Nesta etapa, os dados são processados, limpos e consolidados, a fim de que fiquem livres de quaisquer ruídos ou inconsistências. Também nesta etapa, os dados são agrupados de acordo com características similares.

  • Carregamento
    Na última etapa, os dados transformados são carregados para uma estrutura de banco de dados.

Portanto, vimos que sem o uso de um método como o ETL seria muito difícil analisar as informações coletadas e por consequência não poderíamos resolver os problemas propostos.

Finalmente, sob posse dos dados reunidos pela plataforma Scylax e fazendo uso de ferramentas que auxiliem no processamento e relacionamento dessas informações, será possível realizar diversos tipos de estudos, como análises correlacionais, com os dados disponibilizados e agrupamentos baseados em características similares entre organizações educacionais ou pesquisadores.

Conclusão

Espera-se, dessa forma, que a partir da continuidade do estudo do tema, a preparação e análise dos dados fornecidos, a construção de um estudo agregador às informações já presentes na plataforma.

O texto acima foi desenvolvido a partir do esforço conjunto de Lisandra Melo, Kaio Menezes, Paulo Belarmino, Debora Gizele e Kelmo Alexandre. Este foi utilizado durante a avaliação parcial da disciplina de Ciências de Dados do curso de Bacharelado de Tecnologia da Informação oferecido pelo Instituto Metrópole Digital da Universidade Federal do Rio Grande do Norte.

Top comments (0)