Vem entender a diferença entre o que faz uma Cientista de Dados e uma Engenheira de Dados e escolher qual caminho seguir.
Você começou a ler sobre Data Science e a área tem feito seus olhinhos brilharem, mas ainda não sabe qual profissão seguir?
Vem cá que eu te ajudo a entender a diferença entre o que faz uma Cientista e uma Engenheira de Dados. Assim fica mais fácil escolher um caminho para focar nos estudos na área que mais gostar! Bora?!
Dados, dados e mais dados
A última década que vivemos trouxe uma explosão de dados. Quase tudo o que fazemos no dia-a-dia se converte em dados: desde o nosso comportamento em um e-commerce às maratonas no Netflix, passando pelos tweets, transações usando Nubank e os passeios de Uber.
E junto a essa quantidade gigantesca de informações, que cresce exponencialmente, vem a necessidade de profissionais que sejam capazes de extrair, organizar, analisar e entregar valor a partir desses dados. Isso, junto às tecnologias que surgiram recentemente, tem levado à atualização de carreiras existentes e à criação de outras.
Data Science Team
Um time de Data Science normalmente é composto por profissionais das áreas de ciência de dados, engenharia de dados, estatística e engenharia de software. Mas vamos focar nas duas primeiras.
Frequentemente você vai se deparar com descrições de vagas de emprego que misturam ou confundem as funções e habilidades de cientistas de dados e engenheiras de dados. Apesar de as profissões estarem intimamente ligadas a dados, há diferenças entre o trabalho que desempenham e é isso que vamos ver a seguir.
Engenheira de dados
Uma engenheira de dados é uma engenheira hardcore que ama brincar com bases de dados e sistemas de processamento em larga escala. É responsável por criar o pipeline dos dados, desde a coleta até a entrega destes de forma organizada e limpa para serem utilizados pelas cientistas de dados.
As engenheiras de dados desenvolvem, constroem, testam e dão manutenção em arquiteturas, como os sistemas de processamento de dados em larga escala citados acima.
É necessário que você tenha conhecimentos sólidos de SQL (“Structured Query Language”, ou “Linguagem de Consulta Estruturada”, em pt-br. É uma linguagem de programação para trabalhar com banco de dados estruturados.) e NoSQL (banco de dados não relacionais.), técnicas de modelagem de dados e ETL ("extract, transform, load": extrair os dados "crus", transforma-los em conjuntos de dados organizados e carregar esses dados em um repositório tendo certeza de que o processo será o mais eficiente possível.).
Além disso, é preciso se manter atualizada nas ferramentas, bibliotecas, plataformas e outros recursos disponíveis, para que possa tomar a melhor decisão sobre quais tecnologias usar e como entregar o melhor com aquilo que se tem acesso e dominar arquiteturas de microsserviços e segurança de dados.
Cientista de Dados
As cientistas de dados são fadas que transformam os dados extraídos pelas maravilhosas engenheiras em soluções para os mais diversos desafios. Para isso precisam limpar, tratar, organizar os dados e aplicar suas capacidades analíticas para criar modelos preditivos.
Uma cientista de dados utiliza seus conhecimentos em matemática, estatística, programação, computação distribuída e inteligência artificial para levantar insights e suas habilidades em apresentar visualmente os dados para relatar esses insights às partes interessadas.
Se o trabalho das engenheiras de dados é baseado em ETL, o das cientistas é baseado em DAP ("discover, access, predict", ou "descobrir, acessar e predizer" em pt-br), que seria explorar e identificar fontes de dados e suas métricas, acessar e investigar esses dados e com base em análises estatísticas, apresentar insights com ações a serem tomadas em forma de gráficos e tabelas para melhor visualização.
Uma analogia interessante usada por Vik Paruchuri no seu artigo "What is a Data Engineer?" (em tradução livre) é comparar uma engenheira de automóvel e uma pilota de carros de corrida: a pilota sente a emoção da alta velocidade e a vibração do público que foi assistir à corrida, já a engenheira que projetou aquele carro sente o prazer de ajustar os motores, experimentar diferentes escapamentos, e criar máquinas fodas.
Então, se você gosta de projetar e construir algo de valor para ser usado pelo time, o caminho da engenharia de dados é o ideal para você, mas se você prefere investigar e apresentar algo de valor para ser usado pela ponta, o caminho é o da ciência de dados.
Se você está começando agora, minha dica é: inicie os estudos por python e SQL, pois serão úteis para ambas carreiras e você poderá amadurecer sua decisão e seguir pelo caminho que mais te agradar!
Até uma próxima,
AI Girl
Escritora: Luíza Bizoni
Siga a comunidade nas redes sociais!!
Top comments (0)