Fala galera, beleza?
Dando continuidade nos assuntos da DP-900, nesse segundo artigo da série, trago mais informações a respeito do conteúdo dessa certificação, então, a série de hoje vai abordar sobre a parte de conceitos básicos de dados. Então pega um café, pega um dado e se prepare para o jogo, digo, para a leitura do artigo 😂.
Nesse artigo vou falar um pouco sobre dados, os tipos de dados e os armazenamentos que podemos usar, dando destaque aos serviços proporcionados pelo Azure, por enquanto, é a primeira parte desse assunto. A ideia é que ao final desse artigo você consiga compreender:
- O que é dados (joga o dado, com certeza saiu para avançar para a próxima casa, prossiga 😂);
- Quais são os tipos de dados?
- Quais são os armazenamentos por tipo de dados, e qual serviço o Azure oferece?
Quando vamos ler um texto dessa temática, uma das primeiras coisas que vemos são os autores falando sobre o volume de dados que tem sido criados nessa última década, não precisamos nem ir tão longe e tentar imaginar, por exemplo, sensores que estejam nesse momento gerando dados em larga escala para dispositivos de IOT de forma diversa.
Podemos olhar para as redes sociais, por exemplo, como o Facebook, Instagram, Linkedin, Twitter e entre outros. Só por ai, podemos imaginar o volume de dados produzidos, várias pessoas postando textos, vídeos, imagens, e podemos também nos perguntar como esses dados são tratados e armazenados.
Para vocês que são novos no assunto, esses dados gerados não ficam soltos de forma aleatória, nem vão parar tudo num HDzão e pá, "tá lá de boa". Dependendo do tipo, esses dados serão "salvos" em algum tipo de armazenamento, que você vai ver mais para frente nesse artigo. E o que vai variar, além da questão tecnológica, é a estratégia de organização nesse armazenamento.
Tá Mateus, você falou essas coisas ai, mas não falou pra gente o que é dados. Opa não posso esquecer! 😂
Dados de acordo com o curso da DP-900 no site da Microsoft, nada mais é do que uma coleção de fatos; já um outro autor, no site da escola dos dados, disse que dados podem ser enxergados como valores atribuídos a algo. Esses fatos ou valores, podem ser números, observações, textos, datas e entre outras possibilidades.
Depois de saber a definição, vamos falar sobre a classificação. Os dados podem ser classificados em três tipos:
- Estruturados
- Semiestruturados
- Não estruturados
Dados Estruturados
Em relação aos dados estruturados, podemos associar de imediato com dados relacionais, dados que são organizados em formato de tabela. Ele tem uma estrutura fixa, por exemplo, para cada linha, ele sempre terá as mesmas colunas. Logo, se fosse pensar em mudanças, levantando um exemplo simples, você precisaria mexer na estrutura dele, caso necessitasse que alguma coluna fosse acrescentada ou removida.
Dados semiestruturados
Os dados semiestruturados se baseiam em uma estrutura um pouco mais flexível, se fosse comparar com os dados estruturados; eles podem ser baseados em documentos (o famoso JSON), chave-valor ou grafos. Esses dados também são chamados de não-relacionais.
Dados Não estruturados
Já os não-estruturados, por sua vez, não possuem uma estrutura, nesse tipo podemos ter dados como áudios, vídeos, imagens, arquivos binários e entre outros.
Armazenamentos
Se for olhar pela classificação, e você tiver alguma experiência com o assunto, você vai perceber que tem algumas pistas no artigo de qual armazenamento usar para cada um, porém Sherlock se você ainda não tem a pista não se preocupe, você vai desvendar esse mistério agora; para dados estruturados, usamos os bancos de dados relacionais, se tiver anotando os pontos chaves do texto, anota os exemplos aí também: SQL Server, Oracle, MySQL, PostgreSQL e no Azure temos um serviço específico para isso, o banco de dados SQL dele.
Para os dados semiestruturados, usamos o banco de dados não relacional como o MongoDB, Redis, Cassandra, HBase e outras possibilidades, mas no Azure nós temos o Azure CosmosDB, um banco NoSQL muito bacana por sinal, tive a oportunidade de experimentar. E para solucionar de vez o mistério, para os não estruturados podemos usar no Azure o serviço de armazenamento de blobs.
Considerações finais
Se você chegou até aqui, aproveita o resumão desse conteúdo na imagem abaixo, se você não leu o texto, tem um segredo na metade da primeira metade da segunda metade do texto, quando descobrir me conta! No próximo post, vamos falar sobre soluções de processamento de dados e um pouco sobre sistema transacional e analítico. Até lá! 😀
Agradecimentos
Antes de dar tchau, não posso deixar de agradecer as pessoas que revisaram esse artigo, se esse texto ficou muito legal, foi devido a participação deles: Renan, Ono, Marlei, Genilda, Evelyn e Silson. E agradeço ao Henrique pelo incentivo em relação a escrita desses artigos. Valeu galera! 😀
Top comments (6)
Mais um artigo bem escrito!
Valeuuuuuu Andrezão! Tmj! 😀😀🙏🙏
Parabéns pelo conteúdo!! Artigo que facilita a compreensão do conteúdo de forma descontraída e com ilustrações que ajudam a fixar os conceitos. Rumo a certificação DP-900!!
Muito obrigado Ono! Espero facilitar cada vez mais os conteúdos, usando doses de humor, alguns exemplos não convencionais e tentando atender as diversas formas de aprendizado! Tamo juntos! 😀😀🙏🙏
Show, parabéns. O conteúdo está muito bom e em breve vou fazer esta certificação.
Hahaha muito obrigado mano! Tamo juntos nessa! 😀