DEV Community

Cover image for Modelagem Multidimensional de Data warehouse
Letícia Tavares
Letícia Tavares

Posted on

Modelagem Multidimensional de Data warehouse

O que é:

Sistema de gerenciamento de dados projetado para ativar e fornecer suporte às atividades de business intelligence (BI), especialmente a análise avançada.

Quais as suas características:

  • Gestão de dados: Gestão de dados e da mudança deles. O warehouse viabiliza uma visão histórica dos dados, em vez de somente uma visão do estado atual. Desse modo, a compreensão sobre os dados se torna ainda mais profunda, com assimilação de ais nuances.
  • Integração dos dados: Tendo uma concentração de dados de diferentes fontes, que surgem em formatos distintos. Dados transacionais, dados estratégicos, de negócios etc.
  • Não volatilidade dos dados: Quando os dados estão no warehouse, eles permanecem persistentes e estáveis, sem muder o seu estado. Mesmo que o DW consiga visualizar os dados em relação a outros mais antigos ou mais recentes (o histórico), os dados em si permanecem inalterados.

Elementos fundamentais:

  • Dimensões: As dimensões representam os aspectos pelos quais os dados serão analisados. Elas fornecem contextos significativos para os dados e são normalmente representadas como tabelas. Exemplos comuns de dimensões incluem tempo, localização geográfica, produto, cliente e categoria.

  • Hierarquias: As hierarquias são estruturas organizadas dentro de uma dimensão que representam a relação entre diferentes níveis de detalhe. Por exemplo, em uma dimensão de tempo, pode haver uma hierarquia que vai de ano para trimestre, para mês e, em seguida, para dia. As hierarquias permitem a navegação e agregação dos dados em diferentes níveis de granularidade.

  • Fatos: Os fatos são as medidas quantitativas que representam o desempenho do negócio que se deseja analisar no data warehouse. Eles estão associados às dimensões e representam valores numéricos que podem ser agregados. Exemplos de fatos podem incluir vendas, lucros, quantidades vendidas, tempo gasto, etc.

  • Tabelas de fatos: As tabelas de fatos são as principais tabelas em um modelo multidimensional. Elas contêm os fatos e as chaves estrangeiras que fazem referência às dimensões. Cada linha em uma tabela de fatos representa uma instância de evento ou transação a ser analisada.

  • Chaves estrangeiras: As chaves estrangeiras são os identificadores que relacionam as tabelas de fatos com as dimensões. Elas permitem a integração dos dados em diferentes níveis de detalhe.

  • Agregações: Agregações são pré-cálculos dos valores de fatos em diferentes níveis de granularidade. Elas são usadas para melhorar o desempenho das consultas, evitando cálculos repetitivos durante as análises. As agregações são criadas com base nas combinações de dimensões que são mais frequentemente consultadas.

Modelos de modelagem:

SnowFlaking - Quando os campos de baixa cardinalidade de uma dimensão compuseram outra tabela, a qual foi ligada com a tabela original com chaves artificiais. O snowflake é feito para salvar espaço em disco, mas não é recomendado para ambientes de data warehouse por tornar a sua apresentação mais completa (por aumentar o número de tabelas e para consultar com processamento mais pesado ( por aumentar a necessidade de junção de tabelas para se obter a informação), acarretando maior tempo de resposta.

Star Schema - Nesse modelo os dados são desnormalizados para evitar joins entre tabelas, diminuindo o tempo de consultas, no, entretanto devido à repetição de dados, utiliza mais espaço em disco. A vantagem desse modelo é a eficiência na extração de dados, o que é um grande diferencial em se tratando de um data warehouse

Vantagem

A modelagem multidimensional é uma técnica de concepção e visualização de um modelo de dados de um conjunto de medidas que descrevem aspectos comuns de negócios. Utilizada especialmente para sumarizar e reestruturar dados e apresentá-los em visões que suportem a análise dos valores desses dados. Dá suporte e aperfeiçoa manipulações.

Top comments (0)