Integridade referencial e tipos de modelagens

Amanda Nascimento
27 de mai. de 2025
5 min de leitura

Atualizado: 28 de set. de 2025

Integridade referencial é um princípio dos bancos de dados relacionais que garante que os relacionamentos entre tabelas estejam corretos e consistentes.

Em outras palavras, ela assegura que não existam registros órfãos em tabelas que dependem de outra, ou seja, uma chave estrangeira (FK) só pode apontar para uma chave primária (PK) que realmente existe.

Esses conceitos pertencem originalmente à modelagem relacional, mas também são aplicados na modelagem multidimensional, porque esta é uma especialização da modelagem relacional voltada para análise de dados (OLAP).

Se houver valores na tabela fato que não existem em alguma dimensão relacionada, poderá aparecer erro como em branco (blank()) pois o valor existe na fato mas não esta relacionando com a dimensão, filtros da dimensão não afetam corretamente os dados da fato e erro lógico em análises de BI (ex: um produto vendido que "não existe").

Por isso, garantir integridade referencial entre suas tabelas é fundamental para confiabilidade e precisão das análises.

No exemplo abaixo, a tabela dimensão não esta completa, não tem o número 3, e ele existe na nossa tabela fato:

As relações entre tabelas são definidas na aba "Modelagem" (Model view) e essas relações são baseadas em campos-chaves, que funcionam como PK (na dimensão) e FK (na fato).

O Power BI recomenda que essas relações tenham integridade referencial válida, ou seja, que cada valor na FK da fato tenha um correspondente na PK da dimensão.

Como PK e FK garantem a integridade relacional?

PK (Primary Key): Define um valor único em uma tabela. É o “dado de origem”.
FK (Foreign Key): Faz referência a esse valor na tabela relacionada. É o “dado dependente”.

Cada tabela fato contém chaves estrangeiras (FK) que apontam para chaves primárias (PK) das tabelas dimensão.
Isso garante que os dados na tabela fato só referenciem entidades válidas, como produtos ou clientes que realmente existem.

A chave primária (PK) é uma coluna (ou conjunto de colunas) que identifica de forma única cada registro em uma tabela.

Características:

Não pode conter valores nulos (NULL).
Os valores devem ser únicos (não podem se repetir).
Cada tabela pode ter apenas uma chave primária.
Geralmente é usada como referência por outras tabelas (através de chaves estrangeiras).

FK – Foreign Key (Chave Estrangeira)

A chave estrangeira é uma coluna (ou conjunto de colunas) que estabelece uma ligação entre duas tabelas. Ela faz referência à chave primária de outra tabela.

Características:

Garante a integridade referencial (os dados relacionados devem existir na tabela referenciada).
Pode aceitar valores nulos (dependendo da regra de negócio).
Uma tabela pode ter várias chaves estrangeiras.

Modelagem Multidimensional

A modelagem multidimensional, embora voltada para análise e BI, é construída sobre os fundamentos da modelagem relacional. Conceitos como chave primária (PK) e chave estrangeira (FK) continuam sendo fundamentais — especialmente para garantir a integridade referencial entre tabelas de fatos e dimensões.

A modelagem multidimensional é fundamental para data warehouses e OLAP, pois organiza dados para facilitar consultas analíticas rápidas e compreensíveis. é uma abordagem específica para modelagem de dados voltada para análise e BI.

Dentro da modelagem multidimensional estão:

Star Schema
Snowflake Schema
Fact Constellation / Galaxy Schema
Starflake (híbrido)
Reverse Star Schema
Data Vault (alguns consideram híbrido, mas pode ser incluído em arquiteturas analíticas)
Anchor Modeling (em alguns casos para modelagens historizadas)

Modelo estrela (Star schema)

Modelagem multidimensional. O modelo estrela é uma estrutura de banco de dados relacional usada principalmente em Business Intelligence (BI) e Data Warehousing, como no Power BI, SQL Server Analysis Services, BigQuery, etc.

Ele recebe esse nome porque seu formato visual parece uma estrela, com uma tabela fato no centro e várias tabelas dimensão ao redor ligadas a ela ou seja, este modelo é constituído de fatos, dimensões e relacionamentos.

Essa estrutura cria relacionamentos de muitos-para-um (Many-to-One), que o Power BI e o SQL Server usam para navegar e filtrar corretamente os dados.

Para saber mais sobre relacionamentos, clique aqui

Vantagens Star Schema	Descrição
✅ Simplicidade	Fácil de entender e consultar (ótimo para usuários de BI).
✅ Performance	Otimizado para leitura e agregações (como SUM, COUNT).
✅ Flexibilidade	Permite criar painéis e relatórios dinâmicos com filtros por dimensão.

Tabela Fato:

É a tabela principal onde vai guardar informações quantitativas contendo datas, chave primária das dimensões. A tabela fato é o registro de um fato que aconteceu.

Contém fatos numéricos ou medidas que você deseja analisar.
Ex: vendas, lucro, custo, quantidade, etc.
É geralmente grande, com muitos registros.
Contém várias FKs (chaves estrangeiras) que apontam para tabelas dimensão.

Granularidade: A granularidade representa o nível de detalhe dos dados armazenados em uma tabela fato. Em outras palavras, ela define "qual é a menor informação registrada?".

Um modelo com granularidade alta armazena cada transação individual (por exemplo, cada venda ou atendimento).
Um modelo com granularidade baixa agrupa os dados em um nível mais resumido (como vendas por dia ou por loja).

Tabelas Dimensão:

É uma entidade de negócio. São informações que contém dentro dos registros da tabela fato, informações mais consistentes que vão ser cadastradas uma única vez e não terá dado duplicado.

Contêm atributos descritivos relacionados às medidas da fato.
Ex: cliente, produto, tempo, região, departamento, tipo status, etc.
São mais "largas" (muitas colunas) e mais curtas (menos linhas).
Cada uma tem uma PK (chave primária), que é referenciada pela fato.

Dimensões Conformadas(Conformed Dimensions)

São dimensões que são consistentes e compartilhadas entre diferentes tabelas de fatos ou até entre diferentes data marts.

Dimensões costumam ser conformadas, SCD, junk, role-playing.

São denormalizadas (ex.: DimProduto já inclui categoria e fornecedor, sem criar outras tabelas).

Modelo Snowflake Schema (floco de neve)

Modelagem multidimensional

Estrutura: semelhante ao Star, mas as dimensões são normalizadas em múltiplas subdimensões (ex.: produto → categoria → fabricante)
Vantagens:
- Menos redundância, uso de espaço otimizado.
- Melhor integridade
Desvantagens:
- Consultas mais lentas devido a múltiplos joins.
- Mais complexo de modelar e entender

As dimensões podem ser explodidas em várias tabelas menores.

Exemplo: em vez de DimProduto única, temos DimProduto ↔ DimCategoria ↔ DimFornecedor.

SCD continua valendo, mas fica mais complexo manter histórico.

Fact Constellation (Galaxy Schema)

Estrutura: múltiplas tabelas de fatos (ex.: vendas + remessas) que compartilham dimensões comuns (tempo, produto, cliente).
Vantagens:
- Suporta diversos processos de negócios com flexibilidade analítica.
Desvantagens:
- Altamente complexa, exige cuidado no desenho e na manutenção.

Outros Modelos dentro da modelagem multidimensional

Reverse star schema: inverte o foco, com dimensões maiores que a tabela fato central — comum para grandes volumes de dados descritivos.
Hybrid / Starflake: combina elementos de star e snowflake para equilibrar desempenho e integridade.
Data Vault: foca em historização e rastreabilidade, com hubs, links e satélites — ideal para ambientes com dados altamente voláteis.
Anchor Schema: semelhante ao constellation, mas com mais flexibilidade em modelagem de relacionamentos — menos comum, mas relevante em alguns cenários .

Cenário	Star Schema	Snowflake Schema	Galaxy / Constellation
Consultas ágeis, BI simples	✅ Ideal	⚠️ Pode ficar lento	✖️ Complexo demais
Armazenamento limitado, integridade de dados	❌ Espaço alto	✅ Otimizado	⚠️ Mais complexo
Múltiplos processos/metas de análise	❌ Limitado	⚠️ Complexo	✅ Melhor suporte
Ambientes regulados ou transacionais	⚠️ Risco de inconsistência	✅ Integridade forte	⚠️ Alta complexidade

Modelagem Relacional (ER - Entidade Relacionamento)

Usa entidades, atributos, e relacionamentos.
Comum em bancos de dados transacionais (OLTP).
Diagramas ER (MER - Modelo Entidade Relacionamento).

Em geral, a modelagem relacional é usada em sistemas OLTP, voltados para operações do dia a dia. Já a modelagem multidimensional é típica de ambientes OLAP e soluções de BI, por ser otimizada para análise, agregações e performance em grandes volumes de dados. No entanto, com o avanço das tecnologias analíticas, é cada vez mais comum encontrar arquiteturas híbridas que misturam modelos multidimensionais, relacionais e até NoSQL no mesmo ecossistema de dados.

Modelagem Dimensional Inmon (Top-Down)

Defende primeiro um Data Warehouse Corporativo centralizado, depois os Data Marts.
Tende a ser mais normalizada.
Mais rígida, mas garante consistência corporativa.

Modelagem Orientada a Objetos

Muito usada em sistemas com POO (Programação Orientada a Objetos).
Representa classes, herança, composição etc.
Exemplo: diagramas UML com classes e seus relacionamentos.

Modelagem Documental (NoSQL)

Usada em bancos como MongoDB.
Baseada em documentos JSON ou BSON.
Flexível, não há schema fixo.
Modelagem orientada a documentos e agregações.

Modelagem em Grafos

Usada em bases como Neo4j.
Foco em nós e relações (edges).
Útil para redes sociais, análise de caminhos, grafos complexos.

Modelagem Hierárquica e de Rede (mais histórica)

Usada em bancos como IMS e CODASYL.
Hierárquica: dados em estrutura de árvore.
De rede: relacionamentos complexos entre registros.

AN

Integridade referencial e tipos de modelagens

Como PK e FK garantem a integridade relacional?

A chave primária (PK) é uma coluna (ou conjunto de colunas) que identifica de forma única cada registro em uma tabela.

Características:

FK – Foreign Key (Chave Estrangeira)

Características:

Modelagem Multidimensional

Dentro da modelagem multidimensional estão:

Modelo estrela (Star schema)

Tabela Fato:

Tabelas Dimensão:

Modelo Snowflake Schema (floco de neve)

Fact Constellation (Galaxy Schema)

Outros Modelos dentro da modelagem multidimensional

Modelagem Relacional (ER - Entidade Relacionamento)

Modelagem Dimensional Inmon (Top-Down)

Modelagem Orientada a Objetos

Modelagem Documental (NoSQL)

Modelagem em Grafos

Modelagem Hierárquica e de Rede (mais histórica)

Posts recentes

AN