Perché l'integrità delle entità e l'integrità referenziale sono importanti in un database?

...

L'entità e l'integrità referenziale sono importanti nei database relazionali.

L'integrità delle entità e l'integrità referenziale sono due forme di integrità dei dati particolarmente importanti nei database relazionali. I database relazionali suddividono l'archiviazione dei dati in elementi che di solito devono essere nuovamente riuniti per produrre risultati significativi. Senza garanzie di questi due tipi di integrità, i dati verrebbero eliminati o duplicati.

Database relazionali

I sistemi di gestione di database relazionali rappresentano oggi il modello di database più diffuso al mondo. Il modello relazionale si basa su dati "normalizzati". La normalizzazione è un processo eseguito nel processo di progettazione del database per garantire che le tabelle la conservazione dei dati non ha dati ripetuti e non può creare ripetizione o perdita quando vengono uniti insieme

Video del giorno

Dati di riferimento

La maggior parte delle applicazioni di database utilizza due diversi tipi di dati: dati di transazione e dati di riferimento. Ad esempio, un database di magazzino molto semplice registrerà le transazioni di movimento delle scorte. Immagina un record di transazione come: Articolo 1010, Quantità 5, Direzione di uscita. Un manager potrebbe voler vedere un report di questi dati che fornisca il nome dell'articolo e la descrizione dell'articolo, nonché il numero dell'articolo. Questi dettagli sono attributi di un'entità diversa che descrive ogni parte nel magazzino. Questa è una tabella di riferimento.

Normalizzazione

Nell'esempio del database del magazzino, la tabella delle transazioni deve contenere solo un identificatore per la parte. Se dettagli come nome e descrizione fossero contenuti nella tabella delle transazioni, ciò causerebbe inutili ripetizioni. Ogni articolo ha sempre lo stesso nome e la stessa descrizione e questi dettagli si riferiscono alla parte e non alla transazione. In questo sistema di esempio, i dettagli delle parti sono contenuti in una tabella diversa. Ogni record nella tabella deve essere identificato in modo univoco da un campo o da una combinazione di campi, chiamata chiave primaria. La suddivisione in gruppi ripetuti è chiamata "normalizzazione".

Integrità dell'entità

Nell'esempio del database del magazzino, la chiave primaria della tabella delle parti dovrebbe essere un attributo che identifica in modo univoco ogni record. Questa è l'integrità dell'entità. In genere, i campi numerici sono migliori per una chiave primaria rispetto ai campi di testo. Nella tabella delle parti, il campo migliore per la chiave primaria sarebbe Numero articolo. L'organizzazione può vendere una varietà di prodotti con lo stesso nome, come "piccola chiave inglese". Il numero dell'articolo sarà sempre univoco per articolo, quindi ciò garantisce l'integrità dell'entità per la tabella delle parti. Se più record avevano lo stesso valore di chiave primaria, facendo riferimento ai dettagli di questa tabella unendola al la tabella delle transazioni causerebbe la duplicazione dei record delle transazioni per corrispondere a ciascun record con lo stesso identificatore.

Integrità referenziale

L'integrità referenziale garantisce che il collegamento tra la tabella delle transazioni e la tabella delle parti sia formato correttamente. Nella tabella delle transazioni, il numero dell'articolo costituisce la chiave esterna, che è l'attributo che si collega alla chiave primaria della tabella delle parti. Solo i numeri di articolo elencati nella tabella delle parti possono essere visualizzati nella tabella delle transazioni. Questa è integrità referenziale. Se la tabella delle transazioni contiene un numero di articolo che non è presente anche nella tabella delle parti, l'unione delle tabelle causerebbe l'esclusione dai risultati delle transazioni con il numero di articolo mancante.