Vad är dataintegritet?

i denna tid där fler och fler data lagras och produceras än någonsin är det viktigt att integriteten hos våra data bevaras. Tänk att vi har några anställda som arbetar för en MNC. Dessa anställda arbetar för två avdelningar säger försäljning och ekonomi. Båda dessa avdelningar har sina egna databastabeller. Då måste vi lagra rekordet av dessa anställda två gånger? Nej, dataintegritet säger att det inte ska finnas några dubbletter av data i vår databas., Det bör inte finnas någon redundans och våra uppgifter bör vara konsekventa i hela databasen. Men hur kan detta uppnås? Det finns olika dataintegritetsbegränsningar som tillhandahålls av DBMS. Så, låt oss se dem i detalj.

dataintegritet

dataintegriteten har korrekta och korrekta uppgifter i din databas. När vi lagrar data i databasen vill vi inte upprepa värden, vi vill inte ha felaktiga värden eller trasiga relationer mellan tabeller. Så, låt oss förstå genom ett exempel att hur brutna relationer kan orsaka data inkonsekvens.,

Exempel: Låt oss föreställa oss att vi har ett kundregister där vi har två tabeller jag.e ’customer_table'(kund_id, customer_name, purchase_id) och ”purchase_table'(purchase_id, purchhased_item). Dessa två tabeller är relaterade så att om något köp görs av kunden så att data för det köpta objektet kommer att lagras i köparen_table. Så, om vi har ett register över ett inköpt objekt i köparen_table måste det köpet göras av någon kund närvarande i kunden _table., Låt oss nu överväga en situation där inköpstabellen säger att ett objekt köps av en customer_id säger 10 men att customer_id inte existerar i customer_table. Det är inte möjligt att ett köp görs utan kund. En sådan situation kan ha uppstått eftersom kundens data togs bort från customer_table. Så om kundens data tas bort från kundtabellen ska motsvarande data också tas bort från inköpstabellen. Därför måste ändringarna i databasen uppdateras konsekvent för att upprätthålla dataintegriteten.,

dataintegritet kan upprätthållas med hjälp av begränsningar. Dessa begränsningar definierar reglerna enligt vilka operationer som Uppdatering, radering, Infogningar etc. måste utföras för att upprätthålla dataintegriteten. Det finns huvudsakligen fyra typer av dataintegritet:

  1. Domänintegritet
  2. Entitetsintegritet
  3. referensintegritet
  4. användardefinierad integritet

Domänintegritet

domän refererar till intervallet av acceptabla värden. Det hänvisar till intervallet av värden som vi kommer att acceptera och lagra i en viss kolumn i en databas., De datatyper som finns är främst heltal, text, datum etc. Varje post som vi gör för en kolumn ska vara tillgänglig i domänen för datatypen.

exempel: om vi måste lagra lön för de anställda i ”employee_table” kan vi sätta begränsningar för att det bara ska vara ett heltal. Någon annan post än heltal som tecken skulle inte vara acceptabelt och när vi försöker ge input så här, DBMS kommer att producera fel.

Entitetsintegritet

varje rad för en enhet i en tabell ska identifieras unikt, dvs., idf vissa poster sparas i databasen då posten ska identifieras unikt från andra. Detta görs med hjälp av primära nycklar. Entitetsbegränsningen säger att värdet på den primära nyckeln inte ska vara NULL. Om värdet på den primära nyckeln är NULL kan vi inte unikt identifiera raderna om alla andra fält är desamma. Med hjälp av primärnyckel kan vi också unikt identifiera varje post.

exempel: om vi har en kunddatabas och customer_table finns där med attribut som ålder och namn. Då ska varje kund identifieras unikt., Det kan finnas två kunder med samma namn och samma ålder, så det kan finnas förvirring när du hämtar data. Om vi hämtar data från kunden heter ”Angel” sedan två rader har detta namn och det skulle vara förvirring. Så, för att lösa detta problem primära nycklar tilldelas i varje tabell och det unikt identifierar varje post i tabellen.

referensintegritet

referensintegritet används för att upprätthålla datakonsistensen mellan två tabeller., Regler görs i databasstrukturen om hur utländska nycklar ska användas för att säkerställa att ändringar, tillägg och radering i databasen bibehåller dataintegriteten. Referensintegritetsbegränsningarna anger att om en utländsk nyckel i den första tabellen hänvisar till huvudnyckeln i den andra tabellen ska varje värde av utländsk nyckel i den första tabellen antingen vara null eller närvarande i den andra tabellen.

exempel: låt oss anta att vi har två tabeller av studenten(student_id, namn, ålder, course_id) och kurs (course_id, course_name, varaktighet)., Nu, om någon course_id är närvarande i studentbordet som inte finns i kurstabellen så är detta inte tillåtet. Kursen_id i studentbordet ska antingen vara null eller om någon course_id är närvarande i studentbordet så ska den också vara närvarande i kurstabellen. Så här upprätthålls referensintegriteten.

användardefinierad integritet

Ibland är dessa tre integriteter, dvs. domän, referens-och entitetsintegritet, inte tillräckliga för att upprätthålla dataintegriteten., Sådan integritet implementeras vanligtvis genom utlösare och lagrade förfaranden. Triggers är ett block av uttalanden som körs automatiskt om några fördefinierade händelser inträffar.

Exempel1: när någon ny rad infogas i en student_table som har märken av olika ämnen av studenter sedan automatiskt beräknas och lagras också nytt genomsnitt.

Vi kan också definiera vissa användardefinierade begränsningar och specifika affärsregler här.

Exempel2: om vi skapar en tabell för registrering och vi vill att användarens ålder ska vara större än 21., Sådan typ av begränsning ställs in av användaren.

Exempel3: låt oss anta att vi har en employee_table med attribut som emp_id, emp_name, job_name, salary, mobile_no. Här har vi begränsningar som ID för en anställd bör alltid börja med några specifika tecken som ”AfterAcademy” och sedan följt av siffror. Så, någon post som inte följer denna begränsning skulle inte vara acceptabelt.

så idag lärde vi oss om dataintegritet och hur det hjälper till att upprätthålla dataintegriteten. Hoppas du lärde dig något nytt idag.