nykypäivän artikkelissa haluan haluan keskittyä Hitaasti muuttuva dimensio, eli SCD. Ulottuvuus on sana, joka on otettu sellaisenaan tietovarastoinnista. Ei ilman syytä SCD käytetään hyvin usein termit Data Warehouse (DW) aiheet ja voidaan käyttää audit tarkoituksiin OLTP-järjestelmät.

artikkelin tavoitteena on tarkastella hitaasti muuttuvan ulottuvuuden tyyppejä, koska niistä on vain vähän versiota.

TIEDOT muuttuvat ajan myötä., Et ehkä välitä historiallisesta versiosta OLTP-tietokannassasi, mutta se voi olla liiketoiminnan vaatimus kaikkien historiallisten muutosten säilyttämiseksi. Toisin sanoen myyntiraportissa pitää pystyä näyttämään myyntihenkilön oikea aluetoimisto riippumatta siitä, milloin henkilö on muuttanut aluetta. Tällöin tiedot on säilytettävä ennen muutosta ja päivityksen jälkeen.

miten transformaatiot toimivat?

SCD-tyyppejä on vähän.

SCD-tyypistä riippuen rivejä ei voi pitää yhtäkään, yhtä tai useampaa historiallista muutosta.,
idea on yksinkertainen: aina kun rivi muuttuu, SCD-taulukossa säilytetään rivistä vanha versio (ennen päivitystä tai poistoa).
näiden asioiden toteuttaminen ei ole aina helppoa. Katsotaanpa esimerkkejä.

esimerkkinä lähde tietoja aion käyttää seuraavat tiedot rivi:

SCD Lähde tiedot esimerkki

yllä olevassa esimerkissä, CustomerId on Perusavaimena lähde (OLTP) tietokantaan.,
esittelemme surrogate key (CustomerKey) DW, välttää päällekkäistä alkuperäinen CustomerId ja optimoida suorituskykyä, varsinkin kun lähde-järjestelmä käyttää merkin tai monimutkainen avaimet.

SCD tiedot tietovarastoon, esimerkiksi

SCD-Tyyppi 0

Tämä tyyppi ei pidä mitään muutoksia ominaisuuksia. Se pitää vain alkuperäisen arvon ilman muutoksia. Sitä käytettiin pääasiassa attribuutteihin, joita ei voi muuttaa, kuten BirthDate.,

SCD-Tyyppi 1: korvataanko historia ominaisuus

Tämä menetelmä voi seurata muutoksia tietoihin, ja korvaa vanhat tiedot uusilla. Kun asiakas muuttaa hänen osoite, uusi osoite korvaa:

SCD Tyypin 1

Kuten näette – se on hyvin yksinkertainen toteuttaa ja ylläpitää prosessi – se on yksinkertaista päivittää. Toisissa käsissä tämän lähestymistavan haittapuolena on row ’ n historian puute tietovarastossa.,

SCD Type 2: uusien rivien lisääminen

menetelmä säilyttää historian lisäämällä uusia rivejä, eikä säilytysmuutosten määrälle ole ylärajaa.,iv id=”f3da287bb9″>

SCD Tyypin 2

Lisäksi voit päättää, millä tavoin haluat tietää, vanhempi krs säilyttää nykyinen lippu sarake-ja/tai UpdateDate:

SCD-Tyyppi 2, jossa nykyinen lippu

versio rivi, joka lisätään peräkkäin:

SCD Tyypin 2 versio

SCD-Tyyppi 3: muita historiallisia sarakkeita

tässä lähestymistavassa voit hallita rajallinen määrä historiaa lisäämällä ylimääräisiä sarakkeita seuranta ominaisuuksia.,
haluat olla edellinen ja nykyinen kaupunki asiakas voit toteuttaa sarakkeet: PreviousCity ja CurrentCity. Siellä on vain yksi rivi Data Warehouse (DW) kohden lähde tietokanta siksi Tyyppi 3 on rajoitettu käytettävyys ja on vähemmän suosittu kuin Tyypin 1 ja 2.

SCD-Tyyppi 3

Sinun täytyy olla varovainen jos haluat käyttää Tyypin 3 SCD. Varmista, että yritysanalyytikko ja/tai asiakas ovat tietoisia historian rajoituksista.,

SCD-Tyyppi 4: Erillinen historiallinen taulukko

Tämä tyyppi käyttää erillistä taulukkoa pitää nykyinen kirjaa ja historiallisia muutoksia. Se kannattaa käyttää, kun:
• Dimension on muuttumassa melko usein tai
• Dimension on multi-miljoonaa riviä taulukossa

SCD Tyyppi 4 nykyinen taulukko

SCD-Tyyppi 4 – historiallinen taulukko

Marjorie Ross alkaen Kimball Group kutsuu tällaisia taulukoita kuin ”mini-ulottuvuus”.,

SCD-Tyyppi 6:

Tämä lähestymistapa on numeroitu 6 1+2+3=6 sekä 1x2x3=6. Siksi se on yhdistelmä näitä kolmea tyyppiä:
• Pidä molemmat aiemmat ja nykyiset arvot määrite (kuten Tyyppi 3, katso saraketta: ”HistoricCity”, ”CurrentCity”)
• Ohittaa kaikki ennätykset nykyisen version ominaisuus (kuten Tyyppi 1, katso sarake ”CurrentCity”)
• Pitää historiallinen versio ominaisuus (kuten Tyyppi 2, näyttää yhtä saraketta: ”IsCurrent”, ”StartDate”, ”Lopetuspäivä”)
katsotaanpa, miten row on muuttunut ja miten sen vaikutusta DW., Ensimmäinen lastaus rivin:

SCD-Tyyppi 6 (vaihe 1)

Rivit DW: n Asiakas-taulukossa seuraavat ensimmäisen asiakkaan siirtäminen:

SCD-Tyyppi 6 (vaihe 2)

Rivit DW: n Asiakas-taulukko lisätään toinen asiakas siirtäminen:

SCD-Tyyppi 6 (vaihe 3)

Minkä Tyyppinen minun pitäisi valita?,

Koska ammatillinen konsultti vastaan ammattimaisesti:

Se ei riipu

Pyydä liiketoiminnan joukkue, business analytics tai asiakkaan: Mitä he tarvitsevat tietovarasto.
ehkä en sanonut sitä tarpeeksi kovaa, mutta samassa taulukossa voit soveltaa eri SCD-tyyppejä jokaiseen sarakkeeseen.
esimerkiksi: Kaupunkikolonnin tyyppi 2, Syntymäpalstan tyyppi 1. Kaikki samassa pöydässä.
Kysy siis heiltä jokaista ulottuvuutta:
* mitkä attribuutit ovat vakio,
* mitkä attribuutit ovat muuttujia?,r• * mitkä attribuutit tulisi täysin seurata, minkä tulisi pitää vain edellinen ja nykyinen versio?
* kuinka monta riviä on taulukossa juuri nyt / odotetaan seuraavan 10 vuoden aikana?
pidä nämä vastaukset todisteena. Ihmiset, erityisesti asiakkaat, haluavat muuttaa mielensä. Tiedät, mitä tarkoitan.
Jos et vieläkään ole varma, kumpi valitaan, muista, että:

Pitää historian muutokset ovat hyviä teitä

Yksinkertaisesti siksi, että vaatimukset voivat muuttua.
tyyppien 0 ja 1 Lisäksi suosituimpia ovat mielestäni Type 2 ja Type 4.

miten tiedot ladataan SCD: hen?,

hyvä kysymys. Mutta tämä aihe on täysin eri juttu.
Ennen valmistella seuraava viesti noin se on – katso tästä työkalu:
SCD-Merge Wizard
työkalun avulla voit luoda, hallita ja huolto-kartoitus lähde tietokanta (esim. lavastus) ja kohde tietokanta (Data Warehouse). Lisäksi tämän lähestymistavan avulla voit käyttää YHDISTÄMISTILAUSUMAA suorittaaksesi lataustoimintoja määritetyllä SCD-tyypillä kunkin sarakkeen osalta.
edelleen virkaa, aion selittää, miten soveltaa eri SCD tyypit tässä työkalussa.

Good luck with your loadings,
Kamil