Valitse tallennustila
Ensimmäinen suunnittelupäätös mille tahansa semanttisille malleille Microsoft Fabric -mallissa on se, miten data virtaa malliin. Valitsemasi tallennustila vaikuttaa kyselyjen suorituskykyyn, datan tuoreuteen ja siihen, mitkä Fabric-ominaisuudet ovat saatavilla. Fabric-versiossa Direct Lake on oletus, ja useimmissa työkuormissa se on oikea valinta.
Direct Lake -tila
Direct Lake on oletustallennustila semanttisille malleille, jotka on luotu Microsoft Fabric:ssa. Toisin kuin tuontitila, Direct Lake ei kopioi dataa malliin. Toisin kuin DirectQuery, se ei käännä kyselyitä lähde-SQL:ksi. Sen sijaan Direct Lake lukee Delta-taulukoita suoraan OneLakesta muistiin, mikä yhdistää tuontinopeuden ja DirectQueryn tuoreuden.
Kun käyttäjä avaa raportin, jonka taustalla on Direct Lake -semanttinen malli, moottori lataa sarakkeet Delta Parquetin tiedostoista pyynnöstä. Sinun ei tarvitse ajoittaa päivitystä, kuten Import-tilassa. Kun taustalla olevat Delta-taulukot päivittyvät, malli heijastaa näitä muutoksia.
Direct Lake -mallit ottavat automaattisesti käyttöön suuren semanttisen mallin tallennusmuodon. Tämä asetus poistaa 10 GB:n mallikokorajan ja on edellytys sekä kyselyn skaalaus- että XMLA-päätepisteen luku-/kirjoituskäytölle. Direct Lake -malleissa sitä ei tarvitse ottaa manuaalisesti käyttöön.
Suorat yhteysvaihtoehdot järvelle
Direct Lake -mallit voivat yhdistää dataan kahdella reitillä:
- OneLake-taulukot: Malli yhdistyy suoraan Delta-pöydiin järvenrakennuksessa tai varastossa. Tämä on yksinkertaisin reitti ja toimii hyvin, kun tietosi ovat yhdessä Fabric-tietovarastossa.
- SQL-analytiikan päätepiste: Malli yhdistyy järvenrakennuksen tai varaston SQL-päätepisteen kautta. Tämä reitti mahdollistaa pääsyn näkymiin, tietokantojen välisiin kyselyihin ja SQL-kerroksessa määriteltyihin tietoturvaominaisuuksiin.
Valitse OneLake-taulukot, kun tietosi ovat yksinkertaisia ja yhdessä paikassa. Valitse SQL-analytiikan päätepiste, kun tarvitset näkymiä, ristiinlähteiden liitoksia tai SQL:ssä määriteltyä rivitason tietoturvaa.
Varatoiminto
Jotkut toiminnot voivat saada Direct Lake -mallin palaamaan DirectQuery-tilaan. Monimutkaiset DAX-laskelmat, muistin ylittävät kyselyt tai tietyt tuettomat toiminnot laukaisevat tämän varasuunnitelman. Kun varajärjestelmä tapahtuu, kysely ajetaan SQL-analytiikan päätepistettä vastaan sen sijaan, että Delta-tiedostoja luettaisiin suoraan.
Voit konfiguroida varasuunnitelman käyttäytymisen semanttisen mallin asetuksissa:
- Varajärjestelmä: Kyselyt, jotka eivät voi suorittaa Direct Lake -tilassa, palaavat automaattisesti DirectQueryyn. Käyttäjä saa tuloksia, mutta suorituskyky saattaa heikentyä.
- Peruutus: Kyselyt, joita ei voi suorittaa Direct Lake -tilassa, palauttavat virheen. Tämä vaihtoehto varmistaa johdonmukaisen suorituskyvyn, mutta vaatii, että kaikki kyselyt pysyvät Direct Laken ominaisuuksien sisällä.
Useimmissa tuotantokuormissa aloita varajärjestelmästä ja seuraa, mitkä kyselyt laukaisevat sen. Optimoi sitten kyselyt tai tietorakenteet, jotta varasuunnitelman määrä vähenee ajan myötä.
Tuontitila
Tuontitila kopioi tiedot semanttiseen malliin ja tallentaa sen pakattuun, muistiin. Kyselyt suoritetaan paikallista kopiota vastaan, mikä tekee tuonnista nopeimman tallennustilan kyselyjen suorituskyvyssä. Kuitenkin data on ajantasaista vain viimeisimmän päivityksen verran.
Tuontitila on oikea valinta, kun:
- Tietolähteesi on Fabric:n ulkopuolella (paikalliset tietokannat, kolmannen osapuolen rajapinnat, litteät tiedostot).
- Kyselyn suorituskyky on ykkösprioriteetti, eikä lähes reaaliaikaista tuoreutta tarvita.
- Tarvitset ominaisuuksia, joita Direct Lake ei vielä tue.
Vinkki
Kun käytät Import-tilaa, yhdistä näkymiin raakataulukoiden sijaan, sisällytä vain tarvittavat sarakkeet ja käytä sopivia tietotyyppejä mallin koon pienentämiseksi. Lue lisää tekniikoista, joilla voidaan vähentää Import-malleihin ladattua dataa.
DirectQuery-tila
DirectQuery lähettää kyselyt suoraan tietolähteelle kyselyn aikana. Malliin ei tallenneta mitään dataa, mikä tekee DirectQuerystä sopivan reaaliaikaisiin datatilanteisiin ja erittäin suuriin tietoaineistoihin, joita ei voi tuoda.
Vaihtokauppana on suorituskyky. Jokainen raporttivuorovaikutus luo kyselyn lähdejärjestelmää vastaan. DirectQuery toimii parhaiten, kun:
- Reaaliaikaista dataa tarvitaan, eikä edes lyhyet päivitysviiveet ole hyväksyttäviä.
- Lähdedatavolyymit ovat liian suuria tuotavaksi, ja tietolähde on Fabric:n ulkopuolella.
- Hallintovaatimukset edellyttävät, että data pysyy lähteessä.
Vinkki
Lisätietoja löytyy DirectQuery-malliohjeistuksesta.
Yhdistelmätila
Yhdistelmätila yhdistää tallennustilat yhden mallin sisällä. Jotkut taulut käyttävät Importia, kun taas toiset käyttävät DirectQueryä tai Direct Lakea. Tämä tarjoaa joustavuutta tilanteisiin, joissa eri pöydillä on erilaiset suorituskyky- ja tuoreustarpeet.
Esimerkiksi suuri faktataulu voi pysyä Direct Lakessa, kun taas pieni viitetaulu ulkoisesta lähteestä käyttää Importia. Yhdistelmätila mahdollistaa myös monesta moneen -suhteet eri tietolähteiden taulujen välillä.
Käytä komposiittitilaa, kun:
- Tarvitset dataa sekä Fabric- että ei-Fabric-lähteistä samassa mallissa.
- Jotkut taulut vaativat reaaliaikaista dataa, kun taas toiset hyötyvät välimuistisuorituskyvystä.
- Sinun täytyy yhdistää Direct Lake -taulukot Import-tauluihin ristiinlähteiden analysointia varten.
Valitse oikea tallennustila
Seuraava taulukko tiivistää, milloin kukin tila valitaan:
| Menetelmä | Tietojen sijainti | Kyselynopeus | Tietojen tuoreus | Sopii parhaiten |
|---|---|---|---|---|
| Direct Lake | OneLake (Delta-taulukot) | Nopea | Lähes reaaliaikainen | Fabric-natiivityökuormat (oletus) |
| Tuonti | Mallin sisäinen välimuisti | Nopeimmin | Virkistykseen perustuva | Non-Fabric sources, maksimisuorituskyky |
| DirectQuery | Lähdejärjestelmä | Riippuu lähdejärjestelmästä | Lähes reaaliaikainen | Reaaliaikaiset vaatimukset, erittäin suuret ulkoiset tiedot |
| Mykerökukkainen | Yhdistelmä | Vaihtelee | Yhdistelmä | Ristiinlähtöiset skenaariot, hybridivaatimukset |
Tallennustila vaikuttaa myös tekoälyn kulutukseen. Kun Copilot tai dataagentit kysyvät semanttista mallia, ne vastaavat sen perusteella, mitä dataa malli tällä hetkellä heijastaa. Direct Laken lähes reaaliaikainen tuoreus tarkoittaa, että tekoälykyselyt palauttavat ajantasaiset tulokset odottamatta aikataulutettua päivitystä. Malleissa, jotka palvelevat sekä ihmisiä että tekoälyä, tallennustilan valinta vaikuttaa suoraan molempien kokemusten laatuun.
Fabric:ssa aloita Direct Lakesta. Siirry toiseen tilaan vain, kun juuri sinun skenaariosi sitä vaatii.