Mikä on graafitietokanta?

Note

Tämä ominaisuus on tällä hetkellä julkisessa esikatselussa. Tämä esikatselu tarjotaan ilman palvelutasosopimusta, eikä sitä suositella tuotantokuormituksiin. Tiettyjä ominaisuuksia ei ehkä tueta tai niiden ominaisuudet voivat olla rajoitettuja. Lisätietoja löytyy Supplemental Terms of Use for Microsoft Azure Previews.

Graafitietokanta on tietokantatyyppi, joka esittää tiedon solmuina (entiteetteinä) ja reunoina (suhteina) taulukoiden ja rivien sijaan. Tämä rakenne tekee monimutkaisten yhteyksien ja kuvioiden tutkimisesta datassasi helppoa.

Yleisimmin käytetty graafitietokantatyyppi toteuttaa merkityn ominaisuusgraafin (LPG) mallin: entiteetit (solmut) ja suhteet (reunat) voivat olla tunnisteilla ja ominaisuuksilla (avain-arvoparit). Tämä joustava malli mahdollistaa sekä skeema-vapaaehtoiset että skeemapohjaiset suunnittelut, ja sen avulla voit ilmaista monimutkaisia suhteita. Koska yhteydet tallennetaan eksplisiittisesti reunoina, kyselyt kulkevat suhteiden läpi seuraamalla reunoja sen sijaan, että ne laskeisivat kalliita liitoksia kyselyn aikana.

Note

Tämän artikkelin esimerkit käyttävät sosiaalisen verkoston esimerkkikaaviodatasettiä.

Kaaviotietokannan ydinkäsitteet

Graafitietokanta järjestää datan kolmeen perustavanlaatuiseen rakennuspalikkaan:

  • Solmut edustavat entiteettejä, kuten ihmisiä, tuotteita tai paikkoja. Solmuilla voi olla otsikoita ja ominaisuuksia, jotka kuvaavat niiden määritteitä. Esimerkiksi Person solmulla voi olla ominaisuuksia kuten firstName, lastName, ja age.
  • Reunat kuvaavat, miten entiteetit ovat yhteydessä toisiinsa, esimerkiksi FRIENDS_WITH, PURCHASED, tai LOCATED_IN. Reunat voivat myös kantaa ominaisuuksia ja tunnisteita suhteiden metatietojen keräämiseksi.
  • Ominaisuudet liittävät tietoja solmuihin ja reunoihin (esimerkiksi henkilön nimi tai reunan päivämäärä).

Miten suhteiden kysely toimii?

Kaaviokyselyt hakevat yhdistettyä tietoa kulkemalla aloitussolmusta naapureilleen, sitten naapureilleen ja niin edelleen. Läpikäynnin hinta riippuu siitä, kuinka monta reunaa se koskettaa (paikallinen naapurusto), ei aineiston kokonaiskoosta. Tämä ominaisuus tekee kysymyksistä poluista, yhteyksistä ja kaavoista – kuten ystävien ystävistä, lyhyimmistä poluista tai monihyppäisriippuvuuksista – luonnollisia ja tehokkaita ilmaista.

Graafitietokannat käyttävät kaavapohjaisia kyselykieliä, kuten Graph Query Language (GQL), kuvaamaan näitä kulkuja tiiviisti. Sama kansainvälinen työryhmä, joka valvoo SQL:ää (ISO/IEC 39075), standardoi GQL:ää, mikä sovittaa graafikyselyt vakiintuneisiin tietokantastandardeihin.

Esimerkki (kuvion yhteensopivuus GQL:n kanssa):

MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100

Tämä kuvio kuuluu näin: aloitetaan Annemarien Person-solmusta, seuraa :knows reunoja jokaiseen ystäväsolmuun ja seuraa :likes reunoja liittyviin :Comment solmuihin. Palauta 100 uusinta näistä kommenteista niiden luomispäivän mukaan.

Tekoälyavusteinen graafipäättely (esikatselu)

Graafitietokannat sopivat luonnollisesti tekoälypäättelyyn, koska ne koodaavat ne suhteet, joita kielimallit tarvitsevat vastatakseen monihyppäisiin kysymyksiin tarkasti. Vuonna Microsoft Fabric Fabric Data Agent tukee graafia tietolähteenä, mahdollistaen käyttäjien kysyä luonnollisen kielen kysymyksiä, joihin agentti vastaa kysymällä graafia. Lisätietoja siitä, miten NL2GQL kääntää luonnollisen kielen GQL:ksi, löydät Graph-powered AI -päättelyilmoituksesta.

Graafidatamalli ja skeeman joustavuus

Graafidatamallit ovat skeema-valinnaisia: voit aloittaa joustavasta mallista ja formalisoida sen ajan myötä. Microsoft Fabric -kaaviossa rakenteelliset muutokset — kuten uusien ominaisuuksien lisääminen, etikettien muokkaaminen tai suhdetyyppien muuttaminen — vaativat tällä hetkellä datan uudelleenkäsittelyä uuteen malliin. Tämä lähestymistapa vähentää tietojen päällekkäisyyden tarvetta ja antaa tiimeille mahdollisuuden yhdistää tietoja useista lähteistä ilman raskasta etukäteissuunnittelua. Lisätietoja Microsoft Fabric:n graafissa käytetystä tietomallista löytyy kohdasta Merkityt ominaisuusgraafit.

Kaaviotietokantojen yleiset käyttötarkoitukset

Graafitietokannat ovat tiiviisti linjassa niiden domainien kanssa, joilla yhteydet tuottavat arvoa, kuten:

  • Sosiaaliset verkostot — mallintavat ihmisten välisiä suhteita ja heidän vuorovaikutustaan
  • Tietograafit — yhdistävät käsitteitä, entiteettejä ja faktoja semanttista hakua ja päättelyä varten
  • Suositusjärjestelmät — käy läpi käyttäjän ja esineiden vuorovaikutuksia tuodaksesi esiin personoituja ehdotuksia
  • Petosten ja riskien verkostot — havaitse epäilyttäviä kuvioita tilien, tapahtumien ja laitteiden välillä
  • Verkko- ja IT-topologia — kartoita riippuvuuksia palvelimien, palveluiden ja infrastruktuurikomponenttien välillä
  • Toimitusketjun riippuvuusanalyysi — jäljitetään komponenttien alkuperää ja suhteita toimittajien välillä
  • Graafipohjainen haku-augmentoitu generointi (RAG) — käytä graafirakennetta tiedonlähteenä tekoälyagenteille, jotka tarvitsevat monihyppypäättelyä ja selitettäviä, maanläheisiä vastauksia

Näissä skenaarioissa kysymykset eivät koske niinkään yksittäisiä tietueita vaan enemmän sitä, kuinka monta entiteettiä liittyy ja on vuorovaikutuksessa useiden hyppyjen aikana.

Milloin kannattaa harkita kaaviotietokantaa

Graafitietokanta sopii hyvin, kun ihmissuhteet ohjaavat ydinkysymyksiä, joihin sinun täytyy vastata. Valitse graafitietokanta, kun:

  • Pääkysymyksesi liittyvät polkuihin, naapurustoihin ja kuvioihin yhdistetyssä datassa.
  • Humalan määrä vaihtelee tai ei ole etukäteen tiedossa.
  • Sinun täytyy yhdistää ja navigoida suhteita eri tietoaineistojen välillä.

Jos kysyt tällaisia kysymyksiä säännöllisesti, graafimalli sopii luonnollisesti.

Miten graafi Microsoft Fabric vertautuu itsenäisiin graafitietokantoihin

Datan esittäminen graafina ja sen tallentaminen erilliseen, itsenäiseen graafitietokantaan tuo usein mukanaan ETL:n (extract, transform, load) ja hallinnon ylikuormitusta. Sen sijaan Microsoft Fabric -kaavio toimii suoraan OneLakessa, mikä vähentää tai poistaa tarpeen erillisille ETL-putkistoille ja datan päällekkäisyyksille. Harkitse näitä kompromisseja:

  • Datan siirto ja päällekkäisyys: Itsenäiset graafitietokannat vaativat tyypillisesti datan poimimisen, muuntamisen ja lataamisen erilliseen tallennustilaan, mikä lisää monimutkaisuutta ja voi johtaa päällekkäisiin tietoaineistoihin. Graph toimii OneLakella, joten voit mallintaa ja kysyä yhdistettyä dataa ilman, että sitä siirretään.
  • Käyttökustannukset: Erilliset kaaviopinot toimivat erillisinä klustereina tai palveluina, ja niihin liittyy usein käyttämättömyysmaksuja. Graafissa työkuormat käyttävät yhdistettyjä kapasiteettiyksiköitä (CU) automaattisilla skaalaus- ja keskitetyillä mittareilla, mikä yksinkertaistaa toimintaa ja voi alentaa kustannuksia.
  • Skaalautuvuus: Jotkin erilliset kaaviotietokannat ovat riippuvaisia skaalauksesta tai toimittajakohtaisesta klusteroinnista. Graph on suunniteltu laajamittaisille graafeille ja käyttää skaalautuvaa shardingia useiden työntekijöiden kesken hallitakseen suurten datakuormien tehokkaasti.
  • Työkalut ja taidot: Toimittajakohtaiset graafijärjestelmät voivat vaatia erikoistuneita kieliä ja erillisiä analytiikkakehyksiä. Graph tarjoaa yhtenäisen mallinnuksen, standardeihin perustuvan kyselyn (GQL), sisäänrakennetut graafianalytiikkaalgoritmit, BI- ja tekoälyintegraation, mukaan lukien Fabric Data Agent tuen luonnollisen kielen graafikyselyille (esikatselu) sekä low/no code -tutkimustyökalut. Nämä ominaisuudet mahdollistavat laajemman käyttäjäjoukon työskentelyn yhdistetyn datan kanssa.
  • Hallinto ja turvallisuus: Erilliset graafien käyttöönotot vaativat itsenäisiä hallinta- ja turvallisuusratkaisuja. Graph käyttää OneLake-hallintaa, linjausta ja työtilan roolipohjaista käyttöoikeuksien hallintaa (RBAC), joten vaatimustenmukaisuus, auditointi ja käyttöoikeudet pysyvät yhdenmukaisina muun Fabric-ympäristösi kanssa.