Forskjell Mellom Semi Join og Bloom Bli med

Anonim

Semi Join vs Bloom Bli med

Semi join og Bloom join er to sammenføyningsmetoder som brukes i spørringsbehandling for distribuerte databaser. Når du behandler spørringer i distribuerte databaser, må data overføres mellom databaser som finnes på forskjellige nettsteder. Dette kan være en dyr operasjon avhengig av mengden data som må overføres. Derfor, når du behandler spørringer i et distribuert databasemiljø, er det viktig å optimalisere spørringene for å minimere mengden data som overføres mellom nettsteder. Semi join og blom join er to metoder som kan brukes til å redusere mengden dataoverføring og utføre effektiv søkbehandling.

Hva er Semi Join?

Semi join er en metode som brukes til effektiv søkbehandling i distribuerte databasemiljøer. Tenk på en situasjon hvor en Medarbeidsdatabase (innehaver informasjon som ansattes navn, avdelingsnummer hun jobber for osv.) Ligger på sitet 1 og en avdelingsdatabase (med informasjon som avdelingsnummer, avdelingsnavn, sted osv.) Plassert på stedet 2. For eksempel hvis vi ønsker å skaffe ansattes navn og avdelingsnavn som hun jobber for (bare av avdelinger som ligger i "New York"), ved å utføre en spørring på en spørringsprosessor som er lokalisert på nettsted 3, finnes det flere måter som data kunne overføres mellom de tre nettstedene for å oppnå denne oppgaven. Men når data overføres, er det viktig å merke seg at det ikke er nødvendig å overføre hele databasen mellom nettstedene. Bare noen av attributter (eller tuples) som kreves for å bli med, må overføres mellom nettstedene for å utføre spørringen effektivt. Semi join er en metode som kan brukes til å redusere mengden data som sendes mellom nettstedene. I semi-tilkobling overføres kun kolonnen for å delta, fra den ene siden til den andre, og den overførte kolonnen brukes til å redusere størrelsen på de sendte forbindelsene mellom de andre nettstedene. For eksempelet ovenfor kan du bare overføre avdelingsnummer og avdelingsnavn til tuples med sted = "New York" fra nettsted 2 til side 1 og utføre tilsluttingen på nettsted 1 og overføre det endelige forholdet tilbake til nettsted 3.

Hva er Bloom Bli med?

Som nevnt tidligere, er blomstrende en annen metode som brukes til å unngå overføring av unødvendige data mellom nettsteder når du utfører spørringer i distribuerte databasemiljøer. I blom bli med, i stedet for å overføre selve kolonnen, overføres en kompakt representasjon av kolonnen til å delta mellom nettstedene. Bloom join bruker et blomst filter som bruker litt vektor til å utføre medlemskap spørringer. For det første, et blomfilter er bygget ved hjelp av kolonnen, og det overføres mellom nettstedene, og deretter blir tilføringsoperasjonene utført.

Hva er forskjellen mellom Semi Join og Bloom Join?

Selv om både semi-join- og blomstrømningsmetoder brukes til å minimere mengden data som overføres mellom nettstedene når du utfører spørringer i et distribuert databasemiljø, blomstrer du sammen, reduserer mengden data (antall tupler) overført i forhold til semi-tilkobling ved å benytte konseptet med blomstringsfiltre, som benytter en liten vektor for å bestemme faste medlemskap. Derfor bruker bruk av blomst bli mer effektiv enn å bruke semi join.