Forskjell mellom data mining og datalagring

Anonim

Data mining vs Data Warehousing

Data Mining og Data Warehousing er begge svært kraftige og populære teknikker for å analysere data. Brukere som er tilbøyelig til statistikk, bruker Data Mining. De benytter statistiske modeller for å lete etter skjulte mønstre i data. Data minearrangører er interessert i å finne nyttige forhold mellom ulike dataelementer, noe som til slutt er lønnsomt for bedrifter. Men på den annen side, data eksperter som kan analysere dimensjoner av virksomheten direkte har en tendens til å bruke Data warehouses.

Data mining er også kjent som Knowledge Discovery in data (KDD). Som nevnt ovenfor er det et felt av datavitenskap, som omhandler utvinning av tidligere ukjente og interessante opplysninger fra rå data. På grunn av den eksponentielle dataveksten, særlig på områder som næringsliv, har datautvinning blitt et svært viktig verktøy for å konvertere denne store mengden data til forretningsinformasjon, da manuell utvinning av mønstre har blitt tilsynelatende umulig de siste tiårene. For eksempel er det for tiden brukt til ulike applikasjoner som sosial nettverksanalyse, bedrageringsdeteksjon og markedsføring. Data mining handler vanligvis om følgende fire oppgaver: clustering, klassifisering, regresjon og forening. Clustering identifiserer like grupper fra ustrukturerte data. Klassifisering er læringsregler som kan brukes på nye data og vil typisk inkludere følgende trinn: forhåndsbehandling av data, utforming av modellering, læring / funksjonsvalg og evaluering / validering. Regresjon er å finne funksjoner med minimal feil på modelldata. Og foreningen ser etter forhold mellom variabler. Data mining brukes vanligvis til å svare på spørsmål som hva er de viktigste produktene som kan bidra til å oppnå høy fortjeneste neste år i Wal-Mart?

Som nevnt ovenfor brukes datalagring også for å analysere data, men av forskjellige sett med brukere og et litt annet mål i tankene. For eksempel, når det gjelder detaljhandel, er data warehousing-brukere mer opptatt av hvilke typer kjøp som er populære blant kundene, så resultatene av analysen kan hjelpe kunden ved å forbedre kundeopplevelsen. Men Data miners første formodning en hypotese som hvilke kunder som kjøper en bestemt type produkt og analyserer dataene for å teste hypotesen. Data warehousing kan utføres av en stor forhandler som i utgangspunktet lager sine butikker med samme størrelser av produkter for senere å finne ut at New York butikker selger mindre størrelsesinventarier mye raskere enn i Chicago butikker. Så, ved å se på dette resultatet, kan forhandleren lagre New York-butikken med mindre størrelser sammenlignet med Chicago-butikker.

Så, som du tydeligvis kan se, synes disse to analysene å være av samme natur for det blotte øye. Begge gjør bekymring for å øke fortjenesten basert på historiske data. Men selvfølgelig er det viktige forskjeller. Enkelt sagt er Data Mining og Data Warehousing dedikert til innredning av ulike typer analyser, men definitivt for ulike typer brukere. Med andre ord ser Data Mining etter korrelasjoner, patters for å støtte en statistisk hypotese. Men Data Warehousing svarer et relativt bredere spørsmål, og det skiver og terninger data derfra og fremover for å gjenkjenne forbedringsmåter i fremtiden.