Forskjell mellom lineær og logistisk regresjon: lineær regresjon vs logistisk regresjon

Anonim

Lineær vs logistisk regresjon

I statistisk analyse er det viktig å identifisere forholdet mellom de berørte variablene til studien. Noen ganger kan det være det eneste formålet med selve analysen. Et sterkt verktøy som brukes til å etablere eksistensen av forhold og identifisere forholdet er regresjonsanalyse.

Den enkleste formen for regresjonsanalyse er den lineære regresjonen, der forholdet mellom variablene er et lineært forhold. I statistiske termer bringer det sammen forholdet mellom forklaringsvariabelen og responsvariabelen. Ved hjelp av regresjon kan vi for eksempel fastslå forholdet mellom råvarepris og forbruk basert på data samlet fra et tilfeldig utvalg. Regresjonsanalyse vil produsere en regresjonsfunksjon av datasettet, som er en matematisk modell som best passer til dataene som er tilgjengelige. Dette kan lett bli representert ved en scatterplot. Grafisk regresjon er ekvivalent med å finne den beste tilpasningskurven for det gitte datasettet. Kurvens funksjon er regresjonsfunksjonen. Ved hjelp av matematisk modell kan bruken av en vare forutsies for en gitt pris.

Derfor er regresjonsanalysen mye brukt i å forutse og prognose. Det brukes også til å etablere forholdene i eksperimentelle data, innen fysikk, kjemi og i mange naturvitenskapelige og tekniske disipliner. Hvis forholdet eller regresjonsfunksjonen er en lineær funksjon, er prosessen kjent som en lineær regresjon. I spredningsdiagrammet kan den representeres som en rett linje. Hvis funksjonen ikke er en lineær kombinasjon av parametrene, er regresjonen ikke-lineær.

Logistisk regresjon er sammenlignbar med multivariate regresjon, og den skaper en modell for å forklare virkningen av flere prediktorer på en responsvariabel. I logistisk regresjon bør sluttresultatvariabelen imidlertid være kategorisk (vanligvis delt, for eksempel et par oppnåelige resultater, som død eller overlevelse, men spesielle teknikker gjør det mulig å modellere mer kategorisert informasjon). En kontinuerlig utfallsvariabel kan omdannes til en kategorisk variabel som skal brukes til logistisk regresjon; Imidlertid kollapser kontinuerlige variabler på denne måten for det meste motløs fordi det reduserer nøyaktigheten.

I motsetning til den lineære regresjonen, må det i motsetning til de forutsigende variablene i logistisk regresjon ikke være tvunget til å være lineært forbundet, ofte distribuert eller for å ha lik variasjon inne i hver klynge.Som et resultat er forholdet mellom prediktor- og resultatvariablene ikke sannsynlig en lineær funksjon.

Hva er forskjellen mellom logistisk og lineær regresjon?

• I lineær regresjon antas en lineær sammenheng mellom forklaringsvariabelen og responsvariabelen og parametere som tilfredsstiller modellen, blir funnet ved analyse for å gi det nøyaktige forholdet.

• Linjær regresjon utføres for kvantitative variabler, og den resulterende funksjonen er kvantitativ.

• I logistisk regresjon kan data som brukes enten være kategoriske eller kvantitative, men resultatet er alltid kategorisk.