Forskjell mellom klassifisering og regresjon

Anonim

Klassifisering mot regresjon

Klassifisering og regresjon er læringsteknikker for å lage modeller av prediksjon fra samlede data. Begge teknikkene presenteres grafisk som klassifikasjons- og regresjonstrær, eller heller flytskjemaer med dataavdelinger etter hvert trinn, eller rettere "gren" i treet. Denne prosessen kalles rekursiv partisjonering.

Klassifisering

Klassifisering er en teknikk som brukes til å komme frem til et skjema som viser organisering av data som starter med en forløpervariabel. De avhengige variablene er hva som klassifiserer dataene i grupper. Klassifiseringstreet starter med den uavhengige variabelen, som forgrener seg i to grupper som bestemt av de eksisterende avhengige variablene. Det er ment å belyse svarene i form av kategorisering forårsaket av de avhengige variablene.

Regresjon

Regresjon er en prediksjonsmetode som er basert på en antatt eller kjent numerisk utgangsverdi. Denne utgangsverdien er resultatet av en serie rekursiv partisjonering, hvor hvert trinn har en numerisk verdi og en annen gruppe avhengige variabler som forgrener seg til et annet par slik som dette. Regresjonstreet starter med en eller flere forløpervariabler, og slutter med en sluttutgangsvariabel. De avhengige variablene er enten kontinuerlige eller diskrete numeriske variabler.

Hva er forskjellen mellom klassifisering og regresjon? Hovedforskjellen mellom klassifiseringstreet og regresjonstreet er deres avhengige variabel. For klassifiseringstreet er de avhengige variablene kategoriske, mens regresjonstreet har numeriske avhengige variabler. De av klassifiseringstreet har også en mengde uordnede verdier, mens de i regresjonstreet har enten diskrete, men likevel bestilte verdier eller indiskrete verdier. Et regresjonstrær er konstruert med det formål å tilpasse et regresjonssystem til hver determinant gren på en måte som den forventede utgangsverdien kommer opp. På den annen side grener et klassifiseringstreet ut som bestemt av en avhengig variabel avledet fra den forrige noden.

Regressions- og klassifiseringstrener er nyttige teknikker for å kartlegge prosessen som peker på et studert utfall, enten i klassifisering eller en enkelt numerisk verdi.

Kort sagt:

• Klassifiseringstrender har avhengige variabler som er kategoriske og uordnede.

• Regressetrær har avhengige variabler som er kontinuerlige verdier eller bestilte hele verdier.