regressionslinjens hældning er et mål for linjens stejlhed.
det er en numerisk værdi, der fortæller os, hvordan to variabler er korreleret. Det fortæller os, hvor meget den afhængige variabel vil ændre sig, hvis der er en ændring i den uafhængige variabel.
der er tre måder at finde hældningen af regressionslinjen for et givet sæt variabler i:
- brug af hældningsfunktionen
- brug af et Scatter chart
i denne vejledning viser jeg dig, hvordan du beregner hældning ved hjælp af hver af de ovennævnte tre metoder.
denne Tutorial dækker:
Hvad er hældning? En oversigt
en hældning er en værdi, der fortæller os, hvordan to værdier (normalt kaldet Y-værdierne) er relateret til hinanden.
for at give dig et simpelt eksempel, hvis du har dataene om nogle menneskers højde og årlige indkomst, og du beregner hældningen for disse data, vil det fortælle dig, om der er en positiv eller negativ sammenhæng mellem disse datapunkter.
hældningsværdien kan være positiv eller negativ.
i vores eksempel, hvis hældningsværdien er 138, hvilket betyder, at der er en positiv sammenhæng mellem højde og indkomst af mennesker. Så hvis højden stiger med 1 centimeter, vil indkomsten sandsynligvis stige med USD 138.
bortset fra skråningen er en anden ting, du har brug for at vide om, aflytningen.
lad mig forklare det med ligningen:
Y = Slope*X + Intercept
i denne ligning har vi allerede beregnet hældningen, men for virkelig at vide, hvad der ville være y-værdien for en given h-værdi, skal du også kende skæringspunktet.
heldigvis har vi også en formel til det, og jeg vil dække, hvordan man beregner intercept i alle metoderne.
Metode 1: Brug af funktionen hældning
den nemmeste måde at beregne hældning på er at bruge den indbyggede hældningsfunktion.
den finder hældningsværdien af et givet sæt af koordinater i et trin.
mens beregning af hældning manuelt kan være svært, med hældningsfunktionen, skal du bare give det h-og y-værdierne, og det gør alt det tunge løft i backend.
syntaks for hældningsfunktion
syntaksen for hældningsfunktionen er:
=SLOPE(y_vals, x_vals)
her består y_vals og h_vals hver af et array eller et celleområde, der indeholder numeriske afhængige dataværdier.
Husk, at du skal angive y-værdierne som det første argument og H-værdierne som det andet argument. Hvis du gør det omvendt, får du stadig resultatet, men det ville være forkert.
Antag, at du har nedenstående datasæt som vist nedenfor, hvor jeg har højden (i cm) som værdier og gennemsnitlig årlig indkomst (i USD) som Y-værdierne.
nedenfor er formlen til beregning af hældning ved hjælp af dette datasæt:
=SLOPE(B2:B11,A2:A11)
ovenstående resultat fortæller mig, at fra dette datasæt kan jeg antage, at hvis højden stiger med 1 cm, vil indkomsten stige med USD 138, 58.
en anden almindelig statistisk værdi, som folk ofte beregner, når de arbejder med hældning, er at beregne Skæringsværdien.
bare for at opdatere er hældningsligningen noget som vist nedenfor:
Y = Slope*X + Intercept
mens vi kender hældningen, er vi også nødt til at kende skæringsværdien for at sikre, at vi kan beregne Y-værdier for enhver h-værdi.
dette kan nemt gøres ved hjælp af nedenstående formel:
=INTERCEPT(B2:B11,A2:A11)
med dette bliver vores ligning for dette datasæt:
Y = 138.56*X + 65803.2
så nu, hvis jeg spørger dig, hvad der ville være indkomsten for enhver, hvis højde er 165 cm, kan du nemt beregne værdien.
Y = 138.56*165 + 65803.2
både hældning og aflytningsværdier kan være positive eller negative
punkter, der skal huskes, når du bruger hældningsfunktionen
her er et par punkter, du skal huske, når du finder hældningen på en regressionslinje ved hjælp af hældningsfunktionen:
- argumenter for hældningsfunktionen skal være numeriske (datoværdier accepteres også). Hvis nogen af cellerne er tomme eller indeholder en tekststreng, vil disse blive ignoreret
- hvis der er ‘ 0 ‘ i en hvilken som helst celle/celler, vil den blive brugt i beregningen
- der skal være et lige antal h-og y-værdier, når de bruges som input til hældningsfunktionen. Hvis du giver det ulige størrelser, får du en #N/A-fejl
- der skal være mere end et sæt punkter, ellers returnerer hældningsfunktionen en # DIV! fejl
Metode 2 – ved hjælp af et Scatter Chart for at få Hældningsværdien
hvis du foretrækker at visualisere dine data og regressionslinjen, kan du plotte dataene i et scatter chart og bruge det til at finde hældningen og skæringspunktet for trendlinjen (også kaldet linjen for bedste pasform).
Antag, at du har datasættet som vist nedenfor, og du vil finde ud af hældningen og aflytningen for disse data:
nedenfor er trinene til at gøre dette:
- Vælg både H-og Y-datapunkter (i vores eksempel ville det være kolonnen højde og indkomst)
- Klik på fanen’ Indsæt ‘i båndet
- Klik på rullemenuen’ Indsæt scatter ‘(under gruppen diagrammer)
- fra rullemenuen, der vises, skal du vælge indstillingen ‘Scatter chart’
- dette vil indsætte et scatter-diagram i dit regneark, der viser dine k-y-værdier som scatter points (som vist nedenfor)
- Højreklik på et af scatter-punkterne, og vælg ‘Tilføj Trendline’ i den kontekstmenu, der vises. Dette vil indsætte trendlinjen og også åbne ruden ‘Format Trendline’ til højre
- i ruden format Trendline skal du markere afkrydsningsfeltet ‘Vis ligning på diagram’ i feltet ‘Trendlinjeindstillinger’
- Luk TH format Trendline rude
ovenstående trin vil indsætte et punktdiagram, der har en tendenslinje, og tendenslinjen har også hældnings-og aflytningsligningen.
i vores eksempel får vi nedenstående ligning:
y = 138.56x + 65803
her:
- 138.56 er hældningen af regressionslinjen
- 65803 er aflytningen af regressionslinjen
du kan sammenligne dette med de værdier, vi fik fra hældnings-og AFLYTNINGSFUNKTIONERNE (det er den samme værdi).
hvis hældningsværdien er positiv, vil du se trendlinjen gå op, og hvis hældningsværdien er negativ, vil du se trendlinjen gå ned. Hældningens stejlhed afhænger af dens hældningsværdi
mens formelmetoden til beregning af hældning og aflytning er let, er fordelen ved at bruge scatter chart-metoden, at du visuelt kan se fordelingen af datapunkterne såvel som regressionslinjens hældning.
og hvis du alligevel opretter et scatter-diagram for dine data, ville det faktisk være hurtigere at få hældningsværdien ved at tilføje en tendenslinje end at bruge formlerne.
så dette er to virkelig enkle måder, du kan bruge til at beregne hældningen og skæringsværdien af et datasæt i udregning.
jeg håber du fandt denne tutorial nyttig.
andre tutorials du kan også lide:
- Sådan tilføjes fejllinjer
- Sådan beregnes standardafvigelsen
Sådan beregnes korrelationskoefficienten