Sådan beregnes resterende variation

Indholdsfortegnelse:

Anonim

Investorer bruger modeller for bevægelsen af ​​aktivpriserne til at forudsige, hvor prisen på en investering vil være på et givet tidspunkt. De metoder, der bruges til at fremsætte disse forudsigelser, er en del af et felt i statistik kendt som regressions analyse. Beregningen af restvariation af et sæt værdier er et regressionsanalyseværktøj, der måler, hvor præcist modelens forudsigelser matcher de faktiske værdier.

Regression Line

Det regressionslinje viser, hvordan aktivets værdi er ændret som følge af ændringer i forskellige variabler. Også kendt som a trendlinie, viser regressionslinjen "trend" af aktivets pris. Regressionslinjen er repræsenteret af en lineær ligning:

Y = a + bX

hvor "Y" er aktivværdien, "a" er en konstant, "b" er en multiplikator og "X" er en variabel relateret til aktivværdien.

For eksempel, hvis modellen forudser at et et-værelses hus sælger til $ 300.000, sælger et toværelses hus for $ 400.000, og et tre-værelses hus sælger for $ 500.000, vil regressionslinjen ligne:

Y = 200.000 + 100.000X

hvor "Y" er hjemmeens salgspris og "X" er antallet af soveværelser.

Y = 200.000 + 100.000 (1) = 300.000

Y = 200.000 + 100.000 (2) = 400.000

Y = 200.000 + 100.000 (3) = 500.000

Scatterplot

EN scatterplot viser de punkter, der repræsenterer de faktiske korrelationer mellem aktivværdien og variablen. Udtrykket "scatterplot" stammer fra det faktum, at når disse punkter er tegnet på en graf, synes de at være "spredt" rundt i stedet for at ligge perfekt på regressionslinjen. Ved hjælp af ovenstående eksempel kunne vi få en scatterplot med disse datapunkter:

Punkt 1: 1BR solgt til 288.000 dollar

Punkt 2: 1BR solgt til $ 315.000

Punkt 3: 2BR solgt til $ 395.000

Punkt 4: 2BR solgt til $ 410.000

Punkt 5: 3BR solgt til $ 492.000

Punkt 6: 3BR solgt til $ 507.000

Restvariantberegning

Den resterende variansberegning starter med summen af ​​kvadrater af forskelle mellem aktivets værdi på regressionslinjen og hver tilsvarende aktivværdi på scatterplot.

Firkanterne af forskellene er vist her:

Punkt 1: $ 288.000 - $ 300.000 = (- $ 12.000); (-12.000)2 = 144,000,000

Punkt 2: $ 315.000 - $ 300.000 = (+ $ 15.000); (15 tusind)2 = 225,000,000

Punkt 3: $ 395.000 - $ 400.000 = (- $ 5.000); (-5000)2 = 25,000,000

Punkt 4: $ 410.000 - $ 400.000 = (+ $ 10.000); (10 tusind)2 = 100,000,000

Punkt 5: $ 492.000 - $ 500.000 = (- $ 8.000); (-8000)2 = 64,000,000

Punkt 6: $ 507.000 - $ 500.000 = (+ $ 7.000); (7000)2 = 49,000,000

Summen af ​​kvadraterne = 607,000,000

Den resterende varians findes ved at tage summen af ​​kvadraterne og dividere den med (n-2), hvor "n" er antallet af datapunkter på scatterplot.

RV = 607.000.000 / (6-2) = 607.000.000 / 4 = 151.750.000.

Anvendes til restvariation

Selvom hvert punkt på scatterplot ikke passer perfekt til regressionslinjen, vil en stabil model have scatterplot-punkterne i en regelmæssig fordeling omkring regressionslinjen. Resterende varians er også kendt som "fejlvariation." En høj restvariant viser, at regressionslinjen i den oprindelige model kan være i fejl. Nogle regnearkfunktioner kan vise processen bag oprettelsen af ​​en regressionslinie, der passer tættere på scatterplot-dataene.