Investorer bruger modeller for bevægelsen af aktivpriserne til at forudsige, hvor prisen på en investering vil være på et givet tidspunkt. De metoder, der bruges til at fremsætte disse forudsigelser, er en del af et felt i statistik kendt som regressions analyse. Beregningen af restvariation af et sæt værdier er et regressionsanalyseværktøj, der måler, hvor præcist modelens forudsigelser matcher de faktiske værdier.
Regression Line
Det regressionslinje viser, hvordan aktivets værdi er ændret som følge af ændringer i forskellige variabler. Også kendt som a trendlinie, viser regressionslinjen "trend" af aktivets pris. Regressionslinjen er repræsenteret af en lineær ligning:
Y = a + bX
hvor "Y" er aktivværdien, "a" er en konstant, "b" er en multiplikator og "X" er en variabel relateret til aktivværdien.
For eksempel, hvis modellen forudser at et et-værelses hus sælger til $ 300.000, sælger et toværelses hus for $ 400.000, og et tre-værelses hus sælger for $ 500.000, vil regressionslinjen ligne:
Y = 200.000 + 100.000X
hvor "Y" er hjemmeens salgspris og "X" er antallet af soveværelser.
Y = 200.000 + 100.000 (1) = 300.000
Y = 200.000 + 100.000 (2) = 400.000
Y = 200.000 + 100.000 (3) = 500.000
Scatterplot
EN scatterplot viser de punkter, der repræsenterer de faktiske korrelationer mellem aktivværdien og variablen. Udtrykket "scatterplot" stammer fra det faktum, at når disse punkter er tegnet på en graf, synes de at være "spredt" rundt i stedet for at ligge perfekt på regressionslinjen. Ved hjælp af ovenstående eksempel kunne vi få en scatterplot med disse datapunkter:
Punkt 1: 1BR solgt til 288.000 dollar
Punkt 2: 1BR solgt til $ 315.000
Punkt 3: 2BR solgt til $ 395.000
Punkt 4: 2BR solgt til $ 410.000
Punkt 5: 3BR solgt til $ 492.000
Punkt 6: 3BR solgt til $ 507.000
Restvariantberegning
Den resterende variansberegning starter med summen af kvadrater af forskelle mellem aktivets værdi på regressionslinjen og hver tilsvarende aktivværdi på scatterplot.
Firkanterne af forskellene er vist her:
Punkt 1: $ 288.000 - $ 300.000 = (- $ 12.000); (-12.000)2 = 144,000,000
Punkt 2: $ 315.000 - $ 300.000 = (+ $ 15.000); (15 tusind)2 = 225,000,000
Punkt 3: $ 395.000 - $ 400.000 = (- $ 5.000); (-5000)2 = 25,000,000
Punkt 4: $ 410.000 - $ 400.000 = (+ $ 10.000); (10 tusind)2 = 100,000,000
Punkt 5: $ 492.000 - $ 500.000 = (- $ 8.000); (-8000)2 = 64,000,000
Punkt 6: $ 507.000 - $ 500.000 = (+ $ 7.000); (7000)2 = 49,000,000
Summen af kvadraterne = 607,000,000
Den resterende varians findes ved at tage summen af kvadraterne og dividere den med (n-2), hvor "n" er antallet af datapunkter på scatterplot.
RV = 607.000.000 / (6-2) = 607.000.000 / 4 = 151.750.000.
Anvendes til restvariation
Selvom hvert punkt på scatterplot ikke passer perfekt til regressionslinjen, vil en stabil model have scatterplot-punkterne i en regelmæssig fordeling omkring regressionslinjen. Resterende varians er også kendt som "fejlvariation." En høj restvariant viser, at regressionslinjen i den oprindelige model kan være i fejl. Nogle regnearkfunktioner kan vise processen bag oprettelsen af en regressionslinie, der passer tættere på scatterplot-dataene.