Sådan beregnes præcision af data

Indholdsfortegnelse:

Anonim

Data præcision er et af de vigtigste overvejelser ved udførelse af videnskabelig eller statistisk analyse. Almindeligvis forvekslet med det lige vigtige begreb om nøjagtighed, viser dart-board-analogien, der er formuleret af University of Hawaii, forholdet: Nøjagtige datapunkter er gennemsnitlige for at svare til forventede resultater, mens præcise datapunkter klynker tæt sammen, selvom de ikke er tæt på forventede resultater. Ifølge Dartmouth College er præcision en måling af reproducerbarheden af ​​et sæt resultater. Præcision i datasæt er et vigtigt begreb selv i teknologirelaterede bestræbelser, som vist af Kenneth E. Foote og Donald J. Huebner med University of Texas-Austin i en analyse af Geographic Information Systems. Beregning af præcision er en temmelig enkel, men noget subjektiv øvelse.

Elementer du skal bruge

  • Grafisk gengivelse af et datasæt

  • Oplysninger om de relevante enheder udtrykt i dataene

  • Mindste tilladte fejlmargin i eksperimentet

Udvikle en visuel repræsentation af datapunkter som et scatterplot. En meget simpel visuel repræsentation indebærer at tegne de tilsvarende afhængige og uafhængige variable værdier for hvert datapunkt på et kartesisk koordinatsystem.

Vurder gruppering af datapunkter og se efter mønstre. Præcise data manifesterer i klynger af datapunkter, hvilket indikerer, at lignende inputvariabler korrelerer med tilsvarende outputvariabler.

Anvend oplysninger om måleenheder, der bruges til at indsamle dataene for at bestemme den gennemsnitlige afstand mellem datapunkter. En simpel linealmåling kan bruges til at bestemme afstanden mellem punkter på grafen og derefter konverteres ved hjælp af en vilkårlig, bekvem skala, der svarer til måleenhederne, der bruges til at generere datapunkterne. Dette gør det muligt at beregne datapunkternes præcision i forhold til hinanden ved at tage gennemsnittet af afstande.

Sammenlign den mindste fejlmargin, der er tilladt i eksperimentet, og datapunkternes gennemsnitlige præcision for at bestemme den relative samlede præcision af eksperimentet. Forskellige typer af eksperimenter vil have større eller mindre fejltolerance: Et engineeringprojekt vil sandsynligvis kræve præcision ned til meget små enheder, mens et socialt eksperiment sandsynligvis vil tolerere mere varians.

Tips

  • Prøv at vurdere den sandsynlige enhedsskala, før du opretter den grafiske repræsentation af datapunkterne. Dette vil gøre det lettere at vurdere præcision visuelt for at identificere områder med særlig bemærkelsesværdig præcision eller upræcision.

    Klare datamønstre, der forekommer på en visuel repræsentation, er stærkt vejledende for præcision og repeterbarhed af et eksperiment. Fortsat eksperimentering bør tilføje yderligere datapunkter i præcise klynger tæt på dem, der allerede eksisterer.

Advarsel

Forveks ikke præcision med præcision. Hvis målet med et forsøg er at opnå en gennemsnitlig outputværdi af give for alle input, og dette opnås med gennemsnitlige værdier fra -12 til 14, er det usandsynligt, at det vil være en præcis måling, selvom det kan være korrekt. En præcis måling kan resultere i alle datapunkter clustering omkring 17, hvilket ville være unøjagtigt, men præcist og derfor forudsigeligt.