• Increase font size
  • Default font size
  • Decrease font size

ePathology.ro

Member Area
Statistica descriptiva: media, mediana, modalul, deviatia standard, IQR (interquartile range), tipuri de grafice
Article Index
Statistica descriptiva: media, mediana, modalul, deviatia standard, IQR (interquartile range), tipuri de grafice
Ghid in folosirea masuratorilor pentru tendinta centrala si dispersie
Media, mediana si modalul
Intervalul
Deviatia, percentile si IQR
Grafice folosite pentru vizualizarea datelor
All Pages

Statistica descriptiva descrie datele dintr-un esantion.

Masurarea tendintei centrale

  1. Media aritmetica
  2. Mediana
  3. Modalul
  4. Media geometrica
  5. Media armonica

Masurarea dispersiei

  1. Intervalul (range)
  2. Deviatia standard (SD)
  3. Eroarea standard (SE)
  4. Percentilele si IQR
  5. Coeficientul de variatie

 


 

Ghid in folosirea masuratorilor pentru tendinta centrala

Media este utilizata pentru date numerice si distributia simetrica a datelor

Mediana este utilizata pentru date ordinale si distributii non-simetrice

Modalul este utilizat pentru distributii bimodale

Media geometrica este utilizata pentru observatii masurate pe o scala logaritmica

 

Ghid in folosirea masuratorilor pentru dispersie (imprastiere)

SD se foloseste impreuna cu media pentru valori simetrice (normal distribuite)

Percentilele si IQR sunt folosite :

  • impreuna cu mediana pentru valori non-simetrice
  • impreuna cu media pentru a compara o valoare individuala cu un set de norme

IQR este folosit pentru a evidentia tendinta centrala a 50% din date indiferent de distributie

Intervalul (range) este folosit pentru valori numerice pentru a evidentia valorile extreme

Coeficientul de variatie este folosit cand se intentioneaza compararea distributiei numerice masurate pe scale diferite

 


 

Media

Media aritmetica

  1. m (μ) = ∑ xi / n; i = 1,n
  2. Trebuie utilizata numai pentru valori normal distribuite (simetrice)
  3. Este sensibila la valori extreme
  4. Nu trebuie folosita pentru valori ordinale, datorita naturii arbitrare a scalei ordinale

Media geometrica

  1. GM = n√(x1x2x3…xn) → log GM = 1/n ∑log xi; i = 1,n
  2. Trebuie utilizata numai cu date masurate pe o scala logaritmica
  3. Scala logaritmica poate fi folosita la uniformizarea datelor

 

Mediana (“punctul de mijloc”)

M = jumatatea distantei intre 2 medii (media a 2 valori medii pentru un numar dat de observatii)

Se utilizeaza cind datele nu sunt simetrice (neuniform distribuite)

  • Ex.1: 5 pacienti cu varstele : 42, 44, 46, 48, 49. Media = 45.8, mediana = 46
  • Ex.2: 6 pacienti cu varstele : 42, 44, 46, 48, 49, 90. Media = 53, mediana = 47

 

Media vs mediana

m = M → date simetric distribuite (normal)

m > M → date non-simetrice micsorate la dreapta (“subtiate”)

m < M → date non-simetrice micsorate la stanga

 

Distributie normalaDistributie la stangaDistributie la dreapta

 

 

 

 

 

 

 

 

Teorema limitei centrale

Distributia mediei este aproximativ normala daca marimea esantionului este suficient de mare (n = 30), indiferent de distributia valorilor ale masuratorilor initiale

 

 

Modalul

Cea mai frecventa aparitie a unui eveniment (valoarea care apare cel mai frecvent intr-un set de date)

Se utilizeaza in special cand distributia este bimodala (care arata o populatie neomogena)Distributie unimodala  Distributie bimodala

 

 

 

 

 

 

 

 

 


 

Intervalul (range)

Intervalul = diferenta intre cea mai mare si cea mai mica observatie

x є [a, b]; range = b-a; b > a; a,b є R

Coeficientul de variatie = masoara imprastierea relativa a datelor si se aplica in testele de laborator si in procedurile de control ale calitatii

CV = (SD/μ)100

 

Intervalul de incredere (confidence interval)

Reprezinta un interval ce defineste un nivel maxim si unul minim, numite nivele de incredere cu o anumita probabilitate asociata

Utilizat impreuna cu valoarea mediei sau RR (risk ratio), OR (odds ratio)

CI = m +/- t SE; t – coeficientul de incredere (valoarea critica pentru distributia tip t), m – media esantionului, SE – eroarea standard

CI - 90%, 95% (cel mai frecvent), 99%

Cu cat esantionul este mai mare cu atat CI este mai mic

 


 

Deviatia (abaterea) standard

Arata distributia valorilor populatiei in jurul mediei (imprastierea fata de medie)

Se utilizeaza numai pentru valori uniform distribuite (simetrice)

SD (σ) = √[∑(xi-μ)2/(n-1)]

μ+/-σ include 68.2% din valori

μ+/-2σ include 95.4% din valori

μ+/-3σ include 99.7% din valori

Eroarea standard : SE = SD/√n

Variatia (variance) = SD2

 

Clopotul Gauss

 

Percentilele si IQR

Percentila = procentul (%) de distributie < decat un numar particular

Este folosita pentru a compara o valoare individuala cu un set de norme (o norma)

IQR (interquartile range) – contine 50% din observatii

IQR = percentila 75 – percentila 25

IQR contine mediana

 


 

Grafice folosite pentru vizualizarea datelor

  • Histograma – pentru observatii numerice in determinarea distributiei esantionului (simetric sau non-simetric)
  • Box plot – pentru mediana si IQR
  • Poligoane de frecventa – pentru urmarirea evolutiei si compararea a 2 distributii pe acelasi grafic
  • Grafice cu bare (bar charts) – pentru caracteristici nominale
  • Grafice “rozeta” (pie charts) – pentru redarea partilor dintr-un intreg
  • Grafice cu puncte (scatter plot) – pentru relatiile intre variabile
  • Forrest plot (“blobograma”) – pentru intervalele de increderePoligon de frecventa (frequency poligon) Grafic cu bare (bar chart)

 

 

 

 

 

 

 

Grafic cu bareGrafic “rozeta” (pie chart)

 

 

 

 

 

 

 

Grafic cu puncte (scatter plot)

 

Last Updated on Saturday, 18 April 2009 19:26