Media vs Median | Diferențe între utilizarea metodelor în statistici

Diferența dintre medie și medie

Media și media sunt doi termeni folosiți în mod obișnuit în matematică, media este ca media unui număr dat și rezumă numerele și le împarte cu numărul de numere, ceea ce ne dă media, în timp ce mediana, pe de altă parte, întoarce numărul mediu din întreg set de date și dacă setul de date este chiar atunci mediană adaugă cele două numere de mijloc și îl împarte la 2 oferindu-ne mediana.

Ele sunt măsura tendinței centrale și sunt adesea utilizate în măsurarea unor seturi mari de date în care analiza trebuie trasată și rezultatele sunt interpretate. Media, mediana și modul sunt trei măsurători ale mediilor care arată că dispersia datelor este de la medie sau medie. Aceste metode sunt utilizate pe scară largă în statistici, în timp ce valoarea medie a datelor este cea mai utilizată metodă dintre cele trei.

Ce inseamna?

Media este o sumă simplă a numărului de observații dintr-o matrice care este împărțită la numărul de observații. De exemplu, dacă vorbim despre înălțimea medie sau înălțimea medie a unui grup format din 5 persoane. Înălțimea medie ar fi calculată prin însumarea înălțimii a 5 persoane împărțită la numărul de persoane, adică 5.

Formulă

Formula medie = (Suma tuturor observațiilor / numărul de observații)

Ce este mediana?

Mediană, pe de altă parte, este numărul de mijloc din setul de matrice de date care separă setul superior de date de cel inferior. Datele trebuie aranjate mai întâi în ordine crescătoare pentru a calcula mediana datelor. Când setul de date are cardinalitate, trebuie luată media celor două numere din mijloc în setul de date. Cu toate acestea, aceste două metode sunt adesea folosite interschimbabil.

Formulă

Formula medie = (n + 1) / 2

când n este un număr impar

Median = [(n / 2) + {(n / 2) +1}] / 2

când n este un număr par

Infografie medie vs medie

Să vedem diferențele de top dintre medie vs mediană.

Diferențe cheie medii vs medii

  • Mean este simplu de utilizat și de aplicat și poate fi aplicat oricărui set de matrice de date, indiferent dacă este par sau impar. Mediana, pe de altă parte, este ușor de utilizat și setul de date trebuie să fie aranjat în ordine crescătoare sau descendentă, înainte de calcul.
  • Media este utilizată în mod normal pentru distribuții normale, în timp ce mediana este utilizată pentru setul de date de distribuții înclinate.
  • Media este simplă, dar nu este robustă deoarece poate conține valori anormale în distribuții și uneori nu poate oferi utilizatorului rezultatele corecte pentru interpretare. Pe de altă parte, metoda mediană este robustă și este mai potrivită pentru a fi utilizată, deoarece a fost utilizată pentru distribuții înclinate pentru a obține tendința centrală a datei stabilite și va oferi utilizatorului multe rezultate precise în comparație cu media
  • Există o singură formulă de medie care este suma tuturor observațiilor împărțite la numărul de observații. În timp ce, mediana are două formule una dintre ciudatele în care doar numerele din mijloc din setul de date devin mediană. Dar când avem seturi de date uniforme, mijlocul celor două valori sunt selectate și sunt împărțite la 2, ceea ce ne oferă apoi mediana setului de date uniforme.

Tabel comparativ mediu vs mediu

RăuMedian
Media se calculează prin adunarea tuturor valorilor din matricea de date, care este apoi împărțită la numărul de observațiiMediana este valoarea medie exactă a setului de date. Poate fi calculat prin aranjarea setului de date în ordine crescătoare și apoi găsirea sau alegerea valorii medii din setul de date
Este mai utilizat pe scară largă în industrie datorită unui calcul ușor al mediei și ne oferă un număr rapidNu este folosit des în industrie, dar este mai complet și mai precis decât înseamnă doar o simplă sumă de numere
Este utilizat în general pentru setul de date în mod normal înclinat, adică distribuția normalăEste deosebit de util să descriem setul de date cu o asimetrie semnificativă în date sau când datele au o coadă lungă. Este utilizat pe scară largă în cazul în care conturatorii au o pondere semnificativă în date, ceea ce înseamnă că nu este o metodă bună de calcul
Nu este un instrument robust pentru a calcula tendința centralăEste un instrument mult mai robust, deoarece determină greutatea în date, care este în general greutate mare la cozile mai lungi
Este foarte sensibil la valori aberanteEste mult mai puțin afectat de valorile aberante
Este simplu de utilizatEste de natură complexă
Nu poate fi calculat pentru date categorice, deoarece valorile nu pot fi însumateNu poate fi identificat pentru date nominale clasificate, deoarece nu poate fi ordonat logic.

Concluzie

În afară de medie și mediană, există încă o metodă care este adesea utilizată pentru măsurarea tendinței centrale, care este modul. Un mod este o valoare care apare cel mai frecvent în setul de date, modul are un avantaj față de medie și mediană că poate fi găsit atât pentru setul de date numerice, cât și pentru cele clasificate.

În ciuda existenței modului și medianei superioritatea rezultatelor și analizei mai bune față de medie, media este în continuare cea mai potrivită măsură a tendinței centrale, mai ales dacă setul de date este o distribuție normală și datele sunt în mod normal înclinate.

Ca un bun analist, tendința centrală ar trebui să fie măsurată cu toate cele trei metode de date și varianța în analiză ar trebui meditată și analizată cu atenție pentru a produce rezultate mai bune și mai precise în setul de date.