Cum se face analiza datelor de bază în Excel

Cum se face analiza datelor de bază în Excel

De cele mai multe ori, atunci când rulați statistici, doriți să utilizați programe statistice. Aceste instrumente sunt construite pentru a face calcule precum t -teste, teste chi-pătrat, corelații și așa mai departe. Excel nu este destinat analizei datelor. Dar asta nu înseamnă că nu o poți face.





Din păcate, funcțiile statistice Excel nu sunt întotdeauna intuitive. Și, de obicei, îți dau rezultate ezoterice. Deci, în loc să folosim funcțiile statistice, vom folosi suplimentul pentru statistici Excel: the Analiza datelor Toolpak.





Toolpak, în ciuda ortografiei sale destul de nefericite, include o gamă largă de funcționalități statistice utile. Să vedem ce putem face cu statisticile Excel.





Adăugarea Instrumentului de analiză a datelor Excel

In timp ce tu poate sa faceți statistici fără Instrumentul de analiză a datelor, este mult mai ușor cu el. Pentru a instala Toolpak în Excel 2016, accesați Fișier> Opțiuni> Suplimente .

Clic Merge lângă „Gestionați: programe de completare Excel”.



În fereastra rezultată, bifați caseta de lângă Toolpak de analiză și apoi faceți clic pe Bine .

Dacă ați adăugat corect Instrumentul de analiză a datelor în Excel, veți vedea un Analiza datelor butonul din Date filă, grupate în Analiză secțiune:





Dacă doriți și mai multă putere, asigurați-vă că verificați celelalte programe de completare Excel.

Statistici descriptive în Excel

Indiferent de testul statistic pe care îl executați, probabil că doriți să obțineți mai întâi statisticile descriptive Excel. Acest lucru vă va oferi informații despre mijloace, mediane, varianță, deviație standard și eroare, curtoză, asimetrie și o varietate de alte figuri.





Rularea statisticilor descriptive în Excel este ușoară. Clic Analiza datelor în fila Date, selectați Statisticile descriptive, și selectați intervalul de intrare. Faceți clic pe săgeata de lângă câmpul intervalului de intrare, faceți clic și trageți pentru a selecta datele dvs. și apăsați introduce (sau faceți clic pe săgeata corespunzătoare în jos), ca în GIF de mai jos.

După aceea, asigurați-vă că spuneți Excel dacă datele dvs. au etichete, dacă doriți ieșirea într-o foaie nouă sau pe aceeași, și dacă doriți statistici sumare și alte opțiuni.

După aceea, lovește Bine și veți obține statisticile descriptive:

Testul t al studentului în Excel

The t -testul este unul dintre cele mai elementare teste statistice și este ușor de calculat în Excel cu Toolpak. Apasă pe Analiza datelor și derulați în jos până când vedeți t -opțiuni de testare.

Aveți trei opțiuni:

  • T-Test: Asociat două probe pentru mijloace trebuie utilizat atunci când măsurătorile sau observațiile dvs. au fost împerecheate. Utilizați acest lucru atunci când ați făcut două măsurători ale aceluiași subiect, cum ar fi măsurarea tensiunii arteriale înainte și după o intervenție.
  • Test t: Două probe presupunând variații egale ar trebui să fie utilizat atunci când măsurătorile dvs. sunt independente (ceea ce înseamnă de obicei că au fost efectuate pe două grupuri diferite de subiecte). Vom discuta partea „varianțe egale” într-un moment.
  • T-Test: Două probe presupunând variații inegale este, de asemenea, pentru măsurători independente, dar este utilizat atunci când variațiile dvs. sunt inegale.

Pentru a testa dacă varianțele celor două eșantioane sunt egale, va trebui să rulați un test F. Găsi F-Test cu două probe pentru variații în lista Instrumente de analiză, selectați-l și faceți clic pe Bine .

Introduceți cele două seturi de date în casetele intervalului de intrare. Lăsați valoarea alfa la 0,05, cu excepția cazului în care aveți motive să o modificați - dacă nu știți ce înseamnă asta, plecați. În cele din urmă, faceți clic pe Bine .

Excel vă va oferi rezultatele într-o foaie nouă (cu excepția cazului în care ați selectat Gama de ieșire și o celulă în foaia dvs. curentă):

Te uiți la valoarea P aici. Dacă este mai puțin de 0,05, aveți variații inegale . Deci, pentru a rula t -test, ar trebui să utilizați opțiunea de variații inegale.

Pentru a rula un t -test, selectați testul corespunzător din fereastra Instrumente de analiză și selectați ambele seturi de date în același mod ca și pentru testul F. Lăsați valoarea alfa la 0,05 și apăsați Bine .

Rezultatele includ tot ce trebuie să raportați pentru un t -test: mijloacele, gradele de libertate (df), statistica t și valorile P atât pentru testele cu una, cât și pentru cele cu două cozi. Dacă valoarea P este mai mică de 0,05, cele două probe sunt semnificativ diferite.

Dacă nu sunteți sigur dacă utilizați unul sau două cozi t -test, verificați acest explicator de la UCLA .

ANOVA în Excel

Excel Data Analysis Toolpak oferă trei tipuri de analiză a varianței (ANOVA). Din păcate, nu vă oferă posibilitatea de a efectua testele de urmărire necesare, cum ar fi Tukey sau Bonferroni. Dar puteți vedea dacă există o relație între câteva variabile diferite.

Iată cele trei teste ANOVA în Excel:

  • ANOVA: Factor unic analizează varianța cu o variabilă dependentă și o variabilă independentă. Este de preferat să folosiți mai multe t -teste cand ai mai mult de doua grupuri.
  • ANOVA: Doi factori cu replicare este similar cu cel asociat t -Test; implică măsurători multiple pe subiecți singuri. Partea „cu doi factori” a acestui test indică faptul că există două variabile independente.
  • ANOVA: Doi factori fără replicare implică două variabile independente, dar nici o replicare în măsurare.

Vom analiza aici analiza cu un singur factor. În exemplul nostru, vom analiza trei seturi de numere, etichetate „Intervenție 1”, „Intervenție 2” și „Intervenție 3.” Pentru a rula un ANOVA, faceți clic pe Analiza datelor , apoi selectați ANOVA: Factor unic .

Selectați intervalul de intrare și asigurați-vă că spuneți Excel dacă grupurile dvs. sunt în coloane sau rânduri. De asemenea, am selectat „Etichete în primul rând” aici, astfel încât numele grupurilor să fie afișate în rezultate.

După ce a lovit Bine , obținem următoarele rezultate:

Rețineți că valoarea P este mai mică de 0,05, deci avem un rezultat semnificativ. Asta înseamnă că există o diferență semnificativă între cel puțin două dintre grupurile din test. Dar pentru că Excel nu oferă teste pentru a determina care grupurile diferă, cel mai bun lucru pe care îl puteți face este să priviți mediile afișate în rezumat. În exemplul nostru, Intervenția 3 pare să fie probabil cea care diferă.

Acest lucru nu este statistic. Dar dacă doriți doar să vedeți dacă există vreo diferență și să vedeți care grup probabil o provoacă, va funcționa.

ANOVA cu doi factori este mai complicat. Dacă doriți să aflați mai multe despre când să utilizați metoda cu doi factori, consultați acest videoclip de la Sophia.org si ' fără replicare ' și ' cu replicare 'exemple din statistici reale.

Corelația în Excel

Calculul corelației în Excel este mult mai simplu decât t -test sau un ANOVA. Folosește Analiza datelor pentru a deschide fereastra Instrumente de analiză și selectați Corelație .

Selectați intervalul de intrare, identificați grupurile ca coloane sau rânduri și spuneți Excel dacă aveți etichete. După aceea, lovește Bine .

Nu veți obține măsuri semnificative, dar puteți vedea cum fiecare grup este corelat cu celelalte. O valoare a unuia este o corelație absolută, indicând faptul că valorile sunt exact aceleași. Cu cât valoarea corelației este mai aproape de una, cu atât este mai puternică corelația.

Regresie în Excel

Regresia este unul dintre cele mai frecvent utilizate teste statistice din industrie, iar Excel oferă o cantitate surprinzătoare de putere pentru acest calcul. Aici vom rula o regresie multiplă rapidă în Excel. Dacă nu sunteți familiarizați cu regresia, verificați Ghidul HBR privind utilizarea regresiei pentru afaceri .

Să presupunem că variabila noastră dependentă este tensiunea arterială, iar cele două variabile independente sunt greutatea și aportul de sare. Vrem să vedem care este un predictor mai bun al tensiunii arteriale (sau dacă sunt amândoi buni).

Clic Analiza datelor și selectați Regresie . De această dată trebuie să aveți grijă când completați casetele pentru intervalul de intrare. The Intrare Y Range caseta ar trebui să conțină singura variabilă dependentă. The Intrare X Range caseta poate include mai multe variabile independente. Pentru o simplă regresie, nu vă faceți griji cu privire la restul (deși nu uitați să spuneți Excel dacă ați selectat etichete).

Iată cum arată calculul nostru:

După ce a lovit Bine , veți obține o listă mare de rezultate. Am evidențiat valoarea P aici atât pentru greutate cât și pentru aportul de sare:

După cum puteți vedea, valoarea P pentru greutate este mai mare de 0,05, deci nu există o relație semnificativă acolo. Cu toate acestea, valoarea P pentru sare este sub 0,05, indicând faptul că este un bun predictor al tensiunii arteriale.

Dacă intenționați să vă prezentați datele de regresie, amintiți-vă că puteți adăuga o linie de regresie la un diagramă de dispersie în Excel. E o mare ajutor vizual pentru această analiză.

Statistici Excel: surprinzător de capabile

Deși Excel nu este cunoscut pentru puterea sa statistică, acesta oferă de fapt unele funcționalități foarte utile, cum ar fi instrumentul PowerQuery , care este la îndemână pentru sarcini precum combinarea seturilor de date. (Aflați cum să generați primul dvs. script Microsoft Power Query.) Există, de asemenea, suplimentul pentru statistici Data Analysis Toolpak, care scoate la iveală unele dintre cele mai bune caracteristici Excel. Sper că ați învățat cum să utilizați Toolpak și că acum puteți juca singur pentru a afla cum să folosiți mai multe dintre funcțiile sale.

rip cd la mp3 cu nume de piese

Cu acest lucru acum sub centură, duceți-vă abilitățile Excel la nivelul următor cu articolele noastre despre folosind funcția Excel de căutare a obiectivelor pentru mai multe analize de date și căutarea valorilor cu vlookup . La un moment dat, ați putea dori, de asemenea, să aflați cum să importați date Excel în Python.

Acțiune Acțiune Tweet E-mail Ștergeți aceste fișiere și foldere Windows pentru a elibera spațiu pe disc

Aveți nevoie să goliți spațiul pe disc pe computerul dvs. Windows? Iată fișierele și folderele Windows care pot fi șterse în siguranță pentru a elibera spațiu pe disc.

Citiți în continuare
Subiecte asemănătoare
  • Productivitate
  • Foaie de calcul
  • Microsoft Excel
Despre autor Apoi Albright(506 articole publicate)

Dann este un consultant în strategie de conținut și marketing care ajută companiile să genereze cerere și clienți potențiali. De asemenea, el blogează despre strategie și marketing de conținut la dannalbright.com.

Mai multe de la Dann Albright

Aboneaza-te la newsletter-ul nostru

Alăturați-vă newsletter-ului pentru sfaturi tehnice, recenzii, cărți electronice gratuite și oferte exclusive!

Faceți clic aici pentru a vă abona