Как да направите основен анализ на данни в Excel

Как да направите основен анализ на данни в Excel

През повечето време, когато стартирате статистика, искате да използвате статистически софтуер. Тези инструменти са създадени да правят изчисления като T -тестове, хи-квадрат тестове, корелации и т.н. Excel не е предназначен за анализ на данни. Но това не означава, че не можете да го направите.





За съжаление статистическите функции на Excel не винаги са интуитивни. И те обикновено ви дават езотерични резултати. Така че вместо да използваме статистически функции, ще използваме добавката за статистика за преминаване към Excel: Анализ на данни Пакет с инструменти.





Пакетът с инструменти, въпреки доста жалкото изписване, включва широк спектър от полезни статистически функции. Нека видим какво можем да направим със статистиката на Excel.





Добавяне на пакет от инструменти за анализ на Excel данни

Докато ти мога правите статистика без пакета с инструменти за анализ на данните, с него е много по -лесно. За да инсталирате Пакет с инструменти в Excel 2016, отидете на Файл> Опции> Добавки .

Щракнете Отивам до „Управление: Добавки на Excel“.



В получения прозорец поставете отметка в квадратчето до Пакет от инструменти за анализ и след това щракнете Добре .

Ако правилно сте добавили инструмента за анализ на данни към Excel, ще видите a Анализ на данни бутон в Данни раздел, групирани в Анализ раздел:





Ако искате още повече енергия, не забравяйте да проверите другите добавки на Excel.

Описателна статистика в Excel

Без значение какъв статистически тест провеждате, вероятно първо искате да получите описателна статистика на Excel. Това ще ви даде информация за средните стойности, медианите, отклонението, стандартното отклонение и грешка, куртозата, изкривяването и редица други цифри.





Изпълнението на описателна статистика в Excel е лесно. Щракнете Анализ на данни в раздела Данни изберете Описателна статистика, и изберете вашия диапазон на въвеждане. Щракнете върху стрелката до полето за диапазон на въвеждане, щракнете и плъзнете, за да изберете вашите данни, и натиснете Въведете (или щракнете върху съответната стрелка надолу), както в GIF по -долу.

След това не забравяйте да кажете на Excel дали вашите данни имат етикети, дали искате изходните данни в нов лист или на същия, и ако искате обобщена статистика и други опции.

След това удари Добре и ще получите описателната си статистика:

Студентски t-тест в Excel

The T -test е един от най -основните статистически тестове и е лесно да се изчисли в Excel с Toolpak. Щракнете върху Анализ на данни бутон и превъртете надолу, докато видите T -тестови опции.

Имате три избора:

  • t-тест: Сдвоени две проби за средства трябва да се използва, когато вашите измервания или наблюдения са сдвоени. Използвайте това, когато сте направили две измервания на едни и същи субекти, като например измерване на кръвното налягане преди и след интервенция.
  • t-тест: Две извадки, приемащи равни вариации трябва да се използва, когато вашите измервания са независими (което обикновено означава, че са направени върху две различни групи теми). Ще обсъдим частта „равни вариации“ след малко.
  • t-тест: Две извадки, приемащи неравни вариации също е за независими измервания, но се използва, когато вашите отклонения са неравни.

За да проверите дали отклоненията на двете ви проби са равни, ще трябва да изпълните F-тест. намирам F-тест Две проби за вариации в списъка Инструменти за анализ го изберете и щракнете Добре .

Въведете двата си набора от данни в полетата за диапазон на въвеждане. Оставете алфа стойността на 0,05, освен ако нямате причина да я промените - ако не знаете какво означава това, просто напуснете. Накрая щракнете Добре .

Excel ще ви даде резултатите в нов лист (освен ако не сте избрали Изходен обхват и клетка в текущия ви лист):

Тук разглеждате P-стойността. Ако е по -малко от 0,05, имате неравни отклонения . Така че, за да стартирате T -тест, трябва да използвате опцията за неравни отклонения.

За да стартирате a T -test, изберете подходящия тест от прозореца Tools Tools и изберете и двата набора от вашите данни по същия начин, както сте направили за F-test. Оставете алфа стойността на 0,05 и натиснете Добре .

Резултатите включват всичко, което трябва да докладвате за a T -тест: средните стойности, степени на свобода (df), t статистика и P-стойностите както за едно-, така и за двустранни тестове. Ако P-стойността е по-малка от 0,05, двете проби са значително различни.

Ако не сте сигурни дали да използвате едно или две опашки T -тест, провери този обяснител от UCLA .

ANOVA в Excel

Пакетът от инструменти за анализ на данни на Excel предлага три типа анализ на дисперсията (ANOVA). За съжаление, това не ви дава възможност да стартирате необходимите последващи тестове като Tukey или Bonferroni. Но можете да видите дали има връзка между няколко различни променливи.

Ето трите ANOVA теста в Excel:

  • ANOVA: Един фактор анализира вариацията с една зависима променлива и една независима променлива. За предпочитане е да използвате няколко T -тестове, когато имате повече от две групи.
  • ANOVA: Двуфакторен с репликация е подобно на сдвоеното T -тест; включва множество измервания върху отделни субекти. Двуфакторната част на този тест показва, че има две независими променливи.
  • ANOVA: Двуфакторен без репликация включва две независими променливи, но няма повторение при измерването.

Тук ще преминем към еднофакторния анализ. В нашия пример ще разгледаме три набора от номера, обозначени като „Интервенция 1“, „Интервенция 2“ и „Интервенция 3“. За да стартирате ANOVA, щракнете върху Анализ на данни , след което изберете ANOVA: Един фактор .

Изберете диапазона на въвеждане и не забравяйте да кажете на Excel дали групите ви са в колони или редове. Тук също съм избрал „Етикети на първи ред“, така че имената на групите да се показват в резултатите.

След удряне Добре , получаваме следните резултати:

Имайте предвид, че P-стойността е по-малка от 0,05, така че имаме значителен резултат. Това означава, че има значителна разлика между поне две от групите в теста. Но тъй като Excel не предоставя тестове за определяне който групите се различават, най -доброто, което можете да направите, е да погледнете средните стойности, показани в обобщението. В нашия пример Intervention 3 изглежда така вероятно тази, която се различава.

Това не е статистически обосновано. Но ако просто искате да видите дали има разлика и да видите коя група вероятно я причинява, тя ще работи.

Двуфакторната ANOVA е по-сложна. Ако искате да научите повече за това кога да използвате двуфакторния метод, вижте това видео от Sophia.org и ' без репликация ' и ' с репликация 'примери от реална статистика.

Корелация в Excel

Изчисляването на корелацията в Excel е много по -просто от T -тест или ANOVA. Използвай Анализ на данни бутон, за да отворите прозореца Инструменти за анализ и изберете Корелация .

Изберете диапазона на въвеждане, идентифицирайте групите си като колони или редове и кажете на Excel дали имате етикети. След това удари Добре .

Няма да получите никакви значими мерки, но можете да видите как всяка група е свързана с останалите. Стойност единица е абсолютна корелация, показваща, че стойностите са абсолютно еднакви. Колкото по -близо до една е стойността на корелацията, толкова по -силна е корелацията.

Регресия в Excel

Регресията е един от най -често използваните статистически тестове в индустрията и Excel носи изненадваща мощност за това изчисление. Тук ще стартираме бърза множествена регресия в Excel. Ако не сте запознати с регресията, проверете Ръководството на HBR за използване на регресия за бизнес .

Да кажем, че нашата зависима променлива е кръвното налягане, а нашите две независими променливи са теглото и приема на сол. Искаме да видим кое е по -добро предсказване на кръвното налягане (или дали и двете са добри).

Щракнете Анализ на данни и изберете Регресия . Този път трябва да бъдете внимателни, когато попълвате полетата за диапазон на въвеждане. The Входен Y диапазон полето трябва да съдържа вашата единична зависима променлива. The Обхват на входа X полето може да включва множество независими променливи. За проста регресия, не се притеснявайте за останалото (въпреки че не забравяйте да кажете на Excel, ако сте избрали етикети).

Ето как изглежда нашето изчисление:

След удряне Добре , ще получите голям списък с резултати. Тук подчертах P-стойността както за теглото, така и за приема на сол:

Както можете да видите, P-стойността на теглото е по-голяма от 0,05, така че няма значителна връзка там. Стойността на Р за солта обаче е под 0,05, което показва, че това е добър предиктор за кръвното налягане.

Ако планирате да представяте данните си за регресия, не забравяйте, че можете да добавите регресионна линия към скатер в Excel. Това е страхотна визуална помощ за този анализ.

Статистика на Excel: Изненадващо способна

Въпреки че Excel не е известен със своята статистическа мощ, той всъщност съдържа някои наистина полезни функции, като например инструмента PowerQuery , което е удобно за задачи като комбиниране на набори от данни. (Научете как да генерирате първия си Microsoft Power Query Script.) Има и добавка за статистически данни на Tool Analysis Toolpak, която наистина разкрива някои от най-добрите функции на Excel. Надявам се, че сте научили как да използвате инструментариума и че вече можете да играете сами, за да разберете как да използвате повече от неговите функции.

компютърът ми е замразен и контролът alt delete не работи

С това сега под колана, изведете уменията си в Excel на следващото ниво с нашите статии използвайки функцията за търсене на цели на Excel за повече криза на данни и търсене на стойности с vlookup . В един момент може също да искате да научите как да импортирате данни от Excel в Python.

Дял Дял Туит електронна поща Изтрийте тези файлове и папки на Windows, за да освободите дисково пространство

Трябва да изчистите дисковото пространство на вашия компютър с Windows? Ето файловете и папките на Windows, които могат безопасно да бъдат изтрити, за да се освободи място на диска.

Прочетете Напред
Свързани теми
  • Производителност
  • Електронна таблица
  • Microsoft Excel
За автора Тогава Олбрайт(506 статии са публикувани)

Дан е консултант по стратегия за съдържание и маркетинг, който помага на компаниите да генерират търсене и потенциални клиенти. Той също така блогове за стратегия и маркетинг на съдържанието на dannalbright.com.

Още от Дан Олбрайт

Абонирайте се за нашия бюлетин

Присъединете се към нашия бюлетин за технически съвети, рецензии, безплатни електронни книги и изключителни оферти!

Щракнете тук, за да се абонирате