Линейная и экспоненциальная регрессии – ЧАСТЬ 3

Рис. 17.7. В столбце А находятся 1000 нормально распределенных значений (среднее значение 100; стандартное отклонение 2); с помощью инструмента Описательная статистика можно проверить, является ли это распределение нормальным

При настройке параметров вывода таблицы статистических данных  необходимо указать входной  диапазон  значений,  который  может   включать  в  себя  одну  или  несколько переменных,  и  выходной   диапазон.  Также  требуется  определить,  как  расположены переменные: в столбцах или строках. Если первая строка исходного диапазона содержит названия столбцов, не забудьте установить флажок Метки в первой строке (Labels In First Row). Тогда Excel, обратившись к содержимому первой строки, создаст заголовки в итоговой   таблице   результатов   анализа.   Если   установить   соответствующие   флажки

в  группе Параметры вывода (Output Options), ваша таблица  статистических данных будет иметь тот вид,  в каком она представлена на рис. 17.7.

Подобно   другим   инструментам   пакета   анализа,   Описательная   статистика   создает таблицу констант. Если эта таблица вас не  устраивает, многие из приведенных в  ней статистических  характеристик  можно  получить  и  с  помощью  других  инструментов пакета   анализа    или   встроенных  функций   Excel.   Статистические   параметры   и соответствующие им формулы приведены в табл. 17.2.

Рис. 17.8. Диалоговое окно Описательная статистика используется для создания таблицы,

содержащей основные статистические параметры набора данных

Таблица 17.2. Формулы для вычисления статистических параметров

Статистический параметр      Формула

Среднее                                =СРЗНАЧ(число 1; число2; …)

Стандартная ошибка           =СТОШУХ(известные_значенйя_у; известные_значения_х),

но без предположения о том, что распределение должно быть нормальным

Медиана                               =МЕДИАНА(число 1; число 2; …) Мода                                     =МОДА(число 1; число 2; …) Стандартное отклонение    =СТАНДОТКЛОН(число 1; число 2; …) Дисперсия                            =ДИСП(число 1; число 2;…)

Эксцесс                                =ЭКСЦЕСС(число 1; число 2; …)

Асимметрия                         =СКОС(число 1; число 2; …)

Интервал                              =МАКС(число 1; число 2; …) МИН(число 1; число 2; …)

= МИН(число 1; число 2; …)

продолжение ?

Таблица 17.2 (продолжение)

Статистический параметр    Формула

Максимум                             =МАКС(число 1; число 2; …) Сумма                                  =СУММ(число 1; число 2; …) Количество                          =СЧЕТ(число 1; число 2; …)

k-е наибольшее                   =НАИБОЛЬШИЙ(массив;к)

к-е наименьшее                   =НАИМЕНЬШИЙ(массив;к)

Доверительный интервал    По формуле =ДОВЕРИТ(альфа; станд_отклон; размер),

но*на основе другого алгоритма

Гистограмма

Гистограмма  —  это  диаграмма  (обычно  столбчатая),  где  для  исходного  множества данных определяется число значений (частота), попадающих в определенные интервалы разбиения.

Для  иллюстрации  работы  инструмента  Гистограмма  (Histogram)  воспользуемся таблицей результатов тестирования, в  которую входит  1000 итоговых оценок (рис. 17.9). (Входной  диапазон  должен   содержать   только  числовые данные.)  Чтобы  построить гистограмму,  необходимо, прежде всего, определиться с разбиением. В данном  случае выберем ширину интервала 50 баллов и введем   в  столбец F  граничные значения, как показано на рис. 17.9.

Рис. 17.9. Столбец F содержит границы интервалов разбиения

Интервалы разбиения не обязательно должны быть одной ширины, как в  приведенном примере,  но  в   любом  случае  последовательность  значений  их  границ  должна  быть возрастающей. Заполнив столбец F, выберите в меню Сервис команду Анализ данных, выделите инструмент Гистограмма и щелкните на кнопке ОК. Появится диалоговое окно Гистограмма, продемонстрированное на рис. 17.10.

Для построения гистограммы требуется определить три параметра: исходный диапазон (в данном случае D2:D1001), местоположение границ разбиения (диапазон F2:F22) и адрес

верхней левой ячейки для итогового диапазона (G1). После нажатия  кнопки ОК Excel

выводит результаты пересчета значений в столбцах G и Н, что мы видим на рис. 17.11.

Рис. 17.10. Диалоговое окно Гистограмма

Рис. 17.11. Выполненный анализ данных говорит о том, что только три результата попадают в интервал 900-949, 48 оценок — в интервал 950-999 и т. д.

ПРИМЕЧАНИЕ

В диалоговом окне Гистограмма поле Интервал карманов (Bin Range ) можно не заполнять. В этом случае Excel автоматически генерирует интервалы, используя в качестве начальной и  конечной  точек  минимальное  и  максимальное  значения  соответственно.  Количество интервалов при этом принимается равным квадратному корню из числа входных значений.

Ниже  приводятся некоторые  замечания,  которые  следует  учитывать   при  работе  с инструментом Гистограмма:

? В столбец Частота записывается количество значений, больших либо равных данной границе интервала, но не выходящих за соседнюю.

? Последнее  значение  в   таблице  итоговых данных  представляет   собой  количество входных значений, каждое из которых больше последней заданной границы или равно ей.

? Флажок  Парето  (Pareto)  в   диалоговом окне  Гистограмма  позволяет сортировать итоговые данные в убывающем порядке1.

? Флажок Интегральный процент (Cumulative Percentage)  включает в  таблицу результатов дополнительный столбец, в  котором  отображаются процентные значения с учетом предшествующих интервалов — накопительные.

ПРИМЕЧАНИЕ :

Обратите внимание, что инструмент Гистограмма копирует в выходной диапазон столбец с границами  интервалов  разбиения,  что  довольно   удобно,  когда  таблица  результатов достаточно удалена от исходных данных. Но так как этот столбец копируется, в нем лучше не использовать формулы —;а заполнять числами. Если интервалы все же записываются с помощью формул, необходимо убедиться, что они не содержат  относительных ссылок. В противном случае после копирования этих  формул инструментом Гистограмма значения границ интервалов станут некорректными.

Если в  окне Гистограмма установить флажок Вывод графика (Chart  Output), то одновременно с  выполнением анализа  данных  строится  также  и  диаграмма,  подобная продемонстрированной на рис. 17.12.  (Здесь мы немного увеличили  ее размер, чтобы можно было увидеть детали.)

Рис. 17.12. Помимо выполнения анализа данных, инструмент Гистограмма умеет автоматически строить диаграммы

СМОТРИ ТАКЖЕ

Все, что нужно знать о построении диаграмм, изложено в части 8, «Диаграммы».

Анализ распределения с помощью функции ЧАСТОТА

Инструмент Гистограмма генерирует ряд числовых констант. Если  предпочтительнее связать входные данные с таблицей результатов анализа формулой, то лучше всего здесь подойдет  встроенная  функция   ЧАСТОТА   (FREQUENCY).  Она  как  раз  вычисляет количество значений в генеральной совокупности, попадающих в определенный интервал. Функция ЧАСТОТА имеет уже знакомые нам аргументы: массив_данных; массив_границ. На рис. 17.13 продемонстрирован пример применения этой функции к данным с рис. 17.9.

Источник: Эффективная работа: Microsoft Office Excel 2003 / М. Додж, К. Стинсон — СПб.: Питер, 2005. — 1088 с: ил.

Похожие посты:

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий