Конструктор реструктуризации данных: Выберите тип

Для реструктуризации данных используйте Конструктор реструктуризации данных. В

первом диалоговом окне выберите тип реструктуризации.

Рисунок 9-17

Конструктор реструктуризации данных

n    Реструктурировать выбранные переменные в наблюдения.  Выберите этот вариант, если у Вас есть группы связанных столбцов данных, и Вы хотите преобразовать их в группы строк в новом файле данных. Если Вы выбираете этот вариант, конструктор будет отображать шаги для варианта Реструктурировать выбранные переменные в наблюдения.

Работа с файлами

n    Реструктурировать выбранные наблюдения в переменные. Выберите этот вариант, если в данных имеются группы связанных строк, и Вы хотите преобразовать их в группы столбцов в новом файле данных. Если Вы выбираете этот вариант, конструктор будет отображать шаги для варианта Реструктурировать выбранные наблюдения в переменные.

n    Транспонировать  все данные. Выберите этот вариант, если Вы хотите транспонировать данные. Все строки станут столбцами, а все столбцы – строками в новом файле данных. В этом случае диалоговое окно Конструктора реструктуризации данных закрывается, а открывается диалоговое окно Транспонировать данные.

Выбор варианта реструктуризации данных

Переменная содержит информацию, которую Вы хотите анализировать, например, какой-то показатель. Наблюдение представляет объект наблюдения, например, человека. В случае простой структуры данных каждая переменная является столбцом, а каждое наблюдение

– строкой в файле данных. Таким образом, например, если бы Вы анализировали баллы, полученные студентами группы, то значения баллов содержались бы в одном столбце, а каждая строка соответствовала бы одному студенту.

При анализе данных нас часто интересует, как изменяются значения переменной в зависимости от некоторых условий. Условие может представлять собой вид лечения, демографические характеристики, точку на временной шкале или что-то еще. В анализе данных такие условия часто называют факторами. Если в анализе участвуют факторы, это приводит к сложной структуре данных. Информация о переменной может содержаться более чем в одном столбце данных (например, по одному столбцу для каждого уровня фактора), или информация о наблюдении может содержаться более чем в одной строке (например, по одной строке для каждого уровня фактора). Конструктор реструктуризации данных помогает реструктурировать файлы со сложной структурой.

Структура текущего файла данных и структура файла данных, который Вы хотите получить в результате, определяют выбор параметров реструктуризации, которые нужно задать в конструкторе.

Как устроены данные в Вашем рабочем файле? Данные могут быть устроены так, что для записи значений фактора используется либо одна переменная (уровни фактора задаются группами наблюдений), либо несколько переменных (уровни фактора задаются группой переменных).

n    Группы наблюдений.  Записаны ли переменные и условия в отдельных столбцах в

рабочем файле данных? Например:

var

factor

8

1

9

1

3

2

1

2

В этом примере первые две строки являются группой наблюдений, поскольку они связаны между собой. Они содержат данные для одного и того же уровня фактора. Если данные устроены таким образом, при проведении анализа в IBM® SPSS® Statistics фактор часто называют группирующей переменной.

n    Группы столбцов. Находятся ли переменные и условия в одном и том же столбце в

этом файле? Например:

var_1          var_2

8                  3

9                  1

В этом примере два столбца являются группой переменных, поскольку они связаны между собой. В столбцах записаны значения одной переменной – в var_1 записаны ее значения для уровня фактора 1, а в var_2 записаны ее значения для уровня фактора 2. Когда данные устроены таким образом, при проведении анализа в SPSS Statistics факторы часто называется повторными измерениями.

Как должны быть устроены данные в новом файле?  Как правило, это зависит от процедуры, которую Вы хотите использовать для анализа данных.

n    Процедуры,  которые требуют групп наблюдений.   Данные должны быть

структурированы в группы наблюдений, если анализ требует наличия группирующей переменной. Примерами таких процедур являются ОЛМ-одномерная, ОЛМ-многомерная и Компоненты дисперсии в Общих линейных моделях, Смешанные модели, OLAP-кубы, а также T-критерий и Непараметрические критерии для независимых выборок. Если рабочий файл данных устроен так, что в нем есть группы переменных, а Вы хотите выполнить один из перечисленных выше видов анализа, то

следует выбрать вариант Реструктурировать выбранные переменные в наблюдения.

n    Процедуры,  которые требуют групп переменных.   Данные должны быть структурированы в группы переменных для анализа повторных измерений. Примерами такого анализа являются ОЛМ-повторные измерения в Общей линейной модели, анализ с зависящими от времени ковариатами в регрессии Кокса, парные выборки

в Т-критерии и связанные наблюдения в Непараметрических критериях. Если рабочий файл данных устроен так, что в нем есть группы наблюдений, а Вы хотите выполнить одни из перечисленных выше видов анализа, следует выбрать вариант

Реструктурировать выбранные наблюдения в переменные.

Пример преобразования переменных в наблюдения

В этом примере результаты тестов записаны в отдельных столбцах для каждого фактора,

А и B.

Рисунок 9-18

Текущая структура данных для преобразования переменных в наблюдения

Работа с файлами

Вы собираетесь воспользоваться Т-критерием для независимых выборок. Имеется группа столбцов баллы_a и баллы_b, но нет группирующей переменной, которая необходима для использования в процедуре анализе. Выберите в Конструкторе реструктуризации данных

вариант Реструктурировать выбранные переменные в наблюдения, реструктурируйте одну

группу переменных в новую переменную с именем балл и создайте индексную переменную

группа. Новый файл данных показан на следующем рисунке.

Рисунок 9-19

Новый, реструктурированный файл данных (переменные в наблюдения)

При выполнении анализа с помощью Т-критерия для независимых выборок можно использовать переменную группа в качестве группирующей переменной.

Пример преобразования наблюдений в переменные

В данном примере результаты тестов записаны дважды по каждому субъекту — до и после лечения.

Рисунок 9-20

Текущая структура данных для преобразования наблюдений в переменные

Вы собираетесь воспользоваться Т-критерием для парных выборок.  Данные структурированы в группы наблюдений, а Вам нужно структурировать данные в повторные измерения, которые требуются для выполнения процедуры. Выберите в Конструкторе

реструктуризации данных вариант Реструктурировать выбранные наблюдения в переменные,

используйте id для идентификации групп строк в рабочем файле данных и time для создания группы переменных в новом файле.

Рисунок 9-21

Новый, реструктурированный файл данных (наблюдения в переменные)

Теперь при выполнении анализа с помощью Т-критерия для парных выборок можно использовать переменные bef и aft в качестве пары переменных.

Источник: Руководство пользователя по базовой системе Statistics 20

Похожие посты:

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий