Добавление переменных

При добавлении переменных происходит слияние активного набора данных с другим открытым набором данных или с внешним файлом данных IBM® SPSS® Statistics, содержащим такие же наблюдения (строки), но другие переменные (столбцы). Например, можно объединить файлы, содержащие данные опросов одних и тех же респондентов

до и после какого-либо события.

n    Наблюдения должны быть отсортированы в одинаковом порядке в обоих наборах данных.

n    Если для слияния используется одна или несколько ключевых переменных, наблюдения в обоих наборах данных должны быть отсортированы в возрастающем порядке по ключевой переменной (ключевым переменным).

n    Переменные во втором наборе данных, имена которых совпадают с именами переменных в активном наборе данных, по умолчанию исключаются, поскольку предполагается, что они содержат одинаковую информацию.

Указывать источник наблюдений в переменной.  Создает переменную, указывающую на файл-источник данных каждого наблюдения. Для наблюдений из активного набора данных ее значение равно 0, а для наблюдений из внешнего файла данных оно равно 1.

Рисунок 9-6

Диалоговое окно Добавить переменные

Исключенные переменные. Переменные, которые не войдут в новый набор данных. По умолчанию этот список содержит имена переменных второго набора данных, совпадающие с именами переменных активного набора данных. Переменные из активного набора данных помечаются звездочкой (*). Переменные из другого набора данных обозначены знаком плюс (+). Если Вы хотите включить в новый набор данных переменную из другого (неактивного) набора данных с именем, совпадающим с именем переменной в рабочем файле, нужно переименовать ее и добавить к списку переменных, которые будут включены в новый набор данных.

Новый активный набор данных.  Переменные, которые будут включены в новый набор данных. По умолчанию в этот список включаются уникальные имена переменных из обоих наборов данных.

Переменные-ключи. Если для каких-либо наблюдений из одного набора данных в другом наборе данных нет совпадающих наблюдений для слияния (то есть в одном наборе данных такие наблюдения отсутствуют), для корректного слияния наблюдений можно использовать переменные-ключи. Вы можете также использовать переменные-ключи с наборами данных (или файлами данных), являющимися ключевыми таблицами.

n    Переменные-ключи должны иметь одинаковые имена в сливаемых наборах данных.

n    Оба набора данных должны быть отсортированы в порядке возрастания значений переменных-ключей, а порядок переменных в списке переменных-ключей должен быть тем же самым, что и при сортировке.

n    Наблюдения, которым не находится соответствие по переменным-ключам, включаются в объединенный набор данных, но не сливаются с наблюдениями из другого набора данных (или файла данных). Такие наблюдения содержат значения переменных только

Работа с файлами

из того набора данных, в котором они существовали, переменные из другого набора данных будут иметь системные пропущенные значения.

Неактивный (или активный) набор данных — ключевая таблица.  Ключевая таблица

— это файл, в котором данные каждого «наблюдения» могут быть слиты с несколькими наблюдениями другого файла данных. Например, если один файл содержит информацию об отдельных членах семьи (пол, возраст, образование), а другой файл — информацию о

семье в целом (общий доход, размер семьи, место жительства), то можно использовать файл о семье как ключевую таблицу и присоединить данные о семье в целом к данным о каждом члене семьи в объединенном файле данных.

Как слить данные с одинаковыми наблюдениями и разными переменными

E   Откройте, по крайней мере, один из файлов данных, слияние которых Вы собираетесь произвести. Если у Вас открыто несколько наборов данных, сделайте один из наборов данных, которые Вы собираетесь объединять, активным набором данных.

E   Выберите в меню:

Данные > Слить файлы > Добавить переменные…

E   Выберите набор данных или внешний файл данных SPSS Statistics для слияния с активным набором данных.

Как выбрать переменные-ключи

E   В списке Исключенные переменные выберите переменные из другого (неактивного) набора данных (помеченные значком +).

E   Установите флажок Сливать по ключу в отсортированных файлах.

E   Добавьте переменные в список Переменные-ключи.

Переменные-ключи должны существовать в обоих наборах данных. Оба набора данных должны быть отсортированы в порядке возрастания значений переменных-ключей, а порядок переменных в списке переменных-ключей должен быть тем же самым, что и при сортировке.

: Переименование переменных

Переменные активного набора данных или другого набора данных можно переименовать перед перемещением их в список Новый активный набор данных. Переименование бывает необходимо в тех случаях, когда в новый набор данных должны быть включены переменные с одинаковыми именами в обоих набора данных, но содержащие разную информацию.

Слияние данных из более чем двух источников

При помощи синтаксиса можно одновременно слить до 50 наборов данных и/или файлов данных. Дополнительную информацию см. в описании команды MATCH FILES в Руководстве по синтаксису (меню Справка).

Источник: Руководство пользователя по базовой системе Statistics 20

Похожие посты:

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий