Автоматическая перекодировка

Диалоговое окно используется для преобразования текстовых и числовых значений в последовательные целые числа. Когда коды категорий переменной не являются последовательными, получившиеся пропущенные ячейки снижают производительность и увеличивают потребность в памяти при выполнении многих процедур. Кроме того, некоторые процедуры не могут использовать текстовые переменные, а некоторым процедурам непосредственно требуются последовательные целые числовые значения.

Преобразование данных

Рисунок 8-12

Диалоговое окно “”

n    В новых переменных, созданных процедурой , сохраняются все метки переменных и значений старой переменной. Для значений, у которых метки не были определены, в качестве метки перекодированного значения используется исходное значение. При выполнении процедуры в выходной таблице отображаются старые и новые значения, а также метки значений.

n    Текстовые значения перекодируются в алфавитном порядке, причем прописные буквы предшествуют строчным.

n    Пропущенные значения перекодируются в пропущенные же значения, первое

из которых следует за последним не пропущенным значением, причем порядок пропущенных значений сохраняется. Например, если исходная переменная имеет 10 не пропущенных значений, то наименьшее пропущенное значение будет перекодировано в

11, и значение 11 станет пропущенным значением в новой переменной.

Использовать  одну и ту же схему перекодировки  для всех переменных.  Этот параметр позволяет применить единую схему автоматической перекодировки ко всем выбранным переменным, обеспечивая согласованную схему кодировки для всех новых переменных.

Если Вы выбрали этот параметр, то действуют следующие правила и ограничения:

n    Все переменные должны быть переменными одного и того же типа (числовые или текстовые).

n    Для создания отсортированных значений с целью последующей их перекодировки в последовательные целые числа используются все значения всех выбранных переменных.

n    Пользовательские пропущенные значения для новых переменных создаются на основе пользовательских пропущенных значений первой переменной из списка. Все другие значения исходных переменных, за исключением системных пропущенных, обрабатываются как валидные.

Считать пустые текстовые значения пользовательскими пропущенными  значениями.

В текстовых переменных пустые значения или пробелы не считаются системными пропущенными. Этот параметр позволяет перекодировать пробелы в текстовых переменных в пользовательские пропущенные значения, которые имеют значения выше. чем наибольшее не пропущенное значение.

Шаблоны

Вы можете сохранить схему автоматической перекодировки в шаблоне и затем применить ее к другим переменным и другим файлам данных.

Например, у Вас может быть большое число буквенно-цифровых кодов продуктов,

которые Вы каждый месяц перекодируете в целые числа, однако иногда появляются новые коды продуктов, что изменяет исходную схему кодирования. Если Вы сохранили исходную схему перекодировки в шаблоне и применяете ее к новым данным, содержащим новые дополнительные коды, то все новые коды перекодируются в значения, большие последнего значения в шаблоне, что сохраняет исходную схему кодировки продуктов.

Сохранить шаблон как. Сохраняет схему автоматической перекодировки для выбранных переменных в файле шаблона.

n    Шаблон содержит информацию о соответствии исходных не пропущенных значений и значений, в которые они перекодируются.

n    В шаблоне сохраняется информация только по не пропущенным значениям.

Информация о пользовательских пропущенных значениях не сохраняется.

n    Если Вы выбрали несколько переменных для перекодирования, но не выбрали общую схему перекодирования для всех переменных или не применили существующий шаблон для перекодировки, то шаблон будет основан на первой переменной списка.

n    Если Вы выбрали несколько переменных для перекодировки, а также выбрали Использовать одну и ту же схему перекодировки для всех переменных, и/или выбрали Применить шаблон, то шаблон будет содержать комбинированную схему автоматической

перекодировки для всех переменных.

Применить шаблон. Применяет ранее сохраненный шаблон автоматической перекодировки к выбранным переменным, добавляя все дополнительные значения, обнаруженные в переменных, в конец схемы и сохраняя связи между исходными и перекодированными значениями, хранящиеся в сохраненной схеме.

n    Все переменные, выбранные для перекодировки, должны быть одного типа (числовые или текстовые) и этот тип должен согласовываться с типом, определенным в шаблоне.

Преобразование данных

n    Шаблоны не содержат никакой информации о пользовательских пропущенных значениях. Пользовательские пропущенные значения для новых переменных создаются на основе пользовательских пропущенных значений первой переменной из списка. Все другие значения исходных переменных, за исключением системных пропущенных, обрабатываются как валидные.

n    В первую очередь применяются перекодировки, описанные в шаблоне. Все остальные значения перекодируются в значения, превышающие последнее значение в шаблоне,

а пользовательские пропущенные значения (на основе первой переменной в списке переменных с заданными пользовательскими пропущенными значениями) перекодируются в значения, превышающие последнее валидное значение.

n    Если Вы выбрали несколько переменных для автоматической перекодировки, в первую очередь применяется шаблон, после чего применяется общая комбинированная схема автоматической перекодировки для всех дополнительных значений, обнаруженных в выбранных переменных, в результате чего образуется единая схем перекодировки для всех выбранных переменных.

Как перекодировать текстовые и числовые значения в последовательные целые

E   Выберите в меню:

Преобразовать > …

E   Выберите одну или более переменных для перекодировки.

E   Для каждой выбранной переменной введите имя новой переменной и нажмите на кнопку

Новое имя.

Источник: Руководство пользователя по базовой системе Statistics 20

Похожие посты:

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий