Заменить пропущенные значения

Некоторые процедуры анализа временных рядов вообще не работают при наличии пропущенных значений. Иногда значение для какого-либо наблюдения просто неизвестно. Кроме того, пропущенные данные могут приводить к следующему:

n    Каждое дифференцирование уменьшает длину временного ряда на единицу.

n    Каждое сезонное дифференцирование уменьшает длину временного ряда на один сезонный период.

n    Если Вы создаете новый временной ряд, содержащий прогнозы за пределами интервала существующих значений (щелкнув Сохранить и сделав соответствующие установки),

в исходном временном ряде и в сгенерированном ряде остатков на месте новых наблюдений будут пропущенные значения.

n    Некоторые преобразования (например, логарифмическое преобразование) приводят к появлению пропущенных значений на месте определенных значений исходного временного ряда.

Пропущенные значения в начале или в конце временного ряда не представляют собой проблемы – они просто сокращают эффективную длину временного ряда. Пропуски в середин временного ряда (вложенные пропущенные значения) могут представлять собой гораздо более серьезную проблему. Характер проблемы зависит от используемой Вами аналитической процедуры.

В окне задаются параметры новых переменных, содержащих временные ряды, в которых пропущенные значения заменены оценками, которые могут быть вычислены одним из нескольких способов. По умолчанию имя новой переменной создается следующим образом: берутся шесть символов имени исходной переменной, добавляется подчеркивание (‘_’), затем добавляется порядковый номер. Например, для переменной price новая переменная будет price_1. Новые переменные сохраняют все метки значений исходных переменных.

Рисунок 8-32

Диалоговое окно

Преобразование данных

Как заменить пропущенные значения во временных рядах

E   Выберите в меню:

Преобразовать > …

E   Выберите метод, который Вы хотите использовать для замены пропущенных значений.

E   Выберите переменные, для которых Вы хотите произвести замену пропущенных значений.

Дополнительно Вы можете:

n    Ввести имена новых переменных, если Вам не подходят имена, присваиваемые автоматически.

n    Изменить метод оценивания для выбранной переменной.

Методы вычисления значений, заменяющих пропущенные

Среднее ряда. Заменяет пропущенные значения средним для всего ряда.

Среднее близлежащих точек. Заменяет пропущенные значения средним из валидных окружающих значений.  Интервал ближайших точек здесь — количество точек, предшествующих текущей и следующих за ней, которые используются при вычислении среднего.

Медиана близлежащих точек. Заменяет пропущенные значения медианой из валидных окружающих значений.  Интервал ближайших точек здесь — количество точек, предшествующих текущей и следующих за ней, которые используются при вычислении медианы.

Линейная интерполяция.  Заменяет пропущенные значения с помощью линейной интерполяции. Для интерполяции используются последнее валидное (непропущенное) значение перед пропущенным и первое валидное значение после пропущенного. Если пропущенное значение является первым или последним значением ряда, то такое значение не заменяется.

Линейный тренд в точке. Заменяет пропущенные значения линейным трендом для этой точки. Строится регрессия существующего временного ряда на индексную переменную со значениями от 1 до n. Пропущенные значения заменяются предсказанными значениями.

Источник: Руководство пользователя по базовой системе Statistics 20

Похожие посты:

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий