Выбор функций скоринга

Функции скоринга представляют собой типы значений скоринга, доступные для выбранной модели. Например, предсказанное значение целевой переменной, вероятность предсказанного значения или вероятность выбранного значения целевой переменной.

Скоринг данных с использованием прогнозных моделей

Рисунок 15-3

Конструктор скоринга: выбор функций скоринга

Функция скоринга. Доступные функции скоринга зависят от модели. Одна или несколько из перечисленных ниже будут присутствовать в списке:

n    Предсказанное  значение. Предсказанное значение целевой переменной. Оно доступно для всех моделей, исключая те, которые не содержат целевой переменной.

n    Вероятность предсказанного значения. Вероятность для предсказанного значения

оказаться правильным значением, выраженная в виде доли. Она доступна для

большинства моделей с категориальной целевой переменной.

n    Вероятность выбранного значения. Вероятность для выбранного значения оказаться

правильным значением, выраженная в виде доли. Выберите значение в столбе Значение

раскрывающегося списка. Доступные значения определяются моделью. Она доступна для большинства моделей с категориальной целевой переменной.

n    Показатель доверия. Вероятность, связанная с предсказанным значением

категориальной целевой переменной. Для моделей бинарной логистической регрессии,

мультиномиальной логистической регрессии и наивной байесовской модели она совпадает с вероятностью предсказанного значения. Для моделей деревьев и Ruleset показатель доверия можно интерпретировать как скорректированную вероятность предсказанной категории, и она всегда меньше вероятности предсказанного значения. Для этих моделей значение показателя доверия является более надежным показателем, чем вероятность предсказанного значения.

n    Номер узла. Номер предсказанного терминального узла для моделей деревьев.

n    Стандартная ошибка. Стандартная ошибка предсказанного значения. Доступна для

моделей линейной регрессии, общих линейных моделей и обобщенных линейных моделей с количественной целевой переменной. Она доступна, только если в файле моделей сохранена ковариационная матрица.

n    Накопленный риск. Оцененная функция накопленного риска. Значение указывает

вероятность наблюдения события в заданный момент или ранее при заданных значениях предикторов.

n    Ближайший сосед. Идентификатор (ID) ближайшего соседа. ID представляет собой

значение переменной меток наблюдений, если она имеется. Если нет, то это номер наблюдения. Применяется только к моделям ближайших соседей.

n    K-тый ближайший  сосед.  ID k-того ближайшего соседа. Введите целое число в

качестве значения k в столбце Значение. ID представляет собой значение переменной меток наблюдений, если она имеется. Если нет, то это номер наблюдения. Применяется только к моделям ближайших соседей.

n    Расстояние до ближайшего соседа. Расстояние до ближайшего соседа. В зависимости

от модели будет использовано либо расстояние Евклида, либо расстояние «городского

квартала». Применяется только к моделям ближайших соседей.

n    Расстояние до k-того ближайшего соседа. Расстояние до k-того ближайшего соседа.

Введите целое число в качестве значения k в столбце Значение. В зависимости от модели будет использовано либо расстояние Евклида, либо расстояние «городского квартала». Применяется только к моделям ближайших соседей.

Имя поля.  Для каждой выбранной функции скоринга в активном наборе данных сохраняется новое поле (переменная). Можно использовать имена, заданные по умолчанию, или ввести новые имена. Если поля с такими именами уже существуют в активном наборе данных, то они будут заменены. Правила именования полей смотрите в разделе Имена переменных.

Значение.  Обратитесь к описаниям функций скоринга за описаниями функций, которые используют параметр Значение.

Скоринг активного набора данных

На последнем шаге работы с Конструктором можно запустить скоринг активного набора данных или вставить в окно синтаксиса сгенерированный командный синтаксис. Сгенерированный командный синтаксис можно затем изменить и/или сохранить.

Скоринг данных с использованием прогнозных моделей

Рисунок 15-4

Конструктор скоринга: Готово

Источник: Руководство пользователя по базовой системе Statistics 20

Похожие посты:

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий