Информационный критерий Акаике

Оцени статью

Информационный критерий Акаике (AIC) — это математический метод оценки того, насколько хорошо модель соответствует данным, из которых она была создана. В статистике AIC используется для сравнения различных возможных моделей и определения того, какая из них лучше всего подходит для данных. AIC рассчитывается из:

  • количество независимых переменных, используемых для построения модели.
  • оценка максимального правдоподобия модели (насколько хорошо модель воспроизводит данные).

Наилучшей моделью согласно AIC является та, которая объясняет наибольшее количество вариаций, используя наименьшее количество независимых переменных.

Пример.

Вы хотите знать, влияет ли употребление подслащенных сахаром напитков на массу тела. Вы собрали вторичные данные из национального обследования состояния здоровья, которое содержит наблюдения за потреблением сахаросодержащих напитков, возрастом, полом и ИМТ (индексом массы тела).

Чтобы выяснить, какие из этих переменных важны для прогнозирования взаимосвязи между потреблением сахаросодержащих напитков и массой тела, вы создаете несколько возможных моделей и сравниваете их с помощью AIC.

Когда использовать АИК

В статистике AIC чаще всего используется для выбора модели. Вычисляя и сравнивая оценки AIC нескольких возможных моделей, вы можете выбрать ту, которая лучше всего подходит для данных.

При проверке гипотезы вы можете собирать данные о переменных, в которых вы не уверены, особенно если вы исследуете новую идею. Вы хотите знать, какая из измеренных вами независимых переменных объясняет изменение вашей зависимой переменной.

Хороший способ выяснить это — создать набор моделей, каждая из которых содержит различную комбинацию измеренных вами независимых переменных. Эти комбинации должны быть основаны на:

  • Ваше знание системы обучения — избегайте использования параметров, которые не связаны логически, так как вы можете найти ложные корреляции практически между чем угодно!
  • Ваш экспериментальный план — например, если вы разделили два вида лечения между испытуемыми, то, вероятно, нет причин проверять взаимодействие между двумя видами лечения.

Создав несколько возможных моделей, вы можете использовать AIC для их сравнения. Более низкие оценки AIC лучше, и AIC наказывает модели, которые используют больше параметров. Таким образом, если две модели объясняют одинаковое количество вариаций, модель с меньшим количеством параметров будет иметь более низкий показатель AIC и будет более подходящей моделью.Пример выбора моделиИзучая, как часы, потраченные на учебу, и формат теста (множественный выбор или письменный ответ) влияют на результаты теста, вы создаете две модели:

  1. Окончательный результат теста в ответ на часы, потраченные на учебу
  2. Окончательная оценка теста в зависимости от часов, потраченных на обучение + формат теста

Вы найдете r 2 0,45 с p-значением менее 0,05 для модели 1 и r 2 0,46 с p-значением менее 0,05 для модели 2. Модель 2 соответствует данным немного лучше, но оно того стоило добавить еще один параметр только для того, чтобы получить это небольшое увеличение в модели?

Чтобы выяснить это, вы запускаете тест AIC, который показывает, что модель 1 имеет более низкий балл AIC, потому что она требует меньше информации для прогнозирования почти с таким же уровнем точности. Другой способ думать об этом состоит в том, что повышенная точность в модели 2 могла произойти случайно.

Из теста AIC вы решаете, что модель 1 является лучшей моделью для вашего исследования.

Как сравнивать модели с помощью AIC

AIC определяет относительную информативность модели, используя оценку максимального правдоподобия и количество параметров (независимых переменных) в модели. Формула для AIC:

$AIC = 2K - 2ln(L)$

K — это количество используемых независимых переменных, а L — оценка логарифмического правдоподобия (вероятность того, что модель могла дать ваши наблюдаемые значения y). По умолчанию K всегда равно 2, поэтому если ваша модель использует одну независимую переменную, ваш K будет равен 3, если в ней используются две независимые переменные, ваш K будет равен 4 и так далее.

Чтобы сравнить модели, использующие AIC, вам необходимо вычислить AIC каждой модели. Если модель более чем на 2 единицы AIC ниже другой, то она считается значительно лучше этой модели.

Вы можете легко рассчитать AIC вручную, если у вас есть логарифмическое правдоподобие вашей модели, но вычисление логарифмического правдоподобия сложно! Большинство статистических программ включают функцию расчета AIC. Мы будем использовать R для запуска нашего анализа AIC.

АИК в R

Чтобы сравнить несколько моделей, вы можете сначала создать полный набор моделей, которые вы хотите сравнить, а затем запустить aictab()набор.

Для данных о подслащенных сахаром напитках мы создадим набор моделей, включающих три переменные-предикторы (возраст, пол и потребление напитков) в различных комбинациях. Загрузите набор данных и запустите строки кода в R, чтобы попробовать сами.

Создание моделей

Во-первых, мы можем проверить, как работает каждая переменная по отдельности.

age.mod <- lm(bmi ~ age, data = bmi.data)

sex.mod <- lm(bmi ~ sex, data = bmi.data)

consumption.mod <- lm(bmi ~ consumption, data = bmi.data)

Затем мы хотим узнать, лучше ли комбинация возраста и пола описывает вариации ИМТ сама по себе, без учета потребления напитков.

age.sex.mod <- lm(bmi ~ age + sex, data = bmi.data)

Мы также хотим знать, лучше ли сочетание возраста, пола и потребления напитков описывает изменение ИМТ, чем любая из предыдущих моделей.

combination.mod <- lm(bmi ~ age + sex + consumption, data = bmi.data)

Наконец, мы можем проверить, может ли взаимодействие возраста, пола и потребления напитков объяснить ИМТ лучше, чем любая из предыдущих моделей.

interaction.mod <- lm(bmi ~ age*sex*consumption, data = bmi.data)

Сравните модели

Чтобы сравнить эти модели и определить, какая из них лучше всего подходит для данных, вы можете объединить их в список и использовать команду aictab(), чтобы сравнить их все сразу. Чтобы использовать aictab(), сначала загрузите библиотеку AICcmodavg.

install.packages("AICcmodavg")
library(AICcmodavg)

Затем поместите модели в список («модели») и назовите каждую из них, чтобы таблицу AIC было легче читать («model.names»).

models <- list(age.mod, sex.mod, consumption.mod, age.sex.mod, combination.mod, interaction.mod)

model.names <- c('age.mod', 'sex.mod', 'consumption.mod', 'age.sex.mod', 'combination.mod', 'interaction.mod')

Наконец, запустите, aictab()чтобы сделать сравнение.

aictab(cand.set = models, modnames = model.names)

Интерпретация результатов

Приведенный выше код создаст следующую выходную таблицу:

Результат выбора модели AIC в R.

Самая подходящая модель всегда указывается первой. Таблица выбора модели включает в себя информацию о:

  • K : Количество параметров в модели. Значение K по умолчанию равно 2, поэтому модель с одним параметром будет иметь K, равное 2 + 1 = 3.
  • AICc : Информационная оценка модели (строчная буква «c» указывает, что значение было рассчитано на основе теста AIC с поправкой на небольшие размеры выборки). Чем меньше значение AIC, тем лучше подходит модель.
  • Delta_AICc : разница в баллах AIC между лучшей моделью и сравниваемой моделью. В этой таблице следующая лучшая модель имеет дельта-AIC 6,33 по сравнению с топ-моделью, а третья лучшая модель имеет дельта-AIC 17,57 по сравнению с топ-моделью.
  • AICcWt : Вес AICc, который представляет собой долю от общего объема прогностической способности, обеспечиваемой полным набором моделей, содержащихся в оцениваемой модели. В этом случае топ-модель содержит 96% всего объяснения, которое можно найти в полном наборе моделей.
  • Cum.Wt : Сумма весов AICc. Здесь две лучшие модели содержат 100% совокупного веса AICc.
  • LL : логарифмическое правдоподобие. Это значение, описывающее, насколько вероятна модель с учетом данных. Оценка AIC рассчитывается на основе LL и K.

Из этой таблицы видно, что наилучшей моделью является комбинированная модель — модель, которая включает все параметры, но не взаимодействует (ИМТ ~ возраст + пол + потребление).

Модель намного лучше всех остальных, так как несет 96% совокупного веса модели и имеет самый низкий показатель AIC. Следующая лучшая модель более чем на 2 единицы AIC выше, чем лучшая модель (6,33 единицы), и несет только 4% совокупного веса модели.

На основе этого сравнения мы бы выбрали комбинированную модель для использования в нашем анализе данных.

Отчет о результатах

Если вы используете выбор модели AIC в своем исследовании, вы можете указать это в разделе «Методы». 

Примеры методов. Мы использовали выбор модели AIC, чтобы выделить набор возможных моделей, описывающих взаимосвязь между возрастом, полом, потреблением подслащенных напитков и индексом массы тела. Наиболее подходящая модель, несущая 96% совокупного веса модели, включала все параметры без эффектов взаимодействия.

Найдя наиболее подходящую модель, вы можете запустить модель и оценить результаты. Результаты оценки вашей модели могут быть представлены в разделе результатов вашей статьи.

×