Как бороться с NA в регрессии данных панели?

Я пытаюсь предсказать установленные значения над данными, содержащими NA s, и на основе модели, сгенерированной plm. Вот пример кода:

require(plm)
test.data <- data.frame(id=c(1,1,2,2,3), time=c(1,2,1,2,1), 
 y=c(1,3,5,10,8), x=c(1, NA, 3,4,5))
model <- plm(y ~ x, data=test.data, index=c("id", "time"), 
 model="pooling", na.action=na.exclude)
yhat <- predict(model, test.data, na.action=na.pass)
test.data$yhat <- yhat

Когда я запускаю последнюю строку, я получаю сообщение об ошибке, указывающее, что замена имеет 4 строки, тогда как данные имеют 5 строк.

Я понятия не имею, как получить предсказание вернуть вектор длины 5...

Если вместо запуска plm запускаю lm (как в строке ниже), я получаю ожидаемый результат.

model <- lm(y ~ x, data=test.data, na.action=na.exclude)
1 ответ

Я думаю, что это то, что predict.plm должно обрабатывать для вас - кажется, это надзор над частью авторов пакета, но вы можете использовать ?napredict для его реализации для себя:

pp <- predict(model, test.data)
 na.stuff <- attr(model$model,"na.action")
 (yhat <- napredict(na.stuff,pp))
 ## [1] 1.371429 NA 5.485714 7.542857 9.600000

licensed under cc by-sa 3.0 with attribution.