anova.rq () в quantreg пакете в R

голоса
3

Я заинтересован в сравнении оценок различных квантилей ( тот же результат, тот же ковариат) , используя anova.rqlistфункцию вызывается anovaв среде quantregпакета в R. Однако математика в функции находится за пределами моей зачаточной экспертизы. Допустим , я поместиться 3 модели на различных квантилей;

library(quantreg)
data(Mammals) # data in quantreg to be used as a useful example
fit1 <- rq(weight ~ speed + hoppers + specials, tau = .25, data = Mammals)
fit2 <- rq(weight ~ speed + hoppers + specials, tau = .5, data = Mammals)
fit3 <- rq(weight ~ speed + hoppers + specials, tau = .75, data = Mammals)

Тогда я сравнить их с помощью;

anova(fit1, fit2, fit3, test=Wald, joint=FALSE)

Мой вопрос, который из этих моделей используются в качестве основы для сравнения?

Мое понимание теста Вальда (запись вики)

введите

где θ ^ является оценкой параметра (ов), представляющего интерес, что & thetas сравнивается с предложенным значением 0О.

Так что мой вопрос, что это anovaфункция в quantregвыборе в качестве 0О?

На основе p-значение возвращается из anovaмоего лучшего предположения, что она выбирает самый низкий квантиль указанного (т.е. tau=0.25). Есть ли способ определить медиану ( tau = 0.5) или еще лучше среднюю оценку из полученных с использованием lm(y ~ x1 + x2 + x3, data)?

anova(fit1, fit2, fit3, joint=FALSE)

на самом деле производит

Quantile Regression Analysis of Deviance Table

Model: weight ~ speed + hoppers + specials
Tests of Equality of Distinct Slopes: tau in {  0.25 0.5 0.75  }

             Df Resid Df F value  Pr(>F)  
speed         2      319  1.0379 0.35539  
hoppersTRUE   2      319  4.4161 0.01283 *
specialsTRUE  2      319  1.7290 0.17911  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

в то время как

anova(fit3, fit1, fit2, joint=FALSE)

производит тот же самый результат

Quantile Regression Analysis of Deviance Table

Model: weight ~ speed + hoppers + specials
Tests of Equality of Distinct Slopes: tau in {  0.5 0.25 0.75  }

             Df Resid Df F value  Pr(>F)  
speed         2      319  1.0379 0.35539  
hoppersTRUE   2      319  4.4161 0.01283 *
specialsTRUE  2      319  1.7290 0.17911  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Порядок моделей явно меняется в ANOVA, но как же это значение F и Pr (> F) идентичны в обоих тестах?

Задан 23/09/2015 в 14:33
источник пользователем
На других языках...                            


1 ответов

голоса
2

Все квантили введеному используются и там не одна модель, используемая в качестве ссылки.

Я предлагаю вам прочитать этот пост и связанный с этим ответ , чтобы понять , что ваш «theta.0» есть.

Я считаю , что вы пытаетесь сделать , это проверить , являются ли линии регрессии параллельны. Другими словами , является ли эффект от предикторов (только доход однородны по квантилей здесь).

Вы можете использовать anova()из quantreg пакета , чтобы ответить на этот вопрос. Вы действительно должны использовать несколько припадков для каждого квантиля.

При использовании , joint=FALSEкак вы сделали, вы получите коэффициент мудр сравнение. Но у вас есть только один коэффициент , так что только одна линия! И ваши результаты говорят о том , что эффект дохода не является равномерной accross квантилей в вашем примере. Использование нескольких предикторов , и вы получите несколько р-значения.

Вы можете сделать общую проверку равенства целых наборов коэффициентов , если вы не используете , joint=FALSEи это даст вам «Совместное испытание равенства Склоны» и , следовательно , только один р-значение.

РЕДАКТИРОВАТЬ:

Я думаю theta.0 это средний наклон для всех значений «тау» или фактическая оценка от 'ого (), а не конкретный наклон любых из моделей. Мои рассуждения в том, что "anova.rq () не требует какого-либо конкретного низкого значения«тау»или даже срединного«тау».

Есть несколько способов, чтобы проверить это. Либо делать расчеты вручную с theta.0, равным средним значением, или сравнивать различные комбинации, потому что тогда вы могли бы ситуация, когда некоторые из ваших моделей близки к модели с низкими значениями «тау», но не к «ому ()' стоимость. Так что, если theta.0 является наклон первой модели с наименьшим «тау», то ваш Pr (> F) будет высокой, тогда как в другом случае, это будет низкой.

Этот вопрос должен , возможно , был предложен на перекрестной проверке .

Ответил 23/09/2015 в 20:13
источник пользователем

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more