新的 bayes: qreg 命令适合贝叶斯量化回归。贝叶斯框架为量化回归系数提供了全面的后验分布,包括基于模型的 “标准误差”。支持所有标准贝叶斯特征,如假设检验和预测。该命令是 StataNow 的一部分。
量值回归将结果的条件量值作为预测因子的线性组合进行建模。传统的量化回归依赖于一组特定的损失函数和线性规划来进行估计。为了引入贝叶斯量化回归,Yu 和 Moyeed(2001 年)使用了一种等效的量化回归公式,假设似然函数为非对称拉普拉斯分布。贝叶斯量化回归将这种似然公式与模型参数先验相结合,形成后验模型,并使用马尔可夫链蒙特卡罗(MCMC)进行估计。这为综合推断提供了模型参数的完整后验分布,包括基于模型的 “标准误差”。
在经典的量化回归中,标准误差是通过使用自举或基于核的方法计算得出的。在贝叶斯框架中,后验标准偏差扮演了标准误差的角色。通过假设参数似然模型,后验标准差是基于该模型估算的,可能更有效。
在此,我们演示了单变量贝叶斯量化回归。关于其他贝叶斯量值模型,包括随机效应和多重量值模型,请参见贝叶斯非对称拉普拉斯模型。
让我们看看它的工作原理
让我们利用 Koenker 和 Bassett(1982 年)中描述的 Engel(1857 年)的数据来探讨家庭收入与食品支出之间的关系。让我们使用量值回归来比较不同量值之间的关系。我们首先使用默认设置拟合结果变量第 50 个百分位数的模型,即所谓的中位数回归模型。我们指定了 rseed(19) 选项,以保证可重复性。
. webuse engel1857
(European household budget survey)
. bayes, rseed(19): qreg foodexp income
Burn-in …
Simulation …
Model summary
Likelihood:
foodexp ~ asymlaplaceq(xb_foodexp_q50,{sigma},.5)
Priors:
{foodexp_q50:income _cons} ~ normal(0,10000)(1)
{sigma} ~ igamma(0.01,0.01)
(1) Parameters are elements of the linear form xb_foodexp_q50.
Bayesian quantile regressionMCMC iterations =12,500
Random-walk Metropolis–Hastings samplingBurn-in=2,500
MCMC sample size =10,000
Quantile = .5Number of obs =235
Acceptance rate =.3603
Efficiency: min =.09896
avg =.151
Log marginal-likelihood = 186.43947max =.2268
Equal-tailed
Mean Std. dev.MCSEMedian [95% cred. interval]
foodexp_q50
income.5567276 .0159401 .000507 .5562547 .5248025 .587735
_cons.084986 .0143782 .000403 .0851108 .0575581 .1134264
sigma.0377533 .0024907 .000052 .0376511 .0331066 .0430957
收入系数的平均后验估计值为 0.56,95% 可信区间 (CrI) 为 [0.52, 0.59]。现在,我们将注意力转移到结果变量的第 25 个百分位数(或 0.25 分位数)上,使用 qreg 指定 quantile() 选项。
. bayes, rseed(19): qreg foodexp income, quantile(0.25)
Burn-in …
Simulation …
Model summary
Likelihood:
foodexp ~ asymlaplaceq(xb_foodexp_q25,{sigma},.25)
Priors:
{foodexp_q25:income _cons} ~ normal(0,10000)(1)
{sigma} ~ igamma(0.01,0.01)
(1) Parameters are elements of the linear form xb_foodexp_q25.
Bayesian quantile regressionMCMC iterations =12,500
Random-walk Metropolis–Hastings samplingBurn-in=2,500
MCMC sample size =10,000
Quantile = .25Number of obs =235
Acceptance rate =.3423
Efficiency: min =.1436
avg =.1765
Log marginal-likelihood = 169.18624max =.2421
Equal-tailed
Mean Std. dev.MCSEMedian [95% cred. interval]
foodexp_q25
income.4718604 .0140225 .00037 .4735463 .4414884 .4948657
_cons.0962851 .0116976 .000308 .0957929 .0742573 .1196877
sigma.0304463 .0020364 .000041 .0303373 .0266857 .0347907
收入系数的平均后验估计值为 0.47,95%CrI 为 [0.44, 0.49]。两个量值回归的 CrIs 并不重叠,这表明收入与食品支出之间的关系在 0.25 和 0.50 量值之间是不同的。我们可以使用 bayes: qreg 在 quantile() 选项中指定不同的量化值来进一步探究这种关系,并使用结果绘制下图:
该图显示了不同食品支出分布(数量级)的收入系数的异质性。该系数随着量化值的增加而增加。(这并不意味着食品支出占收入的比例随着收入的增加而增加。如果我们进行预测并绘制恩格尔曲线,就会发现食品支出所占比例会随着收入的增加而减少,这是预料之中的)。
所有现有的贝叶斯后估计命令都可以在 bayes: qreg 后使用。例如,我们可以计算食品支出第 25 百分位数模型中收入系数在区间[0.525, 0.588]内的后验概率–区间[0.525, 0.588]是中位数回归模型得到的 95% CrI。为此,我们使用 bayestest interval 命令。
. bayestest interval {foodexp_q25:income}, lower(.525) upper(.588)
Interval testsMCMC sample size = 10,000
prob1 : .525 < {foodexp_q25:income} < .588
Mean Std. dev.MCSE
prob100.000000
估计的后验概率为 0,这表明收入对食品支出的影响在第 25 个百分位数和第 50 个百分位数之间是不同的。
原创文章,作者:管理员,如若转载,请注明出处:http://sina.com.cn.nomar.cn/archives/1925.html