【StataNow 新功能】贝叶斯量子回归

新的 bayes: qreg 命令适合贝叶斯量化回归。贝叶斯框架为量化回归系数提供了全面的后验分布,包括基于模型的 “标准误差”。支持所有标准贝叶斯特征,如假设检验和预测。该命令是 StataNow 的一部分。

量值回归将结果的条件量值作为预测因子的线性组合进行建模。传统的量化回归依赖于一组特定的损失函数和线性规划来进行估计。为了引入贝叶斯量化回归,Yu 和 Moyeed(2001 年)使用了一种等效的量化回归公式,假设似然函数为非对称拉普拉斯分布。贝叶斯量化回归将这种似然公式与模型参数先验相结合,形成后验模型,并使用马尔可夫链蒙特卡罗(MCMC)进行估计。这为综合推断提供了模型参数的完整后验分布,包括基于模型的 “标准误差”。

在经典的量化回归中,标准误差是通过使用自举或基于核的方法计算得出的。在贝叶斯框架中,后验标准偏差扮演了标准误差的角色。通过假设参数似然模型,后验标准差是基于该模型估算的,可能更有效。

在此,我们演示了单变量贝叶斯量化回归。关于其他贝叶斯量值模型,包括随机效应和多重量值模型,请参见贝叶斯非对称拉普拉斯模型。

让我们看看它的工作原理

让我们利用 Koenker 和 Bassett(1982 年)中描述的 Engel(1857 年)的数据来探讨家庭收入与食品支出之间的关系。让我们使用量值回归来比较不同量值之间的关系。我们首先使用默认设置拟合结果变量第 50 个百分位数的模型,即所谓的中位数回归模型。我们指定了 rseed(19) 选项,以保证可重复性。

. webuse engel1857

(European household budget survey)

. bayes, rseed(19): qreg foodexp income

Burn-in …

Simulation …

Model summary

Likelihood: 

  foodexp ~ asymlaplaceq(xb_foodexp_q50,{sigma},.5)

Priors: 

  {foodexp_q50:income _cons} ~ normal(0,10000)(1)

{sigma} ~ igamma(0.01,0.01)

(1) Parameters are elements of the linear form xb_foodexp_q50.

Bayesian quantile regressionMCMC iterations  =12,500

Random-walk Metropolis–Hastings samplingBurn-in=2,500

MCMC sample size =10,000

Quantile = .5Number of obs    =235

Acceptance rate  =.3603

Efficiency:  min =.09896

avg =.151

Log marginal-likelihood =  186.43947max =.2268

Equal-tailed   

Mean   Std. dev.MCSEMedian  [95% cred. interval]

foodexp_q50

income.5567276   .0159401   .000507   .5562547   .5248025    .587735

_cons.084986   .0143782   .000403   .0851108   .0575581   .1134264

sigma.0377533   .0024907   .000052   .0376511   .0331066   .0430957

收入系数的平均后验估计值为 0.56,95% 可信区间 (CrI) 为 [0.52, 0.59]。现在,我们将注意力转移到结果变量的第 25 个百分位数(或 0.25 分位数)上,使用 qreg 指定 quantile() 选项。

. bayes, rseed(19): qreg foodexp income, quantile(0.25)

Burn-in …

Simulation …

Model summary

Likelihood: 

  foodexp ~ asymlaplaceq(xb_foodexp_q25,{sigma},.25)

Priors: 

  {foodexp_q25:income _cons} ~ normal(0,10000)(1)

{sigma} ~ igamma(0.01,0.01)

(1) Parameters are elements of the linear form xb_foodexp_q25.

Bayesian quantile regressionMCMC iterations  =12,500

Random-walk Metropolis–Hastings samplingBurn-in=2,500

MCMC sample size =10,000

Quantile = .25Number of obs    =235

Acceptance rate  =.3423

Efficiency:  min =.1436

avg =.1765

Log marginal-likelihood =  169.18624max =.2421

Equal-tailed   

Mean   Std. dev.MCSEMedian  [95% cred. interval]

foodexp_q25

income.4718604   .0140225    .00037   .4735463   .4414884   .4948657

_cons.0962851   .0116976   .000308   .0957929   .0742573   .1196877

sigma.0304463   .0020364   .000041   .0303373   .0266857   .0347907

收入系数的平均后验估计值为 0.47,95%CrI 为 [0.44, 0.49]。两个量值回归的 CrIs 并不重叠,这表明收入与食品支出之间的关系在 0.25 和 0.50 量值之间是不同的。我们可以使用 bayes: qreg 在 quantile() 选项中指定不同的量化值来进一步探究这种关系,并使用结果绘制下图:

【StataNow 新功能】贝叶斯量子回归

该图显示了不同食品支出分布(数量级)的收入系数的异质性。该系数随着量化值的增加而增加。(这并不意味着食品支出占收入的比例随着收入的增加而增加。如果我们进行预测并绘制恩格尔曲线,就会发现食品支出所占比例会随着收入的增加而减少,这是预料之中的)。

所有现有的贝叶斯后估计命令都可以在 bayes: qreg 后使用。例如,我们可以计算食品支出第 25 百分位数模型中收入系数在区间[0.525, 0.588]内的后验概率–区间[0.525, 0.588]是中位数回归模型得到的 95% CrI。为此,我们使用 bayestest interval 命令。

. bayestest interval {foodexp_q25:income}, lower(.525) upper(.588)

Interval testsMCMC sample size =    10,000

prob1 : .525 < {foodexp_q25:income} < .588

Mean    Std. dev.MCSE

prob100.000000

估计的后验概率为 0,这表明收入对食品支出的影响在第 25 个百分位数和第 50 个百分位数之间是不同的。

原创文章,作者:管理员,如若转载,请注明出处:http://sina.com.cn.nomar.cn/archives/1925.html

(0)
上一篇 2024 年 6 月 2 日
下一篇 2024 年 6 月 2 日

相关推荐