level 8
从简单的回归分析开始,到现在的MCMC和EM,MLE,Bootstrap。
每次都像个第一次进城乡下小子一样,痴呆状地看着这些方法和思想。感觉自己越来越接近这座大山,却越来越被这座山的雄伟所震慑。
虽然知道即便它再恐怖高大我都能登顶,但是总要浪费一点时间来感慨唏嘘。
我草,这得学多久才能玩转。
2013年01月11日 09点01分
1
level 8
来吧!
混蛋!!!
总能磨完你们的!!!
老子耐心地磨,耐心地磨。
2013年01月27日 15点01分
3
level 8
统计分析的限制是什么?
事实上,我们应该了解,统计只是一个门外汉分析专业数据的方法。让统计方法和模型变得有意义的是专业上的理论支撑。
举个例子,羊吃草,羊越多,草越少(简化情况)。“羊吃草”是专业里的理论,我们通过这一理论知道羊的增加会导致草的减少。如果我们脱离这样的逻辑,而将羊和草的数量当作X和Y,我们建立起的模型可能会显示“草的减少与羊的增加同时出现”。
差一些的统计师可能会得出哗众取宠的结论:“草的减少导致了羊的增加”,优秀一些的统计师会告诉人们,这说明了两者之间的负相关。但是无论是那种情况,统计师都没办法告诉人们真正有意义的结论:“羊吃了草,草就少了”。
统计是验证理论的辅助,如果统计师在有“羊吃草”这一专业背景下进行研究。他可能通过两者的负相关验证“羊吃了草,草就少了”。相应地,他也可能通过两者的负相关不显著而对“羊吃了草,草就少了”这一推论产生怀疑,并研究推论不成立的原因(比如,羚羊吃树叶 = =。),由此对理论作出修正。
也就是说,没有专门领域背景的统计师可能得到虚假的理论。更深入一些,从数据本身去挖掘信息构想模型,而不是在专业知识和逻辑的基础上用统计验证理论,这是很危险的行为。
2013年02月27日 17点02分
6