一公升冰红茶 一公升冰红茶
关注数: 23 粉丝数: 59 发帖数: 1,178 关注贴吧数: 8
【干货】使魔DUSH的有序logistic建模预测的可行性讨论 先说结论:根据已出场的所有轮次的数据(每一轮中五组选手的三维数据和最后名次)可以建立logistic回归模型,能够预测的有:(1)技、速、精对结局的影响分别占比多少;(2)每一轮中每组选手获得一至五名的概率分别是多少。 根据每天新增加的数据,模型会越来越精确,所以越接近赛季末,预测结果越准确(除非暗改)。 懒人下面可以不看了。 每次出场五组选手,每组影响结果的自变量为3个——技、速、精,分设为X1、X2、X3, 因变量Y为五值变量——Y=1---第一名,Y=2---第二名……Y=5---第五名 X对Y的影响除了自身数值以外,还取决于同场竞技其他4组选手的X数据,所以在带入数据时不能直接使用数值大小,而是应该使用(个人数值/五组个人数值之和)。举例来说,某一轮中五组选手的速值分别为abcde,在建模和预测时,应当带入的数据则是a/(a+b+c+d+e)、……e/(a+b+c+d+e) 在获取较多轮数据后,就可以建立这样一个有序logistic回归模型: ln(P(Y≤j)/(1-P(Y≤j)))=β0j+β1*X1+β2*X2+β3*X3 上述公式中,j的取值在1到5,分别表示Y=1到5也就是第一到第五名的情况, 例如j为2时,P(Y≤j)就是最终排名≤2的概率,而(1-P(Y≤j))就是排名在第三或更惨的概率,β0j为计算得到的常数项,β1到β3则分别是三个自变量(也就是技、速、精数值占同轮内比值)的回归系数,可以提示这三维对结果的影响程度。 实际建模过程可以通过统计软件比如SPSS完成,建模者只需要输入一定场次的数据即可完成,之后代入每一轮的新数据就能预测当轮名次(只能预测概率),并且每轮过后加入新的数据重新建模就能得到更精确的模型。 方法介绍完毕,本人对非统计和数学专业,了解有限,有大佬看到可以分析下可行性或提出改进,也许明年DUSH就能够用上了。
1 下一页