【求助】如何用自己的数据进行机器学习?
mathematica吧
全部回复
仅看楼主
level 1
各位前辈好,我现在有一个excel,里面有400个4维数据:即3列特征值{x1,x2,x3},对应一个y。数据如下:
现在想用随机森林进行机器学习,我查了一下可以用mathmatic里的Predict[]进行建模。但我遇到一些问题想请教大神们,就是:
(1)我如何从excel里导入我的数据?
(2)如何让Predict[],对{x1,x2,x3}→y进行建模?
例如,例子里面的:
[In]: PW = Predict[{{5.251, 4.831, 0.295} -> 1, {4.685, 4.831, 0.295} ->
2.5, {0.876, 4.831, 0.295} -> 3, {0.713, 4.831, 0.295} ->
1, {0.552, 4.831, 0.295} -> -4.2, {6.047, 5.111, 0.901} -> 2}]
[In]: PW[{0.876, 4.831, 0.295}](*给定特征,预测新样本的值*)
[Out]: 0.66
因为我的数据太多了,不能一一输入,我想请教大家,我如何使把我的数据用Predict[]建模,并预测我另一个只有100个{x1,x2,x3}表格里的数据呢?
麻烦大家了~
2019年03月02日 11点03分 1
吧务
level 15
2019年03月02日 11点03分 2
吧主,你好,谢谢你,我已经看了你推荐的帖子。我现在可以导入数据了。但是,我不知道怎么把导入的数据引用到Predict[]里,用我的数据进行建模。请问,你知道吗?
2019年03月02日 11点03分
就是用excel前三列作为特征数据,预测第四列数据
2019年03月02日 12点03分
@保卫北极熊 教你个简单的:{{1, 2, 3, 4}, {5, 6, 7, 8}} /. {a_, b_, c_, d_} :> {a, b, c} -> d 注意此法简单但效率相对不高。想要高效的请看Transpose,Part,Span的帮助,此外注意Predict的第2种语法。
2019年03月02日 12点03分
@xzcyr 嗯嗯,好的。谢谢~我试一下
2019年03月02日 12点03分
1