使用SPSS进行Logistic Regression时应注意的问题

来源:互联网 发布:java接口有构造函数吗 编辑:程序博客网 时间:2024/06/02 13:49

感觉这些年Logistic Regression被用得越来越多,所以这里简单给大家提供些参考。其实已经有很多教程了,例如这个:http://wenku.baidu.com/view/d526749951e79b8968022654.html 就已经说得很详细了。我简单说一下大家可能遇到的问题:

1. 如果训练数据分布不均匀怎么办?如果训练数据的0,1分布严重不均,将导致训练的分类模型性能下降,解决的方法是拿出一部分已有的数据,保证0,1分布基本相近,然后再进行训练。

2. 怎样用SPSS训练出来的模型预测新的数据?这个问题实际上在现实中很重要,但是奇怪很多书里面也不讲,网上的教程(例如前面那个)也不讲,真是误人子弟啊。简单来说,这个需求如果用R,SAS,STATA来做,可能比较容易,用SPSS稍微麻烦一点:

在训练的时候,在Logistic回归的对话框中选择“保存”——“将模型信息输出到XML文件”,然后运行Logistic Regression,之后就可以在指定文件夹下看到生成的XML文件了。打开新的程序后,选择“实用程序”——“评分向导”——然后设置一些对应变量,就可以在新的数据界面中看到“PredictedValue”这一列预测值了。这个功能从SPSS 19以后支持。在“保存”那里的界面如下图所示:


0 0
原创粉丝点击