Logistic回归是分类资料回归分析的一种,而且是最基础的一种。Logistic回归应用广泛、关注度较高,在医学研究、市场研究等方面比较流行。下图是CNKI学术搜索给出的学术关注度,可见其被广泛关注应用程度和时间序列的关系。
Logistic回归主要应用领域
1、影响因素、危险因素分析
主要在流行病学中应用较多,比较常用的情形是探索某疾病的危险因素,也即影响因素分析。包括从多个可疑影响因素中筛选出具有显著影响的因素变量,还包括仅考察某单一因素是否为影响某一事件发生与否的因素。
2、预测是否发生、发生的概率
如果已经建立了logistic回归模型,则可以根据模型,预测在不同的自变量情况下,发生某病或某种情况的概率有多大。
3、判别、分类
实际上跟预测有些类似,也是根据logistic模型,判断某人属于某病或属于某种情况的概率有多大,也就是看一下这个人有多大的可能性是属于某病。
Logistic回归案例一枚
源数据:数据来自《Clementine数据挖掘方法及应用》中案例数据BuyOrNot.sav,包含431个样本数据,变量有:是否购买(0未购买,1购买)、年龄、性别(1男、2女)和收入水平(1高收入、2中收入、3低收入)。年龄为数值变量,其他为分类变量。
数据分析的目标:(仅基于此样本)年龄、性别、收入,哪些因素在影响购买决策?
参考工具书:张文彤,《SPSS11统计分析高级教程》;薛薇《Clementine数据挖掘方法及应用》。
以下为案例:
作者:数据小兵
链接:http://www.datasoldier.net/post/logistic.html
本文为专栏文章,来自:数据小兵,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/3872.html 。