IV计算公式,变量iv值计算

  IV计算公式,变量iv值计算

  建模时,我们预测单个变量的预测能力,主要用IV值这个指标。IV值的预测能力如下:

  IV=0.02:无预测能力;

  0.02-0.1:预测能力弱;

  0.1-0.3:预测能力中等;

  0.3-0.5:预测能力强;

  大于0.5是超强预测能力;

  计算IV值的公式:

  Pgood_section_total:子盒子里的好用户占整体好用户的比例;

  Pbad_section_total:子盒不良用户占整体不良用户的比例;

  Pgood_section:好用户占整个子盒子的比例;

  Pbad_section:子盒中不良用户占整个子盒的比例;

  Pgood_total:好用户占整体的比例;

  Pbad_total:好用户和整体的比例;

  Python实现逻辑:

  d1=pd。DataFrame({X:data[type], Y :data[ seriousdlqin 2 yers ]})D2=D1 . group by([ X ],As_index=True)#单个要素的数量good=data[ seriouslqin 2 yers ]。sum()bad=data[ seriouslqin 2 yers ]。count()-good D3=PD . data frame(D2 . x . count(),columns=[ good _ count ])D3[ good _ count ]=D2 . sum()yd3[ total _ count ]=D2 . count()yd3[ rate ]=D3[ good _ count ]/D3[ total _ rate ]=D3[ good _ count ]/good D3[ jzdwdm _ rate ]=(D3[ total _ count ]-D3[ goodsum()print (d3)print (IV=,IV)

  Excel实现逻辑:

  Excel特定公式可从以下资源下载:

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: