python 熵值法,信息熵怎么计算

  python 熵值法,信息熵怎么计算

  

  1、什么是信息熵?

  香农在1948年提出了信息熵的概念。

  信息理论:

  1、从信息的完整性上进行的描述:

  当系统的有序状态一致时,数据越集中,熵值越小,数据越分散,熵值越大。

  2、从信息的有序性上进行的描述:

  当数据量一致时,系统越有序,熵值越低。系统越混乱或分散,熵值越高。

  信息熵是衡量样本集纯度最常用的指标。

  二、python实现信息熵的计算代码

  1、导入库

  importnumpyasnp

  2、 准备数据进口有限公司

  数据=pd。数据帧(

  { 学历 3360 [大专,专科,专科,专科,本科,本科,本科,本科,

  研究生,研究生,研究生,研究生],

  婚姻 3360 [否,否,是,否,否,是,否,否,否,否,是,

  有车吗3360 [没有,没有,没有,是,没有,是,是,是,是,是,是,是,否,否

  没有],

  收入水平 3360 [中,高,高,中,中,高,高,高,高,高,

  非常高,中等],

  类别 3360 [否,否,是,是,否,否,是,是,是,是,是,是,是,是

  #定义计算信息熵的函数:计算Infor(D)

  define for(data):

  a=pd.value_counts(数据)/len(数据)

  return sum(NP . log2(a)* a *(1))3、定义信息熵函数

  #print(infor(data[学历])#测试结果为:20000.000000000005

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: