python产生,python特征值

  python产生,python特征值

  业内常说,数据决定模型效果的上限,机器学习算法通过数据特征预测模型效果。好的特征可以显著提高模型效果。这意味着特征生成(即从数据设计中处理模型的可用特征)是特征工程中的一个重要步骤。

  一、特征生成作用

  1.增加特征的表达能力,提高模型效果;

  (比如体重除以身高是表达健康的重要特征,而单纯看身高或体重对健康的表达有限。)

  2.它可以集成到业务理解设计特性中,以增加模型的可解释性。

  二、特征生成方法

  1、聚合方式

  有一对多字段,对对应的记录进行分组汇总,统计平均值、计数、数值等数据特征。

  #自定义分组聚合统计功能

  defx2_sum(集团):

  returnsum(第**2组)

  df . group by( cust _ no ). C1 . apply(x2 _ sum)2、转换方式

  通过字段之间的加、减、乘、除等运算生成数据特征的过程,不同的字段类型采用不同的转换方法。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: