python绘制正态分布函数曲线,正态分布函数python

  python绘制正态分布函数曲线,正态分布函数python

  1.概率论数理统计中常用统计量的Python实现综述

  1.求数学期望

  #编码=utf-8

  进口数量

  arr=[1,2,3,4,5,6]

  #1、数学期望(俗称平均值)

  num_avg=np .均值(arr)

  打印(数量平均值)

  2.求方差和标准差

  #编码=utf-8

  进口数量

  arr=[1,2,3,4,5,6]

  #查找差异

  num_var=np.var(数组)

  打印(数量变量)

  #找出标准偏差

  num_std=np.std(arr,ddof=1)

  打印(数字_标准)

  3.寻找协方差

  #编码=utf-8

  进口数量

  #查找协方差

  x=np.array([[1,2,3],

  [2 ,5 ,6 ],

  [ 7 ,8 ,9],

  [ 11 ,11 ,12]])

  cov_xy=np.cov(x)

  打印(cov_xy)

  二、相关系数的Python实现概要

  1.公式法

  #编码=utf-8

  进口货币

  进口熊猫

  X=[1,2,3,4,5]

  Y=[1.01,2.02,3.03,4.04,5.05]

  #平均值

  XMean=numpy.mean(X)

  YMean=numpy.mean(Y)

  #标准偏差

  XSD=numpy.std(X)

  YSD=numpy.std(Y)

  #z得分

  ZX=(X-XMean)/XSD

  ZY=(Y-YMean)/YSD#相关系数

  r=numpy.sum(ZX*ZY)/(len(X))

  打印(r)

  2.用numpy的corrcoef法计算相关系数。

  #编码=utf-8

  进口货币

  X=[10.11,20.11,33.11]

  Y=[10.22,20.22,30.22 ]

  t=numpy.corrcoef(X,Y)

  印刷(吨)

  3.用熊猫的corr法计算相关系数。

  #编码=utf-8

  进口货币

  进口熊猫

  X=[10.11,20.11,33.11]

  Y=[10.22,20.22,30.22 ]

  数据=熊猫。DataFrame({X:X, Y:Y})

  t2=data.corr()

  打印(t2)

  三。常见分布式Python实现概述

  1.郑泰分布

  正态分布是一个连续分布,它的函数可以取在实线上的任何地方。正态分布由两个参数描述:分布的均值和方差2。

  #编码=utf-8

  进口数量

  fromscipy importstats

  importmatplotlib.pyplot asplt

  mu=0 #均值

  西格玛=1 #标准偏差

  x=np.arange(-3,3,0.1)

  打印(x)

  y=stats.norm.pdf(x,0,1)

  打印(y)

  plt.plot(x,y)

  plt.title(正常:$ \管理部门$=%.1f,$\sigma^2$=%.1f%(管理部门,西格玛))

  plt.xlabel(x )

  plt.ylabel(概率密度,fontsize=15)

  plt.show()

  2.指数分布

  指数分布是一种连续的概率分布,用来表示独立随机事件的时间间隔。比如乘客进入机场的时间间隔,给客服中心打电话的时间间隔,中文维基百科新条目的时间间隔等等。

  我设置参数为0.2,x的取值范围为$[1,10]$。

  #编码=utf-8

  进口数量

  fromscipy importstats

  importmatplotlib.pyplot asplt

  =0.2

  x=np.arange(1,10,0.1)

  y=lambd * np.exp(-lambd *x)

  打印(y)

  plt.plot(x,y)

  plt.title(指数:$\lambda$=%.2f% (lambd))

  plt.xlabel(x )

  plt.ylabel(概率密度,fontsize=15)

  plt.show()

  3.二项分布

  射手射击时,射击成绩分为命中目标和脱靶两种。如果每次射击都是独立的,击中目标的概率都是0.7。讨论四次射击中恰好两次击中目标的概率(0.2646)。

  #编码=utf-8

  进口数量

  fromscipy importstats

  importmatplotlib.pyplot asplt

  P=0.7 #事件A的概率是0.7

  N=4 #重复实验4次。

  k=NP . arange(n-1)# 5可能的结果(0,1,2,3,4)

  r=stats.binom.pmf(k,n,p)

  打印(r)

  4.泊松分布

  服从泊松分布的随机变量x,用速率参数)表示固定时间间隔内的事件数。参数告诉你这个事件的发生率。随机变量x的均值和方差为。

  E(X)=,Var(X)=

  泊松分布的例子:已知一个路口的事故率是每天2次,那么这里一天发生4次事故的概率是多少?

  让我们考虑一下这个平均每天发生两起事故的例子。泊松分布的实现有点类似于二项式分布。在泊松分布中,我们需要指定比率参数。泊松分布的输出是一个序列,包含0,1,2,最多10个事故的概率。我用结果生成了下面的图片。

  #编码=utf-8

  进口数量

  fromscipy importstats

  importmatplotlib.pyplot asplt

  比率=2

  n=np.arange(0,10)

  y=stats.poisson.pmf(n,rate)

  打印(y)

  plt.plot(n,y, o-)

  PLT . title( Poisson:rate=% I %(rate),fontsize=15)

  plt.xlabel(“事故数量”)

  plt.ylabel(数字事故概率,fontsize=15)

  plt.show()

  5.t 分布

  t分布形状类似于标准正态分布;t分布是对称的,比正态分布具有更强的分散性,其密度曲线比标准正态分布更平坦。

  (1)t分布的应用场景:

  -按照小样本估计正态分布且方差未知的总体的均值。

  -对于任何样本量,真实的平均抽样分布都是t分布,因此当有疑问时,应使用t分布。

  -当样本大小在30-35之间时,t分布与标准正态分布无法区分。

  -当样本量达到120时,t分布实际上与标准正态分布完全相同。

  -

  (2)自由度df对分布的影响

  -样本方差使用的是一个估计参数(平均值),所以计算置信区间时使用的t分布的自由度是n-1。

  -由于引入了附加参数(自由度df),t分布的方差大于标准正态分布的方差(置信区间更宽)

  -与标准正态分布曲线相比,自由度df越小,T分布曲线越平坦,曲线中部越低,曲线两侧尾部翘得越高。

  -自由度df越大,t分布曲线越接近正态分布曲线。当自由度df=时,t分布曲线为标准正态分布曲线。

  #编码=utf-8

  进口数量

  fromscipy importstats

  importmatplotlib.pyplot asplt

  不同自由度学生的# T分布和标准正态分布

  进口数量

  fromscipy.stats importnorm

  fromscipy.stats导入

  importmatplotlib.pyplot asplt

  打印(“比较t分布和标准正态分布”)

  x=np.linspace( -3,3,100)

  plt.plot(x,t.pdf(x,1),label=df=1 )

  plt.plot(x,t.pdf(x,2),label=df=20 )

  plt.plot(x,t.pdf(x,100),label=df=100 )

  plt.plot( x[:5],norm.pdf(x[:5]), kx ,label=normal )

  plt .图例()

  plt.show()

  6、贝塔分布(Beta Distribution)

  分布是取值在[0,1]之间的连续分布,用两个形态参数和的值来表征。

  分布的形状取决于和的值。贝塔分布广泛应用于贝叶斯分析。

  #编码=utf-8

  进口数量

  fromscipy importstats

  importmatplotlib.pyplot asplt

  a=0.5

  b=0.5

  x=np.arange(0.01,1,0.01)

  y=stats.norm.pdf(x,a,b)

  打印(y)

  plt.plot(x,y)

  plt.title(Beta: a=%.1f,b=%.1f% (a,b))

  plt.xlabel(x )

  plt.ylabel(概率密度,fontsize=15)

  plt.show()

  亲爱的读者:如果你觉得关注、收藏、喜欢这么麻烦,谢谢!

  055-79000的用途

  1.让大数据和人工智能的专业数学:概率数理统计、线性代数、决策论、最优化理论、博弈论等数学模型通俗易懂。

  2.让大数据与人工智能专业涉及的数据结构和算法:分类、聚类、回归算法、概率等算法通俗易懂。

  3.最新高科技趋势:数据采集中的智能传感器技术:医疗大数据智能决策分析;物联网智慧城市等等。

  根据初学者的需求,目前主流的计算机语言有C语言、Java语言、Python语言、Scala函数等。

  根据读者需求,有浅显易懂的人工智能相关的计算机科学与技术、电子技术、芯片技术等基础学科的文章。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: