• 92795

    文章

  • 776

    评论

  • 17

    友链

  • 最近新加了换肤功能,大家多来逛逛吧~~~~
  • 喜欢这个网站的朋友可以加一下QQ群,我们一起交流技术。

初级数据分析中的12个常用分析指标和术语

撸了今年阿里、腾讯和美团的面试,我有一个重要发现.......>>

    注:本文摘自“中国统计网”微信公众号!--  因为归纳得实在是太好了!

        在进行数据分析(描述性统计分析/初级数据分析)时,经常会用到一些分析指标和术语,这些指标和术语可以帮助我们打开思路,从多种角度对数据进行深度解读。

1.  平均数(average)

一般指算术平均数。就是一组数据的算术平均值,即全部数据累加除以数据个数的结果。

例如:上一年公司一到四季度的销售额分别为260万、320万、220万、400万,那么平均季度销售额为(260 + 320 + 220 + 400)/ 4 = 300,即平均季度销售额为300万。

2.  绝对数(absolute number)与相对数(relative number)

绝对数:是总量指标,它是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合指标。例如:公司年销售额2000万,公司总人数160 人等。

绝对数也可以表现为某现象总体在一定时间、地点条件下数量增减变化的绝对数,例如:A产品的年销售额比B产品的年销售额多260万。

相对数:是指两个有联系的指标对比计算而得出的数值,它是反应客观现象之间的数量联系紧密程度的综合指标。相对数的计算公式:相对数 = 比较值(笔数)/基础值(基数)

相对数一般以倍数、成数、百分数等表示,它反应客观现象之间数量的联系程度。例如:公司女员工人数占比20%;公司男女员工比例为1:5;本月销售额是上个月的3倍;本季度销售额只完成任务的8成等。

3.  百分比(percentage)与百分点(percentage point)

百分比:相对数中的一种,他表示一个数是另一个数的百分之几,也称为百分率或百分数。

运用百分数时,也要注意概念的精确。例如:“比过去增长20%”,即过去为100,现在是“120”;“比过去降低20%”,即过去是100,现在是“80”;“降低到原来的20%”,即原来是100,现在是“20”等。

百分点:指不同时期以百分数形式表示的相对指标(如:速度、指数、构成等)的变动幅度。

例如:公司所有产品销售总额中,A产品的销售占比由去年的25%上升到今的35%,我们可以说:公司销售总额中,A产品所占的比重,今年比去年上涨了10个百分点(35-25=10);但不能说上涨了10%。

4.   频数(Frequency )和频率(Relative frequency)

频数:在一组数据中,某个数据出现的次数叫作频数。

频率:某个数据出现的次数与总次数的比值称为频率。

例如:抛一枚硬币100次,正面朝上有53次,反面朝上有47次,这里硬币正面朝上的频率是53/100,正面朝上的频数就是53,反面朝上的频率是47/100,反面朝上的频数是47。

5.   比例(proportion)和比率(ratio)

比例:表示总体中的某一部分数量占总体数量的比重, 反映总体的构成或者结构。一般用百分比的形式表示。

比率:表示总体中两个部分之间的比较,反应总体中各部分的关系,用几比几的形式表示。

例如:公司有50人,男生30人,女生20人,男生比例是30:50, 女生的比例是20:50,男生与女生的比率是30:20

6.  倍数(multiple)与番数(doubling)

倍数:表示一个数据是另一个数据的几倍,通常用一个数据除以另一个数据获得。例如:A/B=C,那么A是B的C倍。

番数:指原来数量的2的n次方倍。例如:公司去年利润为200万,今年利润比去年翻一番,即400万(200 * 2);今年利润比去年翻两番,即800万(200 * 2 * 2)。

7.   同比(year-on-year)与环比(month-on-month)

同比:与历史同时期进行比较得到的数值。

例如:我公司今年一季度A产品销售额同比增加35%,意思是今年一季度A产品销售额比去年一季度A产品销售额增加35%,这是同比。

环比:与前一个统计期进行比较得到的数值。可以是2月与1月相比、8日与7日相比、二季度与一季度相比等等。

例如:我公司今年二季度B产品销售额环比增加30%,意思是今年二季度B产品销售额比一季度增加30%。

8.  字段与记录

字段:是代表事物或现象某种特征的变量。例如:下表中的"员工薪酬“、"车辆费"等。

记录:是事物特征的具体表现。例如:下表中的一行即为一条记录。

费用表

9.  众数

数据集合中出现次数最多的数值称为众数。如果有两个或多个数值出现次数并列最多,那么这两个或多个数值都是该集合的众数。

例如:数据集合{2、3、8、6、3、5、3、2、6、3}中众数为3。

10.  中位数

将数据集合中所有数据按照升序或降序排列,居于最中间的数值即为该集合的中位数,若集合中数值个数为奇数,取最中间一个为中位数,若集合中数值个数为偶数,取最中间两个数值的算术平均数为中位数。

例如:{2、5、6、9、13、15、20}中位数为9;{3、5、6、8、9、12、13、17}中位数为(8+9)/2=8.5。

11.  加权算术平均数

加权算术平均数是计算具有不同权重的数据的算术平均数。

所谓数据的权重是反映一个数据在数据集合中的重要性,一般用权数来表示。

将数据集合中各数据乘以相应的权数,然后加总求和再除以所有权数之和,即为该数据集合的加权算术平均数。它适用于已分组数据集合。

假设有一组数据集合,包含k个数据组,各组的简单算术平均数分别为  每组数据的数据个数分别为 每组数据的个数就是该组数据的权数,那么加权算术平均数的公式为:

例如:某水果超市购入苹果200斤,每斤3.5元;香蕉180斤,每斤3.3元;葡萄260斤,每斤4.2元,那么所购入的水果平均每斤多少元,通过加权算术平均数公式可得:

12.  几何平均数

在分析产品合格率、银行利率、平均发展速度等问题时,数据之间的关系不是加减关系,而是乘除关系,应运用几何平均数分析。

 

将数据集合中的n个数据连乘积的n次方根称为几何平均数。

假设一个数据集合的数据分别为 且所有数值都大于0,那么该数据集合的几何平均数公式为:

例如:某工厂有一条生产线有三道工序,每道工序的产品合格率分别为93%、88%、94%,计算这条生产线的平均合格率。

由于只有合格品才能进入下一道生产工序,所以每道工序的合格率之间是乘积关系,利用几何平均数公式分析可得:


695856371Web网页设计师②群 | 喜欢本站的朋友可以收藏本站,或者加入我们大家一起来交流技术!

欢迎来到梁钟霖个人博客网站。本个人博客网站提供最新的站长新闻,各种互联网资讯。 还提供个人博客模板,最新最全的java教程,java面试题。在此我将尽我最大所能将此个人博客网站做的最好! 谢谢大家,愿大家一起进步!

转载原创文章请注明出处,转载至: 梁钟霖个人博客www.liangzl.com

0条评论

Loading...


发表评论

电子邮件地址不会被公开。 必填项已用*标注

自定义皮肤
注册梁钟霖个人博客