统计学基础知识点:数据类型

导语:统计数据是客观现象特征的反映,而由于客观现象的复杂性,在反映这些特征时,我们可以从不同的角度收集不同类型的数据,这是统计检查的重要内容。让我们一起来回顾一下:

一.变量和数据

变量或变数是指没有固定值而可以改变的数字。变量的具体数值称为变量值,即数据。统计数据是统计变量的具体表现。

第二,数据类型

定性变量(数据)和定量变量(数据)

1.定性变量:反映“职业”、“受教育程度”等现象特征,但不能说明具体量的大小和差异的变量。

分类变量:没有数量特征,只有分类特征。这个变量,只反映现象的分类特征,也叫分类变量。分类变量的观测结果就是分类数据。描述事物类别的名称。例如,“性别”是一个分类变量。

序列变量:如果类别有一定的顺序,如“教育类别”,这类变量称为序列变量,对应的观察结果为序列数据。描述事物有序类别的名称。这类变量的具体表现就是序列数据。

2.数值型(数量型)变量:“天气温度”、“月收入”等变量可以用数值来表示,这些数值有明确的数值意义,不仅可以分类,还可以衡量具体的大小和差异。这些变量就是数量变量,也叫数值变量,数量变量的观测结果就变成了数量数据。描述某物的数字特征的名称。

分类变量没有数值特征,所以无法对其数据进行数学运算。分类数据只能用来区分事物,不能用来显示事物的大小和好坏关系。

序列变量比分类变量更进了一步,不仅可以用来区分客观现象的不同类别,还可以显示现象的大小、高低和优劣。显然,顺序数据的作用比分类数据强,对事物的划分也更细致。但是,虽然顺序数据的数据可以在大小上进行比较,但无法计算出它们之间的大小、高度或距离。它只反映事物性质的差异,而不能用来反映事物数量的差异。所以从本质上来说,序列数据还是一种定性数据。

数值型数据作为统计研究的主要数据,其特征在于其数值形式。有些数值型数据只能计算出数据间的绝对差,有些不仅可以计算出数据间的绝对差,还可以计算出数据间的相对差。其测量精度远高于定性数据。在统计学研究中,对数值数据的研究是定量分析的主要内容。

从以上三种数据的基本特征可以看出,这三种数据对事物的描述是从定性到定量,从低到高,从粗到细。在统计研究中,要明确适用于各种数据的统计方法,并正确选择和应用,这是正确进行统计研究的基本要求。

(2)观测数据和实验数据

根据获取数据方法的不同,可以分为观察数据和实验数据。观察数据可能是综合数据,也可能是样本数据(局部),实验数据一般是样本数据。

1,观测数据。

观测数据是通过对客观现象进行实地观察而获得的数据,在数据获取过程中一般不存在控制和条件约束。在社会经济问题的研究中,观察是获取数据最重要的方法。

2.实验数据。

实验数据一般是在科学实验的环境下获得的。在实验中,实验环境受到严格控制,数据的产生必然是某种约束的结果。实验方法在自然科学研究中被广泛使用。