阅读: 2023/12/27 10:47:02
以下文章来源于来点方法 ,作者金助理的方法
变量可以说是定量研究的灵魂,掌握变量的类型至关重要,因为变量的类型决定了我们采用何种数据分析方法。然而,我们在阅读论文的时候经常会看到各种各样的变量,可谓是琳琅满目、五花八门,如定类变量、定序变量、定距变量、定比变量、连续变量、离散变量、虚拟变量、类别变量、定名变量、名义变量、哑变量、分类变量等等,那么是不是真的有如此之多的变量类型呢?
答案是:并没有。
上述列出的各种变量的名称,只是因为学科间的使用习惯不同,翻译不同,导致出现了五花八门的变量。
·在社会调查领域,一般将变量划分为四种类型:定类变量、定序变量、定距变量和定比变量
·在统计学领域,一般将变量划分为两种类型:数值变量和分类变量
·由于一些特殊的原因,出现了一些“新”的变量,如虚拟变量、离散变量
因为,我们识别变量类型的最终目的是要进行统计分析,那么我们按照统计学领域常用的两分类的做法来对这些变量进行归纳和辨析。
·数值变量,顾名思义这类变量的值是数值的形式,由于数值形式不同可以进一步划分为连续变量和离散变量,连续变量和离散变量的区别是:连续变量可以取任意实数,而离散变量只能取自然数,可以认为离散变量是一种特殊形式的连续变量。对应到社会调查领域的习惯,包括定距变量和定比变量,他们二者的区别是定比变量有一个实际意义的0点,但是这个区分在统计分析中并没有太大的意义。
·非数值变量,与数值变量相比,非数值变量的变量值没有数学含义,只是单纯的分类,例如男性、女性;城市、农村。非数值变量也可以成为类别变量,定类变量。而在类别变量这一大类中,变量的各种名称则五花八门,其中很多是因为翻译不同带来的。类别变量具体包括定类变量和定序变量,二者的区别是定序变量往往是3类及以上,并且不同类别之间有明显的的顺序,例如受教育程度小学、初中、高中、大学等。其中定类变量也可称为定名变量、名义变量、分类变量,定序变量也称为次序变量。在定类变量中,有一类特殊的变量:虚拟变量(也被称为哑变量),他的特殊之处在于虚拟变量只有两个分类,并且在数据录入编码的时候,将这两个分类分别编码为0和1。事实上,当我们使用统计软件做Logit回归的时候,也必须将二分类变量严格编码为01。
通过上述梳理我们可以发现,变量类型本质上就可以划分为两种:数值变量和类别变量,二者的核心差别是变量值是否有数学意义。
在数值变量下的分类,离散变量只是连续变量的一种特殊情况,定距变量和定比变量的划分也并没有太多的意义。
在非数值变量下的分类,定序变量和虚拟变量也是定类变量的特使情况。
转自:“量化研究方法”微信公众号
如有侵权,请联系本站删除!