阅读: 2023/1/29 8:41:51
英国医学杂志中文版, 2022,25(12) Cole Tim J, Altman Douglas G, 李戈, 等.
对数变换具有非常实用的性质,因此在统计学中被广泛应用,但是即便是统计学家对其属性也知之甚少,而非统计学家则感觉其很不友好1,2,3,4。
对数变换两种常见形式为:以10为底的普通对数(lg)和以e作底的自然对数(ln)1。以自然对数为例,解释如下:任意两个数字a、b,其对数差ln(a)-ln(b),实际上反映的是二者比值大小。在此结果上乘以100,100×ln(a)-100×ln(b),即为a、b基于对数变换的相对差异百分比5。
该指标与常规相对差异百分比算法略有不同,但它解决了上一篇统计学笔记中所阐述的非对称和不可加性问题6。如:当男、女身高均值分别为177.3、163.6 cm,常规算法结果为:女性比男性低7.7%,及男性比女性高8.4%1,二者不对称;而基于对数变换的相对差异百分比为:
100×ln (177.3) -100×ln (163.6)=8.04%
即男性比女性高8.04%,女性比男性低8.04%,该指标有对称性,即交换对比基线后,绝对值相等,正负对称。
以往统计学笔记的案例数据说明克罗恩病患者和乳糜泻患者的二头肌皮褶厚度数据对数变换后的均数分别为1.44、1.14,则差值为0.30[95%可信区间(CI): -0.11~0.71],乘以100,得到30%(95%CI: -11%~71%),区间以30%为中心对称,表示两种疾病患者的二头肌皮褶厚度平均差异为30% 4。这样概括解释对数变换数据简明扼要,无需计算反对数1。
数据经自然对数变换后,其标准差也存在如何理解的问题,此处标准差可视为变异系数的另一种形式:比值标准差(标准差/均值),乘以100即可转换为百分位变异系数。
上例二头肌皮褶厚度经对数变换,两组标准差分别为0.49、0.52,相当于"变异系数"分别为49%、52%。相对应地,传统算法的变异系数较大,分别为51%、56%。二者差异说明数据更倾向于对数正态分布而非正态分布4。
将结局指标对数变换后进行回归分析时,常使用100×ln报告结果。如Hypp?nen等7利用该变换证明了血清IgE浓度与维生素D水平间的非线性关系:在控制了其他11个影响因素后,以维生素D血浓度100~125 nmol/L为参照,试验对象维生素D<25 nmol/L时,其IgE升高29%(95%CI:9%~48%),维生素D≥135 nmol/L时,其IgE升高56%(95%CI: 17%~95%)。
另一个案例,新生儿科医生以g·d-1·kg-1为单位测量体重增加,这是比值增长率指标,以1 000×ln(体重)为因变量,以年龄(天)为自变量,代入线性回归模型得到的回归系数可估计该指标,即用对称千分位为单位1 000×ln(体重)测量体重增加。以此类推,可以采用对称百分比为单位100×ln(身高)测量新生儿身高变化5。
总而言之,100×ln转换使得比较的测量尺度具有对称性和可加性,组间均值差用百分位表示,标准差是百分单位的变异系数,回归系数也可用百分单位表示。Cole等还有更多实例5。该方法常用于探索取值为正的连续变量间的关系,在生物化学和人体测量学中常见。
转自:“医学科研与管理空间”微信公众号
如有侵权,请联系本站删除!