外文学术电子图书评价研究基于的实证分析(3)
3.3 数据的正态分布检验
为选择适宜的统计检验方法,需要对数据进行正态性检验。常用的检验方法有单样本Kolmogorov-Smirnov检验(定量)和偏度值分析(定性),本文选用后者,从表1的偏度值可以看出,各指标数据的偏度值均大于0,说明数据分布为正偏态,即Bookmetrix各指标数据不符合正态分布,选择斯皮尔曼相关分析[15],依据结果进行总体分析、对比分析。
3.4 不同学科电子学术图书被引量、读者数与下载量差异比较
对化学、社会科学学术图书的被引量、读者量、下载量作图,进行对比(见图2)。
从图2(a)宏观上可以看出,化学电子图书的被引量与社会科学的被引量数据,高低起伏,但被引量的峰值均为化学类的电子图书,统计数据显示,化学电子图书的最高引用量为65次,而社会科学图书的最高被引量为41次。
但从图2(b)、(c)看出,读者量、下载量的峰值为社会科学类图书,结合统计数据,化学电子图书的最高读者数为143,而社会科学图书最高的读者数为265,化学电子图书的最高下载量为63 354次,社会科学电子图书的最高下载量71 710。
3.5 不同学科电子书的被引频次、读者数量与下载量的非参数检验
两独立样本的非参数检验是在样本所属总体不服从正态分布且分布情况未知时,通过对样本的分析,判断相应的总体分布是否存在显著差异性的方法。对于数据不符合正态分布的样本,SPSS提供了4种独立样本的非参数检验方法,包括Mann-Whitney U检验,Kolmogorov-Smirnov Z检验,Wald-Wolfowitz Runs检验以及Moses Extreme Reactions检验,本研究采用Mann-Whitney U检验,用于判别两个独立样本所属的总体是否有相同的分布,注重对两样本分布的中心位置(平均水平)做检验。
以化学、社会科学的电子图书作为两个独立样本,以被引量为例,进行Mann-Whitney非参数检验。
首先,对样本进行分组:1.0组为Chemistry,2.0组为Social Science。
其次,提出零假设H0和备择假设H1。
H0:μ1=μ2,Chemistry和Social Science电子书被引量无显著差异;
H1:μ1≠μ2,Chemistry和Social Science电子书被引量有显著差异。
最后,将数据分组导入SPSS,进行Mann-Whitney U 检验,结果见表2。
表2 Mann-Whitney检验a列组分组数字等级平均值等级之和被引量
b检验统计a被引量Mann-WhitneyUWilcoxonWZ-1230渐近显著性(双尾)0219a.分组变量:^1。
图2 化学、社会科学不同指标对比图
表2a为两组统计量的描述统计结果。表2b为Mann-Whitney非参数检验结果,双尾显著性概率为0.219,大于0.05,因此接受原假设,即化学和社会科学电子图书被引量无显著差异。
同理,对读者数、下载量两指标进行Mann-Whitney非参数检验,结果发现:化学和社会科学电子图书的读者数没有显著差异(双尾显著性概率为0.300>0.05),化学和社会科学电子图书的下载量有显著差异(双尾显著性概率为0.018<0.05)。
3.6 分学科相关性分析结果对比
化学电子学术图书的被引量与读者数、下载量的斯皮尔曼检验结果见表3。
社会科学电子学术图书的被引量与读者数、下载量的斯皮尔曼检验结果见表4。
表3 化学电子图书各指标相关系数矩阵CitationsMendeleyReadersDownloads斯皮尔曼等级相关系数Citations相关系数??0483??显著性(双尾)00000000MendeleyReaders相关系数9626????显著性(双尾)00000000Downloads相关系数0483??0619??1000显著性(双尾)00000000注:**.相关性在0.01级别显著(双尾)。
表4 社会科学各指标相关系数矩阵CitationsMendeleyReadersDownloads斯皮尔曼等级相关系数Citations相关系数??0418??显著性(双尾)00000000MendeleyReaders相关系数0416????显著性(双尾)00000000Downloads相关系数0418??0586??1000显著性(双尾)00000000注:**.相关性在0.01级别显著(双尾)。
相关系数r是用来衡量两个变量之间线性相关关系的参数,一般按数值大小划分:0<r≤0.3为微弱相关;0.3<r≤0.5为低度相关;0.5<r≤0.8为显著性相关;0.8<r≤1为高度相关[16]。由表3、表4看出,在0.01的显著水平上,化学图书的引用量与Mendeley读者数的相关系数为0.626,而社会科学图书的引用量与Mendeley读者数的相关系数仅为0.416。化学图书的被引量与下载量的相关系数为0.483,社会科学图书的引用量与下载量的相关系数为0.418。因此,无论是化学还是社会科学,被引量与Mendeley读者数、被引量与下载量都有统计意义上显著的一定强度的正相关。
4 结 论
文章来源:《国外文学》 网址: http://www.gwwxzz.cn/qikandaodu/2021/0715/604.html