当前位置:无忧公文网 >范文大全 > 征文 > 大数据时代背景下R软件在概率论与数理统计课程实践教学中的应用研究

大数据时代背景下R软件在概率论与数理统计课程实践教学中的应用研究

时间:2022-03-04 08:33:32 浏览次数:

摘 要:本文以大數据时代为背景,基于R软件分析概率论与数理统计的教学中,探索如何在实践教学中提高教学质量,充分调动学生积极性的同时,提高了大学生学习知识、运用知识解决实际问题的能力。

关键词:大数据;R软件;实践教学

大数据指在一定时间范围内无法使用常规软件工具捕捉、管理和处理的数据集合。大数据具有多种数据类型、快速采集速度、庞大的数据量和低数据成本等特点。目前,大数据时代已经到来,政府、企事业单位等机构已经意识到数据是组织机构重要的资产,数据的分析能力成为各个组织核心竞争力。统计部门和高校科研单位要对海量数据进行处理,挖掘数据宝库,发现潜在规律信息等,为政府部门决策提供理论支持[1]。作为分析数据的一门重要学科,概率论与数理统计在大数据时代显得尤为重要。在信息快速发展的大数据时代,传统的概率论与数理统计的教学也面临这诸多挑战。

一、概率论与数理统计课程的教学现状

许多现代高校都把培养应用型人才作为培养目标,但是在课程的设置上还是侧重理论基础。概率论与数理统计是理工科类大学生必修数学理论基础课程,是学习许多其他专业基础课的先修课程,对其他专业课学习有重要的影响。但是由于概率论与数理统计课程内容抽象、理论推导复杂、计算量大等特点;对于数学基础较差的学生,学习更加困难,造成学习倦怠。另外,教师又很难在有限的时间内充分完成教学任务,又能对典型例题进行有效练习。诸多原因造成概率论与数理统计课程的教学质量很不乐观[2]。随着教育改革的不断深入,教育教学理论与观念不断更新,现代教育倡导以学生的发展为出发点,在教学过程中将理论知识与实践相结合,才能使得学生掌握的知识转化为实际生产力,同时通过实践教学提高学生分析和解决实际问题的应用能力。在现代信息技术大力推广的时代,如何让抽象的数学课程变得直观、生动、富有乐趣,让复杂、繁琐的理论推导过程变得简单明了,通俗易懂,让学生从被动的学习变成主动的获取、探索,是概率论与数理统计课程改革方向和目标。在多媒体教学的基础上,借助R统计软件辅助教学成为探索大数据时代概率论与数理统计课程新的教学手段。

二、R软件在实践教学中应用案例探究

好的实践教学效果离不开好的统计软件。R是一种流行且完全免费的免费开源统计软件,是统计计算和统计绘图的绝佳工具。而且在数据挖掘等领域,人大经济论坛,数学中国论坛、统计之都等论坛汇集了众多对R软件有兴趣的统计学、数据挖掘的专家和爱好者,共同探讨R软件在统计分析和数据挖掘方面的应用[3]

下面我们通过实践案例说明在概率论与数理统计教学中如何使用R软件进行实践教学和计算分析。

例1:已知某种材料的抗压强度 ,现随机地抽取 10 个试件进行抗压试验,测得数据如下:

482 493 457 471 510 446 435 418 394 469

(1)求平均抗压强度 的置信水平为 95%的置信区间;

(2)若已知 ,求平均抗压强度 的置信水平为 95%的置信区间;

解析:这是学习区间估计时常见案例,通常教材上的会采用常规理论推导计算不同类型下的区间估计.

下面使用R软件编程,并调用相关的程序

编程语言:

interval_estimate1<-function(x,sigma=-1,alpha=0.05){

n<-length(x); xb<-mean(x)

if (sigma>=0){

tmp<-sigma/sqrt(n)*qnorm(1-alpha/2); df<-n

}

else{

tmp<-sd(x)/sqrt(n)*qt(1-alpha/2,n-1); df<-n-1

}

data.frame(mean=xb, df=df, a=xb-tmp, b=xb+tmp)

}

编写程序后,在命令编辑窗口中输入如下命令:

>  source(“interval_estimate1.R”)

>  X<-c(482,493,457,471,510,446,435,418,394,469)

>  interval_estimate1(X)

mean     df        a         b

1 457.5     9      432.3069   482.6931

R软件会轻松计算出在方差未知的情况下平均抗压强度的置信水平为 95%的置信区间为。

同样地,当方差已知的情况下输入

>  interval_estimate1(X,30)

mean    df        a         b

1 457.5   10     438.9061   476.0939

R软件会轻松计算出在方差已知的情况下平均抗压强度的置信水平为 95%的置信区间为。

例2:化肥厂用自动包装机包装化肥,每包的质量服从正态分布,其平均质量为100kg,标准差为1.2kg。某日开工后,为了确定这天包装机工作是否正常,随机抽取 9 袋化肥,称得质量如下:

99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5.

设方差稳定不变,问这一天包装机的工作是否正常(取)?

传统理论推导计算步骤如下:

解:概率论与数理统计常规方法为建立检验假设,选取统计量,给定显著性水平,确定双侧拒绝域,并且计算检验的值,确定接受原假设还是拒绝原假设,即可以判断这一天包装机的工作正常.

编程语言:

mean.test1<-function(x, mu=0, sigma=-1, side=0){

source(“P_value.R”)

n<-length(x); xb<-mean(x)

if (sigma>=0){

z<-(xb-mu)/(sigma/sqrt(n))

P<-P_value(pnorm, z, side=side)

data.frame(mean=xb, df=n, Z=z, P_value=P)

}

else{

t<-(xb-mu)/(sd(x)/sqrt(n))

P<-P_value(pt, t, paramet=n-1, side=side)

data.frame(mean=xb, df=n-1, T=t, P_value=P)

}

}

> source(“mean.test1.R”)

> X<-c(99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.1,100.5)

> mean.test1(X, mu=100, side=0)

mean     df           T         P_value

1 99.97778   8      -0.05499613     0.9574902

通過R软件P值为0.9574>0.05, 故接受原假设,可以认为这一天包装机的工作正常。

三、R软件在概率论与数理统计教学实践意义

概率论与数理统计是一门研究随机现象统计规律的学科,课程本身较为抽象,学生普遍反映面对抽象的概念定义、复杂的计算过程、难以理解的理论推导时往往都会失去学习兴趣。如果仅采用传统的教学模式、方法、手段,不但难以提高学生学习的积极性,教学效果相对也较差。

从前面的几个教学实例的介绍可见,以R软件进行辅助教学,一方面,可以让复杂的计算过程用简单的几行程序代码快速呈现,减轻学生对概率论与数理统计课程的恐惧和反感,提高学生学习的积极性、主动性;另一方面,由于R软件具有强大的图形可视化功能,可以借助图形将计算结果显示出来,增加结果的直观性,更有助于对统计结果的合理解释。在实践教学过程中,R软件使得抽象的教学内容变得直观、生动的同时教学重难点也得突破,教学效果显著提高。与此同时,在学习概率论与数理统计理论基础知识的同时,对R软件有了简单的了解,增加深入学习R语言的兴趣。

总之,将R软件融入到概率论与数理统计课程的实践教学中,既有利于教师在有限的时间内把抽象的理论知识转化为生动、形象的图形、图表,使得理论知识具体化了、直观化了,这样也激发了学生对数学相关课程产生浓厚的兴趣的同时,让学生掌握、精通一门编程语言,进一步提高学生的分析问题和解决实际问题的能力,为统计建模、数学建模类的实践能力大赛打下坚实的基础

在大数据时代背景下,培养综合的应用型人才是各高校人才培养目标,而能够熟练精通掌握一门计算机编程语言又是新时代用人单位对大学生的基本要求,所以把R语言融入到概率论与数理统计的教学实践中,可以在改善课堂教学效果的同时,让学生掌握一门实用编程语言,并掌握处理和分析数据的能力,为学校实现培养应用型人才的目标提供有力保障和奠定坚实基础。

参考文献

[1] 蒋东兴,付小龙.大数据背景下的高校智慧校园的建设探讨[J].华东师范大学学报,2015(3):119-131.

[2] 赵为华.R软件在概率论与数理统计案例教学中应用[J].福建电脑,2018,34(5):171-172.

[3] 李向利,赵红卫.大数据时代背景下统计学教学模式的改革研究——以桂林电子科技大学为例[J].赤峰学院学报:自然科学版.2016(3):262-263.

推荐访问: 概率论 数理 实践 课程 统计