一品文秘网 - www.sdelec.cn 2025年05月25日 05:03 星期日
当前位置 首页 >专题范文 > 公文范文 >

统计研究方面的问题(13篇)

发布时间:2023-01-03 19:50:04 来源:网友投稿

统计研究方面的问题(13篇)统计研究方面的问题  医学科研论文中常见的统计学问题  在医学科研论文中,统计学方法是必不可少的应用工具,可以从侧面反映出作者力求使其研究成果更具科学性、下面是小编为大家整理的统计研究方面的问题(13篇),供大家参考。

统计研究方面的问题(13篇)

篇一:统计研究方面的问题

  医学科研论文中常见的统计学问题

  在医学科研论文中,统计学方法是必不可少的应用工具,可以从侧面反映出作者力求使其研究成果更具科学性、代表性。然而,辑文编译在工作中发现,有些作者对统计学理论及其方法的应用缺乏深刻了解,在实际应用中常存在如下问题,从而造成分析结果的失真。

  一、不进行统计学分析,仅凭观察值的大小下结论。某些医学科研论文未对搜集到的资料做任何统计学分析,仅凭观察值的大小,就做出两者之间的差异有无统计学意义的结论。临床研究的结论不仅取决于实验组和对照组之间观察值的绝对值的大小,主要取决于随机误差的大小。

  一般来说,统计资料仅反映样本的情况,不能简单地将其视为总体的真实写照。既然是样本,就不可避免地存在抽样误差。只有排除了抽样误差的影响后,方可根据样本所提供的信息去推论总体的规律性。而排除抽样误差的最有效手段是正确运用统计学知识,对具体问题提出检验假设,并计算检验统计量,再利用随机变量的概率分布规律作出合理的推断。因此,未对统计资料进行统计学处理,仅凭统计指标的绝对值大小就下结论是很不严谨的,也极易得出错误结论。

  二、未注明检验方法、统计量的大小。对论文中搜集到的资料进行了统计学分析,只有假设检验的结论,未注明检验方法、现有样本算得的检验统计量、检验水准、采用的是双侧检验还是单侧检验、P值的确切范围。

  三、混淆标准误与标准差的作用。标准差表示数据相对均数的离

  散程度,而标准误是表示抽样误差大小的指标。有些作者误将标准差用于可信区间的表述,将标准误用于正常值范围的表述。

  四、不能正确选择假设检验的方法。每种检验方法都有其适用条件,如t检验要求样本来自正态总体,进行两样本均数比较时,两总体方差应相等。所研究变量的类型不同、设计类型不同、大样本还是小样本等,所用假设检验的方法也不同。如数值变量资料的比较常用t检验,分类变量资料的比较常用卡方检验。同为数值变量资料,配对设计与成组设计比较的t检验方法也不同,若用成组比较的t检验处理配对设计资料,不但浪费信息,还可能得出错误结论。许多作者对明显偏态分布的资料,误用t检验。

  五、用t检验进行均数之间的两两比较。将各种试验设计类型视为多个单因素两水平设计,多次用t检验进行均数之间的两两比较,取代方差分析,会使犯第一类错误的概率α增大,即可能把本来无差异的两个总体均数判断为有差异。

  六、误用t检验分析重复测量设计资料。重复测量是指对同一实验单位的某些观察指标在部分条件改变的前提下,进行多次重复观测。对于这种数据的统计分析,常误用t检验或一般的方差分析。由于t检验或一般的方差分析要求数据之间相互独立,不存在相关性,而重复资料不能满足这一要求,应采用重复测量设计资料的方差分析。

  七、只关心统计结论,忽视差异有无实际意义。直线相关分析中,只关心相关系数的差异是否有统计学意义,而不关心相关系数的大小有无实际意义。

  八、不能正确理解假设检验中差异有无统计学意义。论文中常见参数间“差异有统计学意义”或“差异有高度统计学意义”的描述,进而说参数相差很大。统计学上,差异有统计学意义,不应该理解为相差很大;反之差异无统计学意义,不应理解为相差不大,或一定相等。

篇二:统计研究方面的问题

  关于基层政府统计工作的几点研究

  摘要:政府统计工作关系到民生国计,是一项非常重要的工作,统计工作质量是政府实施决策的重要参考依据。基层政府统计主要借助数据统计,然后对数据进行有效分析,最后整理分析结果,将其提供给决策机构。文章主要分析了当前现状下我国基层政府统计工作存在的弊端,并提出如何给予相应的完善措施。

  关键词:基层政府;统计工作;研究统计工作必须依靠数据才能有效展开,通过数据信息可以反映出社会的发展情况,为政府的高效工作提供助力。借助数据分析,统计部门能够发现数据信息背后隐藏的深层含义,促使多项事物之间有了关联性。本文详细阐述了政府统计工作的合理开展对我国经济发展的影响力,提出统计工作具体实施建议。一、统计工作现状阐述从基层政府层面分析,统计工作作为国计民生的大事必须引起高度重视,但是由于基层统计工作繁重,且工作量较大,致使基层政府面临巨大的工作压力,这在某种程度上对数据统计工作具有一定的局限性,影响到统计工作的时效性。从以下几方面剖析基层政府统计工作的现状:

  第一,数据真实性无法保障,预测同时,还存在准确率较低的现状。基层政府由于受到诸多因素的制约,导致统计工作未能如期开展、顺利完成,这主要体现在收集效率不足,时间太长,数据的时效性难以保障。第二,统计工作存在重叠现象,政府统计工作明显有重复工作的迹象,其工作在某种程度上与工商、税务等单位重叠,严重影响了政府统计工作的效率,并且存在极为严重的资源浪费现象,而且各个单位对于数据的收集与分析差异性极大,这也使数据的参考价值有所下降,缺乏统一标准,对统计工作的开展是非常不利的。第三,对于统计工作,基层政府部门未能给予高度重视,致使统计工作未能为政府正确决策发挥效能。大部分的基层统计工作还处于初级阶段,基本上是以简单数据汇总,对比数据差异性,相关工作人员未能从全局把握统计工作的重要性,对于同类数据,缺乏纵向分析,横向对比,致使基层政府统计工作流于表面形式,缺乏深度性。二、完善政府统计工作的有效对策(一)强化数据质量分析基层政府统计需要不断完善工作流程,强化数据统计质量,这样才能促使统计工作获得相对较好的成效。基层政府部门需不断完善自身的职能建设,对统计工作加强科学指导,建立相关指标体系,继而确保统计指标的合理化,保证指标

  的合理性在某种程度上强化统计数据的真实性。此外,针对基层政府统计部门而言,需要健全与之相关的法律法规,完善法律体系于政府统计工作而言是非常有利的举措,不仅使数据的真实性有所保障,同时准确性也极为可靠。基层政府部门,必须加强相关法律的宣传,强化人员法律意识,重视统计工作,促使自身的数据统计工作逐步向规范化迈进。(二)构建管理体制正所谓“没有规矩不成方圆”,这样的道理同样适用于政府统计工作,要想从根本上提升政府统计工作效率,必须形成统一领导,分级负责的管理模式,构建统计管理体制。地方统计局需要以地方经济发展为依托,接受同级政府领导,且接受上级部门的监督,完善统计业务。基层单位统计工作效率的提升对其上级部门的工作能够起到促进作用,因而必须对基层政府统计予以高度重视,乡镇人民政府需要不断深化改革体制,为政府统计工作配备专职人员,健全统计机构,不断充实统计工作内容。政府部门在开展统计工作需大量的资金,而这一部分的支出需要归置政府财政预算,以确保政府统计工作能够顺利开展,具有充足的经费补给,从而有效的完成工作。除此之外,对于统计工作人员需要加强管理,提高其薪资待遇,创造良好的工作氛围。在基层政府部门需要强化监督职能,完善统计工作,统计机构必须加强建设。(三)加强部门之间的交流

  基层政府统计工作与各单位之间存在必然的联系,对于基层政府统计而言,它属于综合性的统计,而对于各单位的统计工作来说,通常都是单一的,指定性相对较强的统计。政府统计工作在某种程度上具有一定的优势,具体表现在组织机构、工作程序方面等等。对于其它统计部门而言,他们关注的点比较单一,通常情况下是一个行业,或是某个领域,统计涉及的范围相对较小,但是却具有极强的专业性,且深度性相对而言比较强,具有一定的优势。要想从根本上提升基层政府统计质量与效率,必须将政府统计与各单位统计有效融合,借助政府部门统计的综合性,利用各单位统一的专业性,在某种程度上可以互通有无,实现优势互补。政府统计机构需要发挥宏观调控作用,有效协调各单位的工作,统一统计指标,共同实施数据的调查,填补数据空白,保证统计数据一致性,继而提升统计数据的真实性及可靠性。(四)提升工作人员素质基层政府统计工作效率与质量的提升离不开工作人员的辛勤付出,从某种意义上而言,他们素质的高低直接决定了统计工作的质量,因此提升工作人员的综合素质是当前基层政府部门需要思考与完善的问题。具有高素质的综合型统计人才成为现阶段政府部门人才培养的标准,借以保证统计工作能够取得突破性的进展,从而提高工作效率。政府部门统计工作基于多方面的因素,需要扩充工作人员,从实际工

  作需求角度出发,选拔综合素质相对较好的人员,保障基层部门统计人员的整体工作能力。此外,由于基层统计部门需要保障人员的稳定性,一般情况下,政府部门会采取优厚的待遇增加工作人员的工作动力,从而保障统计队伍更具凝聚力。此外,政府部门还需保障工作人员自身的利益,以此吸收更多的人才,还需对在职人员进行培训,不断更新其专业知识,改善工作方法。三、结语总体来说,基层政府部门统计工作至关重要,这不仅关系到政府部门决策的科学性,同时对上级统计部门的工作产生影响,因而加强政府部门统计是一项刻不容缓的工作,文章从多个角度阐明了加强基层政府统计工作的几点建议,目的在于促进政府统计工作得以不断完善。(作者单位:南充市统计局)参考文献:[1]侯明学.关于基层政府统计工作的几点思考[J].中外企业家,2015(01).[2]彭德福.关于“新媒体时代”基层政府思想政治工作的几点思考[J].才智,2015(09).[3]穆晓红.基层政府统计工作的几点思考[J].现代商业,2013(30).[4]杨祖英.关于做好基层统计工作的几点思考[J].中国

篇三:统计研究方面的问题

  统计学教学中存在的问题与对策

  统计学教学中存在的问题与对策目前统计学已在各行各业得到了广泛的应用,特别是在大数据时代,人们的生产生活已越来越离不开统计学。由于统计学如此重要,教育部将统计学规定为经济类和工商管理类本科专业的专业核心课程。但是,当前统计学的教学还存在诸多问题,从而使统计学的教学效果大打折扣。本文将结合笔者的教学实践,对统计学教学中存在的主要问题进行分析,并提出相应的对策,期望对统计学的教学改革工作提供一点思路。

  一、统计学教学中存在的主要问题1、在教学过程中忽视对数学知识的复习当我们在统计学的讲授过程中涉及到概率分布、假设检验以及矩阵运算等知识点的时候,很大一部分学生表现出茫然的神情,表明学生在学习统计学的时候,已经对过去所学的数学知识有所遗忘。《计量经济学》教材一般都会有一个数学附录,可以帮助学生用较短的时间对关键的数学知识进行复习。《统计学》教材一般没有这样的数学附录,统计学教师也不会专门给学生复习相关的数学知识,而这些数学障碍恰好是导致学生学习效率低下的主要原因。中国有句俗语“磨刀不误砍柴工”,因此笔者认为在进行统计学这门课程的教学时,有必要专门安排时间对学好统计学必需的数学基础知识进行复习。2、在教学过程中忽视案例的运用

  统计学是一门实践性很强的学科。统计学中的每一个知识点都是与实践相联系的,比如均值、标志变异度这些看似简单的知识,都包含了丰富的实践意义。而有些教师在上课的时候,主要教学生如何去计算相关的统计指标,把统计学当作一门数学课程来教,学生也把统计学当作数学来学。教师在教学中忽视了对实践本文由收集整理案例的运用,导致学生不能真正理解相关知识点的真正含义,从而觉得统计学又枯燥、又难学,并失去了学习的兴趣。

  3、理论讲解与统计软件教学脱节统计学是一门实践性很强的学科,即学生从统计学中学到的知识是完全可以应用到工作实践的。与教科书中的例题不一样,在工作中所得到的数据的样本容量一般都很大,这就需要通过相应的统计软件来进行处理。据笔者了解,许多高校在安排统计学这门课程的时候,一般安排十六周左右的理论教学,另外安排两周实践教学,在实践教学环节主要是学习SPSS软件。我们认为,这种教学安排并不能很好地促进统计学的教学,其理由主要有两点:其一,理论讲解与统计软件的教学完全脱节。由于是在理论学习完全结束之后才开始教学生进行软件操作,学生可能对学过的理论知识已经遗忘,在学习软件操作时,只是进行机械性的操作,而不明白每一步操作的真实含义。其二,学习软件操作的目的并不是为了简单地进行数据处理和数据分析,事实上通过软件的学习还能促进对理论知识的理解。而像这种教学安排,是先学完理论之后,再学习软件操作,就不能很好地起到通过软件操作促进理论知识学习的目的。

  二、提高统计学教学效果的对策1、注重案例的讲解由于统计学的实践性很强,我们可以从生产生活中找到许多案例来帮助提高统计学的教学效果。通过合理地运用案例,既可以增进学生对统计理论的理解,同时又能提高学生学习统计学的兴趣。下面将具体介绍笔者在讲授假设检验时是如何通过案例的讲解来增加学生对统计学知识的理解以及提高学习统计学的兴趣的。假设检验是统计学教学中的重点和难点。假设检验是利用样本提供的数据资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计方法。当对总体参数的真实性感到怀疑,需要通过样本来考察其正确与否时,往往借助于假设检验作判断,从而决定接受或拒绝这一假设。笔者在讲授这部分内容时,引用了吴喜之在其《统计学:从数据到结论》一书中的一个案例。其内容是:如果一个人要证明他从来没有骂过人。他能够证明吗?要证明他没有骂过人,他必须出示他从小到大每一时刻的录音录像,所有书写的东西等等,还要证明这些物证是完全的、真实的、没有间断的,这显然是不可能的。反过来,如果要证明这个人骂过人很容易,只要有一次被抓住就足够了。这就相当于假设检验中的反证法。在假设检验中,一般要设立一个原假设,比如可将“从来没有骂过人”设为原假设,设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设与现实之间的矛盾,从而否定这个假设。如否定不了,说明证据不足,无法否定原假设。许多学生说他们在学习《概率论与数

  理统计》这门课程时,虽然也学过假设检验,但是从来没有真正明白假设检验的含义,而通过对这个案例的学习,他们对假设检验有一种豁然开朗的感觉,并且觉得统计学原来这么有趣。

  另外,对于假设检验中的一类错误和二类错误,学生也很难理解,在讲授这部分内容时,笔者又列举了另外一个案例来帮助学生理解。当一个人被控告为罪犯时,他将面临审讯。控告方提出控诉后,法官必须根据证据做出裁决。事实上,法官就需要进行假设检验。这里有两个假设需要被证明。第一个假设为原假设H0:被告无罪;第二个假设为备择假设H1:被告有罪。事先法官并不知道哪个假设是正确的,他们将根据控辩双方所提供的证据进行判断,最终的结果只有两种可能:判定被告有罪或无罪释放。在统计应用中,判定被告有罪就相当于拒绝原假设,授受备择假设;而判定被告无罪也就相当于不能拒绝原假设,但我们并不能接受原假设。

  当我们进行假设检验时,存在两种可能的错误。第一类错误是当原假设正确时,我们却拒绝了它。第二类错误当原假设有错误时,我们却没有拒绝。在上面这个法官审案的例子中,第一类错误就是一个无罪的人被判定有罪。第二类错误就是一个有罪的被告被判定无罪。我们把发生第一类错误的概率记为α,通常它也被称为显著性水平。第二类错误发生的概率为β。发生错误的概率α和β是相反的关系,这就意味着任何尝试减少某一类错误的方法都会使另外一类错误发生的概率增加。根据检验的一般原则,首先要保证犯第一类错误的概率α要足够的小。因为司法审判中,第一

  类错误被认为是更加严重的。通过对这个案例的学习,学生就能很好地理解,为什么我们会将显著性水平规定为0.01或0.05,最大一般不会超过0.1。

篇四:统计研究方面的问题

  问卷统计存在的主要问题

  问卷统计存在的主要问题

  问卷统计常存在的问题

  例如:每5年一次的国民体质监测,都要对每一个监测对象进行问卷调查,以便了解我国城乡居民参加体育锻炼的基本状况,为推进全民健身提供科学决策依据。在许多体育研究的课题中也广泛采用问卷调查的方法,将调查的数据统计后作为撰写研究论文中各种论点的依据。

  但是,许多问卷调查的统计分析,存在两个值得注意的问题。

  1.调查的样本量太小,计算出的结论可靠性不高。

  例如看到一些研究生的论文,只发了几十份问卷调查表,就根据统计到的百分比写下十分肯定的结论。其实,是有问题的。

  例如:调查“你对××活动喜欢的程度”,调查了45人。调查结果:非常喜欢2人,喜欢5人,一般10人,不太喜欢13人,不喜欢15人。作者统计出:喜欢和非常喜欢的共7人占调查人数45人的15.5%,不太喜欢和不喜欢的共28人,占62.2%。并根据15.5%和62.2%来进一步写结论。

  但是,他忽略了调查的样本计算出率以后,还应该计算率的标准误和置信区间。如本例喜欢率为15.5%。还应该计算率的标准误Sp。

  __________________________

  本例,喜欢率的标准误Sp=√P(1-P)/n=√15.5(10015.5)/45=5.39%

  按样本量n,查t值表上,n-1的t0.01和t0.05的值,查得t0.05=2.02,t0.01=2.69,根据喜欢率15.5%、标准误5.39%和t0.05的值,可计算出:

  95%置信区间:15.5±2.02×5.39=4.6%~26.4%。(置信区间上下限的差值高达21.8%)。

  95%置信区间的含义是,如果用样本的喜欢率15.5%来估计总体的喜欢率时,有95%的可能是在4.6%~26.4%的区间之间。这样高达21.8%的区间意味着15.5%是不太可信的。

  但是,如果扩大样本量到450人,4500人,而统计出的喜欢率也是15.5%。由于调查的样本量扩大了,标准误Sp会缩小,计算出的95%置信区间也就缩小为12.2%~18.8%和14.4%~16.6%。这时用样本率估计总体率时,上下限的差值很接近15.5%,才是可信的。

  2.调查数据的统计分析过于简单。

  目前看到的调查数据统计分析大都比较简单。只是计算各个问卷指标的百分比,如上面举例的喜欢率15.5%等等。

  要避免统计分析过于简单,首先,在做调查表设计时,就事先要考虑好调查数据的统计分析方法。例如同样是调查“你对××活动喜欢的程度”,除了要扩大调查样本量外,在调查表中增加调查性别和年龄。这样就可以采用一种较为复杂的方法——交叉分析。交叉分析是分析“年龄”、“性别”和“对××活动喜欢程度”三个变量之间的关系。假设不分类统计时,喜欢率是15.5%。交叉分析后就会发现由于性别的不同,年龄段的不同喜欢率是不同的。

  例如:2005年国民体质监测问卷调查中,对“睡眠时间”的统计分析,如果只是简单地计算某市成年男子2473人的问卷,只能统计出:睡眠6小时以下的`人为13.4%,睡眠6~9小时的73.6%,睡眠9小时以上的13%。但是,如果增加年龄因素,分年龄段进行统计就可以看到,各年龄段的百分比是不同的(统计表略)。利用分年龄段的百分比还可以画出折线图(图略)。从图上更可以清楚的显示出:随着年龄增加,睡眠时间逐渐减少的趋势。

  上述统计分析方法比较简单。但是,仅靠简单的统计方法来处理问卷调查数据是十分可惜的,因为大量的数据信息还没有充分利用。所以,设计问卷时,就应该注意到,让收集到的调查数据能做多因

  素统计分析(如:回归分析,因子分析等)。下面是我帮助或指导有关单位做过的统计分析实例:

  例1:2005年国民体质监测的调查问卷内容中,包括了各人的文化程度,职业,工作、生活和体育锻炼等方面的许多问题。为了分析这些调查内容和各人的体质有什么关系,找出哪些因素对体质的好坏特别有关?在进行统计分析时,就需要把体质监测的指标和问卷调查的内容联系起来进行统计。

  在成年组调查问卷内容中可进行计算的12个问题是:受教育程度,职业,平均每周工作时间,平均每天睡眠时间,睡眠质量,平均每天步行时间,平均每天坐姿活动时间,吸烟状况,运动感受,平均每周锻炼次数,平均每次锻炼时间,坚持锻炼时间。把这些作为X1,X2,……X12,再把每个人体质监测中的体质总分作为Y,就可以进行逐步回归分析计算。

  某省成年男甲组4242人的数据用逐步回归分析计算结果是:从12个指标中依次选出了X1(受教育程度),X12(坚持锻炼时间),X10(平均每周锻炼次数),X7(平均每天坐姿活动时间)4个指标。得到回归方程:

  Y=21.85+1.02X1-0.20X7+0.34X10+0.28X12F=101.92(P<0.01)

  复相关系数R=0.296

  根据回归方程的系数就可以知道:受教育程度高,平均每周锻炼次数多,坚持锻炼时间长,平均每天坐姿活动时间少的人体质总分就高。反之就低。而这个结论只做一般的调查表百分比统计,是得不到的。

  例2:某市开展《超重与肥胖人群运动与营养综合干预实验研究》12周后,对参加者进行了问卷调查,内容有:每天进餐情况(分为:五分饱,八分饱,十分饱),每周快走次数(分为:3次以下,3次,4次,5次及以上),每次快走时间(分为:30分钟以内,30~60分钟,60~90分钟,90分钟以上),每次快走距离(分为:3公里以下,3~4公里,5公里及以上)等。

  如果仅统计各个问卷内容的百分比,只能计算出如:每次快走时间30分钟以内的29人占22.1%,30~60分钟的47人占35.9%,60~90分钟的19人占14.5%,90分钟以上的36人占27.5%等等,这样的统计结果并不能说明什么问题。更无法分析出哪些是对减肥有效果的因素。

篇五:统计研究方面的问题

  关于统计学研究的几点思考论文

  统计学在中国的发展历史并不长,但是统计学的发展非常迅速,其发展潜力也很大。各学科的发展都离不开统计学,只有深入了解和研究统计学,才能促进统计学科的发展。统计学一般分为数理统计学和经济统计学,本文侧重于对经济统计学的讨论,从统计学的相关概念入手,探究了统计学的研究对象相关问题以及研究方法,并对统计学的发展趋势进行分析。

  一、统计学的定义

  人们的印象里,统计学就是对数据进行简单的运算,然后通过图表、表格把它们表示出来,这是长久以来人们对统计学的一些片面认识。统计学的定义有很多种,每种定义对统计学阐述的侧重点不同。其中维基百科是这样定义统计学的:“统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学,被广泛的应用在各门学科之上,从自然科学和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上”。简单来说,统计学就是数据的科学,是一门收集、整理、分析、解释数据并从数据中得出结论的科学。

  二、统计学的研究对象及其特点

  统计学研究必须要求明确统计学研究的客体是什么,即统计学的研究对象。统计学中某种性质相同的个体所组成的集合叫总体。统计学就是研究客观总体的数量特征、数量关系和变动规律,或者说统计学是研究统计过程的规律和方法以及客观现象统计规律的科学,它的研究对象既涉及到自然科学领域,又涉及到社会科学领域。统计学研究对象的特点有以下几点:

  (1)依赖性。

  依赖性即统计学研究对象的寄生性,依赖性是统计学独有的特点,统计学研究的数据是来自各领域的,是依靠解决其他领域的问题而存在和发展的。统计学现在已经发展成为一门媒介科学,它研究的对象是其他学科的逻辑和方法论。

  (2)数量性。

  数量性即统计学研究对象是通过数量特征和数量关系表示的。数量性是统计学研究对象的基本特征,因为数字是统计的语言,统计是通过数量方面来认识事物的,对统计数据进行分析,归纳统计规律性,就可以达到统计分析研究的目的。

  (3)总体性。

  总体性即统计学以研究对象总体的数量为研究对象。每一个个体都有自身的随机性,而这些研究对象的.总体又具有共同的特征和共同趋势,所以统计学研究是通过对大量的个体特征进行研究,从而过渡到对总体普遍存在的事实进行观察和综

  合分析,进而得出研究对象总体的数量特征和统计规律。只有掌握研究对象的总水平、总规模、总体特征和共同趋势才能体现统计学规律的作用。

  (4)变异性。

  变异性即构成统计学研究对象总体中的各个个体,除了在某一方面必须是同质的以外,在其他方面又要表现出一定的差异和变异。如果各个个体之间没有区别和差异,统计研究就是没有意义的。统计学的这种变异既可以表现为数量上的,也可以表现为非数量上的,但是因为统计学具有数量性,所以表现为数量上的变异才是统计学所要研究的对象。

  (5)具体性。

  具体性即统计学研究对象是具体的数量方面。统计学所研究的数量是具体、现实的,而不是抽象的,并且统计学研究的数量是有现实意义的。比如,要研究城乡居民收入差距,必须确定具体年份的具体范围内的城镇和农村居民收入数量、收入构成、收入变化以及计算方法,才能对研究对象进行统计分析。

  (6)广泛性。

  广泛性即统计学研究数量方面的范围的很广泛。其广泛性包括政治、经济、文化、军事、教育等各类社会现象的数量方面。统计学研究对象的广泛性是统计学成为媒介学科的必要特征。

  三、统计学的研究方法

  每个学科都有自己独特的研究方法,统计学也不例外,统计学在长期实践中总结、归纳出了一系列专门的研究方法,如实验法、大量观察法、统计分组法、综合指标法、统计描述法等。

  (1)实验法。

  统计学的实验法包括假设检验和实验设计。假设检验就是在对在总体参数提出假设的基础上,利用样本信息来判断假设是否成立的统计方法。实验设计就是设计合理的实验程序,使得收集得到的数据符合统计分析方法的要求,以便得出有效的客观的结论,其中最常用的实验设计是正交设计法。

  (2)大量观察法。

  大量观察法就是对全部或者足够数量的研究现象进行观察和研究,推理归纳出客观现象的本质特征和发展变化规律。通过对大量的研究对象进行观察和研究,才能排除偶然因素造成的影响,揭示研究对象的统计规律和本质特征。

  (3)统计分组法。

  由于所研究现象具有差异性、复杂性及多样性,需要我们对研究现象进行分组研究,进而来区别研究现象的类型,研究不同组别之间的区别和联系。统计分组法包括传统分组法、聚类分析法和判别分析法等。

  (4)综合指标法。

  综合指标法是利用总量指标、平均指标、相对指标、标志变异指标等对研究现象的数量关系和数量特征进行分析,来反映统计学研究现象的数量方面特征。综合指标法在统计学的经济应用中具有重要的作用。

  (5)统计描述和统计推断。

  四、统计学的发展趋势

  (1)统计学实际应用的范围扩大。

  在大数据时代的背景下,统计学开始被各行各业运用起来。统计学逐渐应用到企业管理、保险金融、政府决策、国家经济安全等方面。统计学在企业管理方面可以提高企业的管理能力和效率。在保险金融方面可以监控分析金融风险和保险问题来保证金融保险市场的正常运行。在政府决策方面可以帮助政府宏观调控,从而减少决策失误。在国家经济安全方面可以监控经济安全问题,预防经济危机。

  (2)统计学与其他学科交叉融合。

  统计学的性质决定了统计学是一门媒介学科,统计学的发展是建立在各类学科的基础上的,其涉及领域非常广泛。因此,统计学与其他学科交叉融合更能发挥它的作用,例如,统计学与经济学、管理学等学科进行融合等,在融合中能不断完善统计学体系,创新统计学研究方法。

  (3)统计学与网络、计算机的结合。

  大数据时代的到来,使得以网络、计算机为代表的信息科技在统计理论、统计分析方法、统计处理过程等方面都为统计学发展提供了新的支持。统计与网络和计算机的结合,能更好发挥统计的作用,使统计学的应用更加广泛。

篇六:统计研究方面的问题

  龙源期刊网http://www.qikan.com.cn

  关于经济统计应用问题的若干思考与研究

  作者:张然来源:《商场现代化》2014年第19期

  摘要:通过当代大学生对经济统计学的认知分析当今社会经济统计学,并运用数据及具体实例对经济统计学进行思考,合理运用统计对经济进行简单评估,指出现今社会在经济统计学方面出现的问题并指出具体改善方法及解决措施,用实际数据与事例对统计学进行深入分析并证明统计学在社会上不可替代的地位。

  关键词:统计;数据;事例;不可替代

  在我国现阶段,有关经济统计方面的研究并不深入透彻,并且从数据中得到的理论并未应用到实际中去,而经济无孔不入的存在于我们生活中的各个方面并无时无刻不影响着我们的生活,只有通过数据统计才能反映出中国人民当今的生活方式及生活水平。为此,在学校中采取了一系列具体的问卷调查,统计出经济在大学生活中对学生的影响程度并通过数字理性的分析得出结论。

  一、通过搜集数据的对比理性分析经济统计学

  据统计,有近百分之五十的学生将生活费主要用于吃饭、零食或请客吃饭,百分之三十的学生将生活费主要用于购买衣服鞋子及自己喜爱的饰品,百分之十五会因为个人原因将生活费主要用于其他方面,然而只有百分之五的学生将生活费主要用于购买书籍进行学习。而在调查的所有人中有将近百分之八十五的学生会想着拿出一部分钱存起来,将近百分之十五的学生则认为够花便已足够以后的事情以后再想,而会省吃俭用将大部分的生活费都存起来的学生不到百分之一。

  通过以上数据可知,随着社会的发展学生们逐渐学会安排生活并在生活中将钱财根据自己想要的或不想要的进行分配,通过分配结果也可以反映出个人爱好与合理性,为此我们对其中一些个人进行了具体调查。表格如下:

  由以上表格进行分析,学生的日常用品所占比例出奇的相同,而绝大多数学生都话费的绝大部分都是用于吃穿上,俗话说的好“人是铁,饭是钢,一顿不吃饿得慌。”,可以试想一下女B这样的生活方式,一天几乎一顿饭没有零食偶尔有水果这样的生活听起来好像挺时尚的类似营养餐实际上这跟营养根本就不沾边。然而再看看男C跟女B恰恰相反,或许应该为他高兴因为他食物丰盛那可就大错特错了,进餐超过一定程度会造成肥胖同时还会伴有许多并发症,这甚至比消化不良还要危险,所以在我看来女C和男B的安排方式相对健康些。

  通过以上分析我们可以看出统计表格对于统计学来说至关重要,当然这种数据使用条形统计图将更加直观有效的反映出各个同学安排的差别从而达到快速分析的效果,统计不可以太单

  龙源期刊网http://www.qikan.com.cn

  一不然会失去统计的含义,将统计数据合理分析找出最适合的统计方式完成统计是个艺术的过程。

  二、结合实际事例及具体数据对现状进行论证

  可以毫不夸张的说,经济统计有着不可动摇的重要地位,从数据中可以体现出多方面问题。经济问题与我们息息相关而且就目前重点大学统计来看,月均生活费在500元人民币以下的占百分之十五,月均生活费在500到1000元人民币的比重也为百分之十五,而在1000元人民币以上2000人民币元以下则较为普遍有将近百分之五十七的人群,而月均生活费在2000元人民币以上的则为百分之十三。而对自己每月生活费满意的只占统计人数的百分之三十四,有百分之六十六的人不满目前自己每月所能支配的金额,而生活费500到1000元人民币的学生对于自己生活费的满意度最高,达到了百分之六十三。通过以上数据可知,当代大学生所处的生活状态是大不相同的,而想要找出一个具体的令所有人都满意的数目也颇有难度。

  让我们继续来看另一个数据,重点大学中,用于伙食费这一项的支出在500元人民币以下的为百分之二十八,在500到1000元人民币的为百分之四十二,而每月花费一千人民币到两千人民币用于吃饭的比重为百分之二十三,每月吃饭要用超过二千以上人民币的才只有百分之七。根据以上数据我们可以看出,在吃饭这一项支出上,大学生们相对来说比较居中,一千元人民币以下的人有百分之七十之多。结合之前数据,也可以知道不管生活费多少,在吃饭上的支出差距比重并不严重,可以说并没有多少人是因为吃的不好而对自己的生活费不满意,也充分体现出了当代大学生不单单追求伙食这一方面,更多的追求物质上和精神上的享受。

  三、针对以上情况探讨具体解决措施

  对于我们来说,如何合理有效的运用好表格统计的方式是我们长期面临的问题,就好像不同的表现形式可以给别人带来不同的视觉效果。要想得到更好的效果就要能够创新不要依赖一种统计方式来统计所有的结论,这样只会将研究带入岔路口甚至进入死胡同。所以对于我们来说统计是一种既简单又似乎没那么简单的表现形式,做好了一切结论一眼便可看出做不好则对讨论及规律都没有什么帮助。所以面对这样的问题不应当盲目的去做而是首先分析具体应该应用何种图形才能形象有效的将各个数据的差别与特点合理的表现出来。所以要想解决这一问题就必须先构思、再定论,就不会有解决不了的难题。

  四、结语

  经济统计应用问题对当代社会来说是息息相关并且不可或缺的,合理的运用统计对经济进行评估分析,可以找出问题解决问题,少走弯路。它能够简单明确的表达出经济问题,我们必须将其合理的运用到实际生活中,经济统计的应用是不可替代也是不可忽视的。科学客观并且正确的指引人类的进步发展。经济统计是按照基础理论、应用方法、生产实践的进步模式发展起来,随着经济统计自身的不断完善,也可以解决更多更复杂的问题,它可以非常直观的表达出经济所出现的微小波动,西方各国早在十七世纪就将统计学运用到生活生产中,而俄国十月

  龙源期刊网http://www.qikan.com.cn

  革命之后列宁就说除了社会主义就是统计的言论。综上所述,我们更应该重视重用经济统计,将经济统计应用到生产生活中并且将它的作用无限放大,它一定可以带给我们意想不到的收获。

  参考文献:[1]段兴聪.浅谈统计学思想[J].企业导报.2009(08):79-80.[2]李金昌,程开明.经济学研究的统计思想探讨[J].商业经济与管理.2008(04):90-92.[3]曾五一,尚卫平.关于经济统计学若干问题的思考[J].统计研究.2011(11):78-79.[4]南英子,马敏娜.统计软件应用的几个误区[J].统计教育.2008(04):132-133.作者简介:张然,山西财经大学2011级,统计学专业,风险管理与精算班

篇七:统计研究方面的问题

  医学论文编译医学科研论文中常见的统计学问题统计学在医学科研工作中发挥着重要的作用统计学方法种类繁多各自的适用范围以及所需的前提条件又不尽相同容易发生误用导致论文质量不高甚至结论错误而引起误导

  赛恩斯:医学论文编译

  医学科研论文中常见的统计学问题

  统计学在医学科研工作中发挥着重要的作用,统计学方法种类繁多,各自的适用范围以及所需的前提条件又不尽相同,容易发生误用,导致论文质量不高,甚至结论错误而引起误导。为能有效促进统计学方法的正确使用,保证科研的科学性、可靠性,提高医学科研论文质量,赛恩斯编译对医学科研论文中常见的统计学问题进行梳理和总结如下:

  一、实验组与对照组没有可比性。实验组与对照组必须遵循均衡化的原则,即实验组与对照组除处理因素不同外,其他可控制的非处理因素要尽可能保持一致,从而尽量排除非处理因素对结果的影响。各组间均衡程度越高,可比性越强。如果分组时未注意到对照组与实验组的均衡性,两组之间就会出现差异,不具备可比性,结论有可能不准确,甚至相反。

  二、样本量过小。样本量的大小影响结论的可靠性。样本量过小,抽样误差大,结果可靠性差,且经不起验证;反之,若盲目加大样本量,不但会造成人、财、物的浪费,而且会造成非抽样误差增大。应在保证研究结果精确可靠的前提下,确定最小的样本量。

  三、混淆标准差与标准误的作用。实验数据一般综合表示为“均数±标准差”的形式,标准差表示数据相对于均数的离散程度,而标准误是表示抽样误差大小的指标,二者含义完全不同。有些作者误将标准差用于可信区间的表述,将标准误用于正常值范围的表述。

  四、假设检验方法运用不当。每一种假设检验方法都有其特定的

  赛恩斯:医学论文编译

  适用条件和严格的适用范围。所研究变量的类型不同、设计类型不同、大样本还是小样本等,所用假设检验的方法也不同。对于同一组资料,采用不同的假设检验方法可能得出截然相反的结论。同为数值变量资料,如将配对设计的资料按成组设计资料的方法进行假设检验,不但损失样本提供的信息、降低检验效率,而且可能使原本有统计学意义的结果表现为无统计学意义。

  五、未注明假设检验方法或不具体。有些论文对收集到的资料进行了统计学分析,但未说明使用的是什么方法。表现为论文中只有假设检验的结论,未注明检验方法、现有样本算得的检验统计量、检验水准、采用的是双侧检验还是单侧检验、P值的确切范围。这样读者就无法得出论文中统计学方法选择是否合理,无法核对结果是否准确。在论文写作时,不但要注明选用的是什么统计学方法,而且要尽可能详细、具体。

  六、错误理解假设检验中P值的含义。统计学上,根据假设检验原理推算出来的P值,表示拒绝无效假设犯假阳性错误的概率,P值越小,越有理由认为两种处理方法效果不同。P值不能反映相比较的两组或多组参数之间差异的大小,参数差异的大小只能根据专业知识来确定。

  七、只关心统计结论,忽视差异有无临床意义。评价一项医学研究结果,要看其是否具有临床意义和统计学意义。如果差异本身没有临床意义,可以不必进行假设检验,因为当样本含量足够大时,基本都会取得差异有统计学意义的结论。医学论文中,作者常根据假设检

  赛恩斯:医学论文编译

  验有统计学意义,就断定研究结果有临床意义。直线相关分析中,只关心相关系数的差异是否有统计学意义,而不关心相关系数的大小有无实际意义。

  产生上述问题的原因,大多是由于对统计学在医学科研工作中的重要性认识不足,少数作者缺乏高度的责任感、科学严谨的态度,凭主观想象,甚至弄虚作假。参加科研设计、统计学、论文写作方面的培训较少,也缺少与医学科研设计专家的沟通。

篇八:统计研究方面的问题

  大数据时代统计学重构研究中的热点问题剖析

  引言进入21世纪以来,科学技术尤其是互联网和计算机技术的迅猛发展,促使大数据时代快速到来,大数据是堪比黄金石油的致富新思路,会给社会方方面面带来很深远的影响和变化,在生活中,农业工业等很多领域都会运用到统计学,统计学之于现代社会有着较为重要的意义,因此,在这种情况下,对大数据时代背景下统计学重构进行研究是非常必要也是非常重要的。一、大数据时代统计学重构的价值与意义1.是前沿科研领域伴随着科学技术的发展,大数据时代科研的进步会带来很多领域的发展和超多超复杂的数据,面对这样的挑战,我们应该不断增强自身获取信息的能力,就统计学而言,这门学科应该具有分析这些庞大数据的能力,并且通过分析能够研发出合理的分析工具以及相应的分析研究理论,来通过科学的理论解决一些更为前沿、复杂的现实问题[1]。显而易见,当前很多造诣深厚的学者都将研究领域转向了数据分析上来。2.是交叉科研领域

  统计学是一个与众多学科都有交叉的一个学科,比如与数学有交叉关系,与经验科学如天文学中假设估计参数有关系。在现代社会,统计学的使用已经不止局限在政府或者国家事务中使用,而将应用领域延伸到了商业、社会科学以及自然科学中来,由于统计学具有广泛的应用性和深厚的历史,因此,它不只是与数学有亲密的关系,更是与数学本身的哲学有着亲密的联系。伴随着领域的增多和数据的复杂程度的加重,统计学家一直进行着跨领域、跨学科的研究,随着研究数据的不断增多,所研究的领域也在不断拓宽,统计学家面临着越来越多的机遇,统计学的发展也面临着越来越多的机遇,同时,统计学的发展也推动着很多前沿科学的发展。

  3.具有非常重大的意义我们可以在进行统计学研究时形成一套完整的统计学研究理论和方法,推动大数据时代多元复杂数据分析朝着国际化方向发展;可以将数据化研究理论成果运用到经济和社会发展中去,比如可以运用在金融风险管理与联盟控制上;还有很多金融领域的人运用大数据分析可以挖掘出市场信息,据此判断市场走势,会获得高收益,这些都是大数据时代中统计学在发挥作用[2]。4.抢占制高点国外很多研究表明,大数据时代统计学工程需要从各个

  领域挖掘有用的信息,并将这些信息融合,提取出有用的因素,发展相应的研究理论。目前,已经有很多研究结果表明,现如今的大数据研究方法和理论已经相对成熟,我们应该牢牢把握住这次机会,不畏挑战,迎难而上,尽快研究出具有独立知识产权、具有创新性的数据分析理论和软件,为我国的数据分析发展提供动力。

  二、大数据时代统计学重构的热点问题研究1.大数据统计学的理论和方法过去的统计主要将重心放在概率分布的指数族方面,在上世纪70年代以来,指数族分布研究及其在高维贝叶斯和像图模型的应用中的研究居多,我们知道,由于指数族包括了所有已知概率的分布,因此,指数组的应用十分广泛,它是统计学的核心,并且在概率论方面的作用也在不断加强。这一研究方向旨在运用指数族来对庞大的数据进行初步的简化,利用Bootstrap方法对大多数统计和概率方面的贝叶斯数据进行应用[3]。2.大数据数据建模随着大数据的不断变化和发展,线上算法被研究出来,大数据的形式多种多样,因为多样化的应用、庞大的数据和针对大数据所开发的技术,这项研究会产生深远广泛的影响。该研究的方向是将数据建模相应的领域进行推广,将这些数据能够统一运用在大数据中,运用理论和公式对实际应

  用进行辅助。3.并行迭代蒙特卡罗方法日常生活和科学研究与计算机技术的结合让大数据的

  收集不再是幻想,要想分析这些数据,要运用并行和分布结构。并行和分布结构是拥有存储和处理大数据功能的,但是目前的技术还不能将现代的统计算法应用到大数据中去,并且在日益增多的数据中,我們需要更加复杂的结构和模型来进行解释。尽管迭代蒙特卡罗方法已经被相关研究证明是非常强大的,但是它仍然不能够用于大数据的分析,该研究旨在将迭代蒙特卡罗方法融入到一个通用理论中去发展,另其适应大数据的发展环境,并且让其也能够适用并行和分布结构,即从并列的样本中算出蒙特卡罗值,一这个数值来近似最初需要的数据量,这个理论能够有效避免在算法迭代中的重复扫描数据问题,与此同时,这一算法的应用也可以另数据研究中的问题得出具有统计学意义的解[4]。

  三、结语大数据时代下统计质量得到提高,统计成本降低,统计学发挥作用的领域增多,并且让统计学能够发展延伸,提高了统计学的地位,面对统计学发展过程中可能遇见的问题,要通过大数据的时代背景,顺应当今的发展潮流,不断进行思维和技术上的进步与提升。

篇九:统计研究方面的问题

  论文撰写中常见的统计学问题及其处理

  绝大多数的论文撰写,均需通过一定数量临床病例(或资料)的观察,研究事物间的相互关系,以探讨客观存在的新规律.如确定新诊断、新治疗等措施是否优于原沿用的方法,就需进行两种方法比较,这就涉及统计处理;统计设计又是整个课题研究设计中一个重要的组成部分.显然,经正确统计处理的结果可信度高,论文的质量也高.

  据不完全统计,在难以发表的、已凝聚着作者心血并花费较长时间与较大财力撰写的研究论文中,约半数以上是由于统计错误致其结果与原文主要结论相违背.如一文采用某新药引产,96例足月孕妇的产后出血与新生儿低apgar评分率均为2.1%(各2例),明显低于应用原药引产的19例,其产后出血与新生儿低apgar评分发生率均为15.8%(各3例,χ2=7.164,p<0.001).故认为采用新药引产是一更安全的措施.原药引产组例数偏少暂且不谈,该资料比较应采用精确法分析,结果是与原结果恰恰相反(p>0.05),这样上述的主要结论就欠可靠而难以发表,否则论文可起误导作用.类似问题文稿中还常有出现.现就文稿中常见的统计问题及其相应的处理方法简述如下.

  一、常用的统计术语

  统计学中常用的概念有总体与样本、随机化与概率、计量与计数、等级资料及正态与偏态分布资料、标准差与标准误等.如某研究采用经会阴途径测定宫颈长度,以探讨不同宫颈长度与临产时间的关系.结果显示35例宫颈长度为25~34mm者与32例宫颈长为15~24mm者临产时间的均值±标准差(x±s)各为57.6±58.1与47.3±49.1小时.该计量资料,经t检验显示t=0.780,p>0.05,并未提示不同宫颈长度的临产时间差异有显著意义;从标准差大于均值,显示各变量值离散程度大,呈偏态分布,故不能采用x±s这一算术均数法计算均数.经偏态转换成近似正态分布资料后结果是:35例与32例的临产时间各为34.5±4.1与26.7±4.1小时,(t=7.778,p<0.001),两组差异有极显著意义.可认为随着宫颈长度的缩短、临产时间也缩短.此外,当两组资料单位不同时,其s单位也不同;即使两组单位相同的变

  量值,若其均数差异较大,也都应以变异系数替代s来比较两组值的离散度的大小.

  二、正常值范围及异常阈值的确定

  如何选择研究对象,至少需多少例,正确统计处理和参考一定数量的病例数据,是确定正常值范围及异常阈值的四个重要因素.

  1.研究对象:应为“完全健康者”,可包括患有不影响待测指标疾病的患者.如“正常妊娠”的条件:孕前月经周期规则、单胎、妊娠过程顺利、无产科并发症及其它有关合并症,分娩孕周为37~41周+6,新生儿出生体重为2500~4000g和apgar评分≥7分.

  2.观察数量:观察数量应尽可能多于100例;需分组者,各组人数也是如此(标本来源困难时酌情减少).有些指标值如雌三醇(e3)、甲胎蛋白(afp)、胎盘泌乳素(hpl)等随孕周进展而变化,应按孕周分组;邻近孕周均数相近者,可合并几周计算.若为偏态分布,应以百分位数计算,则例数应≥120例.取各孕周对象时,应考虑到所取各孕周中的例数分布大致均衡.显然,文稿中往往以少量例数求得正常值是欠可靠的.

  3.统计处理:应根据所得数据分布特征采用不同的统计处理方法.属正态或近似正态分布的数据,可采用x±s法计算;这也适用于以一定方法能将非正态分布转换成正态或近似正态分布的资料.对无法转换的偏态资料,应采用百分位数计算法.具体计算(包括上下限初步制定)见文献.

  4.对照数量:相应观察的病例数(包括分组)应不少于30例,这对制定某指标有临床意义的异常阈值尤其重要,这一点往往易被忽视.如在参考较多病例数据后,唾液游离e3的下限异常阈值应为第2.5百分位数,而非通常采用的5百分位数.否则,将会导致该指标产前监护的假阳性率增加.

  三、t检验与校正t检验(t′检验)这是文稿中极易混淆的一类计量资料统计问题.(一)检验的注意事项

  1.t检验的意义:t检验与所有统计分析相同,其结果提示现有差别不仅仅是抽样误差所致,且提示犯第一类错误的可能性大小,即t0.05与t0.01犯第一类错误的可能性各为5%与1%.

  2.统计意义与临床意义的关系:统计学有显著意义,而在临床上可能是无意义的,提示该研究应继续深入,以明确该差异是否真有显著意义;相反,统计无显著意义,而临床上却是有意义的,不能贸然轻易地下结论.应复查实验设计、方法、试剂及仪器性能、质控措施和实验数据等是否有问题,或尚需再进一步增加样本量进行复测等.

  3.t检验适用范围:t检验仅适用于正态或近似正态分布(包括偏态转换)和其方差是齐性资料的检验;t检验适用于可比性资料,即除了欲比较的因素外,其它所有可影响的因素应相似.

  4.t检验的结果判断:判断结果不应绝对化,p<或>0.05,分别表示可拒绝或接受原定的假设,但两者都有5%的可能性犯第一类错误;而p值越小,只能是更有理由拒绝原定的假设.

  5.单侧与双侧检验:应预先制定本研究的结果是需行双侧还是单侧检验.对有把握确知某治疗措施或某指标是不会劣于现有的,才作单侧检验;若不知何者为优,应行双侧检验.因为在同一t值的界限上,单侧检验的概率(p)仅为后者的一半,也就是说单侧检验较双侧检验更易得出差别有统计意义的结论,不可随意制定.一般讲,绝大多数研究以采用双侧检验为妥.

  (二)t′检验与t检验的区别

  当两样本均数的方差非齐性时,应以t′替代t检验.例如:甲组32例血清某指标值为53.9±49.6(μmol/l);乙组6例的结果为26.6±7.2(μmol/l),若不考虑两样本方差大小,t检验示t=1.331,p>0.05,提示两组血清该指标的平均含量差异无显著意义.但先作方差齐性检验,f=47.4,p<0.01,示这两样本方差差异有极显著意义.据此应采用t′检验,t′=2.952>t′0.012.875,p<0.01.显然,与上述结论恰恰相反.χ2与直接概率法(或精确法)检验

篇十:统计研究方面的问题

  非常感谢公司给我这个成长的平台令我在工作中不断的学习不断的进步慢慢的提升自身的素质与才能回首过往公司陪伴我走过人生很重要的一个阶段使我懂得了很多领导对我的支持与关爱令我明白到人间的温情在此我向公司的领导以及全体同事表示最衷心的感谢有你们的协助才能使我在工作中更加的得心应手也因为有你们的帮助才能令到公司的发展更上一个台阶在工作上围绕公司的中心工作对照相关标准严以律己较好的完成各项工作任务

  关于统计数据质量问题的研究

  【摘要】我国政府于2002年4月15日正式加入了数据公布通用系统。统计虽然“入世”了,但不论是与社会各界对统计信息的需求相比,还是对统计核算和统计数据公布的国际准则的运作要求相比,我国的统计数据质量目前都还有一定差距。为了更好地满足社会经济发展过程中社会各界对统计数据的需求,使我国统计进一步与国际接轨,有必要对我国统计数据质量管理进行研究。

  【关键词】统计数据;质量问题;国家统计局

  统计数据质量问题是衡量统计工作的核心指标。尤其是我国加入WTO,与世界经济接轨的今天,社会各界对统计信息的需求量越来越大,对统计信息质量的要求也越来越高。统计信息质量的高低直接影响和决定着统计信息的可利用性。统计数据质量低下将会直接导致错误的决策。因此,努力提高统计数据的质量,实现统计信息的准确、有效、全面、有着重要的意义。

  一、统计数据质量的含义传统的统计数据质量仅仅指其准确性,通常

  ofrualdinkgwtesc,pbyhm

  用统计估计中的误差来衡量。但如今“质量”的概念被拓宽了,“统计数据质量”的概念也有必要拓宽。目前各国统计机构和有关国际组织对统计数据质量含义的解释和理解仍存在一定的分歧,对统计数据质量应涵盖哪几个方面,还没有统一的标准。各国从本国的实际情况以及对数据质量含义的理解出发,确定了不同的数据质量标准。如英国政府统计数据质量标准是准确性、时效性、有效性、客观性;韩国的质量标准则是适用性、准确性、时效性、可索取性、可比性、有效性。在我国,统计数据质量主要包括统计数据的核心质量、形式质量及延伸质量三大方面。

  二、我国统计数据质量管理现状及存在问题改革开放以来,我国统计人员大胆探索,辛

  勤实践,在指标体系、调查方法、统计标准、技术手段、数据报送与处理方式等方面进行改革,较好地满足了社会各界对统计信息的需求,推动了统计事业的发展。但是,浮夸风以及片面追求假、大、空现象仍然存在,这些都违背了统计工作的基本要求,阻碍了统计工作的发展。目前我国统计数据质量管理上存在的问题主要有:

  1.统计数据失真。统计制度不够完善是造

  ofrualdinkgwtesc,pbyhm

  成统计数据失真的内在因素,表现在:统计部门内部各专业在统计方法、指标涵义、口径上还存在一定程度上的不统一;专业间统计方法改革不同步;统计范围、口径的理论值与实际值出入有时还比较大;统计与财会在核算周期上还存在一些差异,并且在统计数据质量管理上各级统计管理部门在统计执法过程中力度不够,对统计过程缺少制约与监督,对统计数据缺乏校验与复查的有力措施。

  2.设计时需求不明确,缺乏远见。数据库与文件管理系统的重要区别之一在于不仅存放数据,而且存放数据之间的相关性。相关性不仅表现在数据依存的时间、地点、类型和名称等原始属性上,还会在数据的转移过程中产生再生的相关性。搜集数据阶段使用的方法不正确,应用需求不明确等都会影响数据完整性和准确性。

  3.数据处理手段发展不平衡。数据处理手段出现从基层的手工操作到省、国家一级政府统计数据处理的高度信息化。就地域而言,占全国70%以上的地方统计数据处理是手工操作或半手工操作,速度慢、效率底,可靠性差,这与统计的及时性要求不相符合。统计所反映的当前经

  ofrualdinkgwtesc,pbyhm

  济现象的真实性难以确定。4.质量管理监督措施不够健全。由于多数

  检索系统没有进入实际应用阶段,数据质量的控制和监督往往被人们忽视。绝大多数单位在数据准备、录入阶段缺乏审核等质量控制、监督措施,著录标引的检查,一般采取自己审核或互相审核的方法。缺少科学的统计数据质量评估和监控造成统计数据不同层次脱离实际的偏差,给决策带来极大的不便。

  5.统计人员队伍素质不高。基层统计工作薄弱,统计手段落后,统计人员素质比较低,基层统计队伍不稳定都影响了统计数据质量。

  三、我国统计数据质量管理问题的原因分析在目前我国统计数据质量管理中,以单项数

  据质量管理为主,缺乏综合的、全面的质量管理体系;对数据质量内涵的理解相对来说仍较为狭隘,在实践中主要围绕着数据准确性进行评估,对数据质量的其他方面重视不够;在评估过程中,没有让社会公众和用户充分参与进来,评估机制缺乏必要的透明和有效性,未能取得社会各界对数据资料的充分理解和认可;对于多种经济成分的数据质量评估方法不够明澈;缺乏明确的

  ofrualdinkgwtesc,pbyhm

  数据质量管理要求和目标。从数据质量管理的角度来看,我国统计数据

  质量管理存在诸多问题的原因在于:1.统计数据质量理论及其控制技术与政

  府统计实践脱节。各种统计数据质量控制技术在我国的实际统计工作中的研究和应用不多,对于经常性统计数据质量控制,实际上还主要是采用事后的分析评估和挤水分的方法,而事前的分类预防控制不多,建立误差模型进行分析的也不多,所应用的仅有的一些事后质量控制技术和统计数据质量管理的组织活动没有实现很好的结合,虽然指定了主要统计数据质量的评估方法,但具体方法的应用、由哪些部门负责以及这些部门的质量责任、职权和义务并不明确。

  2.统计数据质量管理中的全面质量管理并不全面。全程性上,只重视调查环节,不重视统计设计环节对数据需求的研究,从而影响数据相关性、及时性的提高;全域性上,所实行并取得很大成功的统计数据全面质量管理的措施及经验,主要集中于几个专项的普查,应用范围较窄;全员性上,只重视统计系统内部的人员控制,而对统计系统外部的,占统计工作人员2/3的基

  ofrualdinkgwtesc,pbyhm

  层统计人员却无从控制。3.缺乏明确的质量管理目标和统一的质

  量管理规范。对统计数据质量管理缺乏明确的质量方针和质量目标,缺乏相对统一的统计数据质量管理标准和规范,导致了统计数据质量的混乱。

  4.控制措施与事后评估结果及发现的问题没有很好结合。统计是一项循环往复的过程,因此每一次新的修订统计设计都应反映出上一次数据质量评估的结论以及质量改进的要求。但是从公布实施的统计调查制度上看,事先的控制措施,如填表要求中的平衡关系,逻辑审核关系用于质量控制的设计内容较少。

  四、提高我国统计数据质量管理的对策和建议多年来,国家统计局一直把统计数据放在首

  要地位,通过不断努力与实践的,摸索出一套方法,即一靠科技,二靠法制,对统计数据实行全面质量管理。在此,结合专家学者对统计数据质量管理的研究,笔者提出一些自己的看法。

  1.搞好统计调查方法的改革是提高统计数据质量的前提。国家统计局在《国家统计制度的总体方案》中提出了我国统计调查方法改革的长

  ofrualdinkgwtesc,pbyhm

  远目标,即“建立以必要的周期性普查为基础,以经常性的抽样调查为主体,同时辅之以重点调查、科学推算和少量的全面报表综合运用的统计调查方案体系”指明了抽样调查作为新统计调查体系的主题,精简全面统计报表。要提高统计数据质量,必须推广抽样调查方法的应用,它避免了对总体单位的逐一调查和较多的中间环节,在较大程度上减少了各方面对统计数据在调查过程中的干扰,因而使得调查的数据较符合客观实际。它具有事先计算及控制抽样平均误差和便于对样本指标进行检查,避免调查工作中间环节的弄虚作假的特点。大大提高了统计数据的准确性和及时性。

  2.强化统计基础工作是提高统计数据质量的保证。首先要搞好统计调查表的设计。企业综合统计部门应根据上级部门和本企业生产经营管理的需要,会同会计等部门统一设计企业内部套表,在设计中应体现新的国民经济核算体系,各指标之间应相互联系,相互配套,统计指标的涵义、范围、计算口径应一致。统计表的设计,统计分类标准和各种编码应当统一,以适应计算机整理、汇总、分析的需要。新的统计报表

  ofrualdinkgwtesc,pbyhm

  的采用,可以克服企业统计工作中存在的杂乱、重复、矛盾等弊端,也有利于报表的规范化、系统化,更有利于统计数据的准确性。其次,实现原始记录、统计台账的标准化。我们知道,原始记录是业务核算、会计核算、统计核算的共同基础,只有这样才能使三种核算结果相互衔接,口径一致,而要保证核算数字的准确性,要求核算的数字来源,都有真实的原始记录为依据。从原始记录开始一直到整理、场内报表及三种核算,数字来源通过逐级加工,都是有据可查的。只有这样核算,数字的准确性才有确切的保证。

  3.加强统计法制法规建设是提高统计数据质量的法律保障。在企业统计工作中,主观随意性是影响统计数据质量的重要因素。领导者的法制观念和对统计数据质量的重视程度以及统计人员的综合素质,对统计数据质量有着直接的影响。只有具有强烈的事业心和责任感,具有高度的统计法制观念,具有基本的工艺技术知识和统计技能的统计人员,才具有做好统计工作的前提和基础。因此,要加强统计法制建设,健全统计法规,防止某些企业领导和统计人员对统计数据弄虚作假,要确定统计犯罪的界限,作出良性的

  ofrualdinkgwtesc,pbyhm

  具体规定,以强化统计法规的法律效力和约束力。应通过典型案件的查处和暴光宣传《统计法》,引起全社会的关注,提高社会公众的法制观念和执法自觉性,使《统计法》真正成为提高统计数据质量的法律保障。

  4.提高统计人员的业务素质是提高统计数据质量的关键所在。统计数据质量与统计人员的业务素质和队伍稳定有直接的关系,企业统计人员是提高统计信息最基础、最原始数据的源泉,因此,为了提高统计人员的业务素质,必须搞好他们的上岗和在岗培训,要实行“统计员资格”考试制度,达到合格标准并取得上岗合格证方可上岗。要提高统计人员的统计分析能力,掌握多种使用统计分析方法,例如聚类分析法、判别分析法、回归分析法、相关分析法、主成分分析法等。其次还要提高统计人员对现代统计分析软件的应用能力做到“一专多能”。依靠科技手段快速提供高质量的统计数据。企业还应按规模大小、统计业务的难易程度,配备有一定统计职称的综合统计人员,以提高统计工作质量,保证统计数据的准确性。

  5.用科学的统计分析方法对数据质量评

  ofrualdinkgwtesc,pbyhm

  估是提高统计数据质量的方法保证。首先,可运用抽样调查法推断总量指标的准确性,它是对全面报表、普查、重点调查的基层统计数据或汇总统计数据进行可靠性检验或误差判断的科学方法。其次,运用回归分析法检测统计数据的可信度。例如,在对汇总数据的评价中,可利用回归分析,发现矛盾,提高数据的可靠性,并可用计算机建立模型,对各类数据纵横比较,以确定其质量。另外,还可用主次因素排列分析图、因果分析图来分析各种统计数据质量。在多种经济成分的统计数据中,要寻求一种能够多因素同时考虑的方法,不能只局限与一些单一因素的评估方法。例如运用模糊评价法等。要加快成立相对独立的专门从事统计数据质量评估的社会终结组织结构,确保统计数据评估的独立性和公正性。

  6.加大新的统计技术的应用是提高统计数据质量的必要途径。计算机技术不仅可以实现数据处理高速化、数据传输网络化、数据贮存资源化,从而降低统计数据在人工处理、传输、贮存等环节上的技术性误差和逻辑性差错,而且有利于从机制上形成强有力的统计质量管理体系,维护统计数据管理相对独立性并有效地遏止随

  ofrualdinkgwtesc,pbyhm

  意虚报、瞒报以及统计数据质量的其他腐败行为。

  总之,提高统计数据质量是统计工作的永恒主题,要在明确什么是统计数据质量的基础上,抓住影响统计数据质量的关键,采取切实有效措施,最大限度地保证提高数据的质量,确保统计三大职能的发挥。

  五、结语统计信息是社会经济信息的主要组成部分,在社会经济生活中发挥着越来越重要的作用。作为其表现形式的统计数据的质量也受到越来越多人的关注。而目前我国的统计数据质量管理,不论是与社会各界的需求相比,还是与相关国际准则的运作要求相比,均存在一定差距。完善我国统计制度是一项长远的任务,这需要统计人员与社会各界的共同努力。

  【参考文献】[1]李金昌.论什么是统计数据质量[J].统

  计与决策,1998,(9).(下转第22页)(上接第50页)

  [2]唐修亭,韩鹏.试论新时期统计数据质量

  ofrualdinkgwtesc,pbyhm

  问题[J].统计与咨询,2000,(6).[3]贾维洁.统计数据质量之我见[J].统计

  科学与实践,2002,(1).[4]田静.关于统计数据质量问题的思考

  [J].统计与决策,2005,(11).[5]陈郁.弄虚作假统计数字现象透视[J].中

  国统计,2002,(2).[6]史象奎.陈鹏程.当前统计制度报表存在

  的问题与改革探讨[J].北京统计,2002,(7).[7]刘建平.我国工业抽样调查研究[J].山

  西财大报,2002,(2).[8]陆蓉.运用抽样调查方法提高统计数据质

  量[J].上海财经大学学报,2004,(4).[9]余芳东.国外统计数据质量评价和管理办

  法及经验[J].北京统计,2003,(7).[10]李群.统计数据质量评估方法之我见

  [J].上海统计,2004,(8).[11]钱迎阳.如何加强统计数据质量管理

  [J].统计与决策,2004,(10).[12]T.Dalenius.Errorsandother

  limitationsofsurvey,StatisticalMethodsandtheImprovementofDataquality[M].London:

  ofrualdinkgwtesc,pbyhm

  AcademicPressInc,1983.[13]GordonBrackstone.ManagingData

  QualityatStatisticsAgency.SurveyMethodology.

  ofrualdinkgwtesc,pbyhm

篇十一:统计研究方面的问题

P>  统计学论文问题分析

  一、常用的统计术语

  统计学中常用的概念有总体与样本、随机化与概率、计量与计数、等级资料及正态与偏态分布资料、标准差与标准误等。如某研究采用经会阴途径测定宫颈长度,以探讨不同宫颈长度与临产时间的关系。结果显示35例宫颈长度为25~34mm者与32例宫颈长为15~24mm者临产时间的均值±标准差(x±s)各为57.6±58.1与47.3±49.1小时。该计量资料,经t检验显示t=0.780,P>0.05,并未提示不同宫颈长度的临产时间差异有显著意义;从标准差大于均值,显示各变量值离散程度大,呈偏态分布,故不能采用x±s这一算术均数法计算均数。经偏态转换成近似正态分布资料后结果是:35例与32例的临产时间各为34.5±4.1与26.7±4.1小时,(t=7.778,P<0.001),两组差异有极显著意义。可认为随着宫颈长度的缩短、临产时间也缩短。此外,当两组资料单位不同时,其S单位也不同;即使两组单位相同的变量值,若其均数差异较大,也都应以变异系数替代s来比较两组值的离散度的大小。

  二、正常值范围及异常阈值的确定

  如何选择研究对象,至少需多少例,正确统计处理和参考一定数量的病例数据,是确定正常值范围及异常阈值的四个重要因素。

  1.研究对象:应为“完全健康者”,可包括患有不影响待测指标疾病的患者。如“正常妊娠”的条件:孕前月经周期规则、单胎、妊娠过程顺利、无产科并发症及其它有关合并症,分娩孕周为37~41周+6,新生儿出生体重为2500~4000g和Apgar评分≥7分。

  2.观察数量:观察数量应尽可能多于100例;需分组者,各组人数也是如此(标本来源困难时酌情减少)。有些指标值如雌三醇(E3)、甲胎蛋白(AFP)、胎盘泌乳素(HPL)等随孕周进展而变化,应按孕周分组;邻近孕周均数相近者,可合并几周计算。若为偏态分布,应以百分位数计算,则例数应≥120例。取各孕周对象时,应考虑到所取各孕周中的例数分布大致均衡。显然,文稿中往往以少量例数求得正常值是欠可靠的。

  3.统计处理:应根据所得数据分布特征采用不同的统计处理方法。属正态或近似正态分布的数据,可采用x±s法计算;这也适用于以一定方法能将非正态分布转换成正态或近似正态分布的资料。对无法转换的偏态资料,应采用百分位数计算法。具体计算(包括上下限初步制定)见文献。

  4.对照数量:相应观察的病例数(包括分组)应不少于30例,这对制定某指标有临床意义的异常阈值尤其重要,这一点往往易被忽视。如在参考较多病例数据后,唾液游离E3的下限异常阈值应为第2.5百分位数,而非通常采用的5百分位数。否则,将会导致该指标产前监护的假阳性率增加。

  三、t检验与校正t检验(t′检验)

  这是文稿中极易混淆的一类计量资料统计问题。

  (一)检验的注意事项

  1.t检验的意义:t检验与所有统计分析相同,其结果提示现有差别不仅仅是抽样误差所致,且提示犯第一类错误的可能性大小,即t0.05与t0.01犯第一类错误的可能性各为5%与1%。

  2.统计意义与临床意义的关系:统计学有显著意义,而在临床上可能是无意义的,提示该研究应继续深入,以明确该差异是否真有显著意义;相反,统计无显著意义,而临床上却是有意义的,不能贸然轻易地下结论。应复查实验设计、方法、试剂及仪器性能、质控措施和实验数据等是否有问题,或尚需再进一步增加样本量进行复测等。

  3.t检验适用范围:t检验仅适用于正态或近似正态分布(包括偏态转换)和其方差是齐性资料的'检验;t检验适用于可比性资料,即除了欲比较的因素外,其它所有可影响的因素应相似。

  4.t检验的结果判断:判断结果不应绝对化,P<或>0.05,分别表示可拒绝或接受原定的假设,但两者都有5%的可能性犯第一类错误;而P值越小,只能是更有理由拒绝原定的假设。

  5.单侧与双侧检验:应预先制定本研究的结果是需行双侧还是单侧检验。对有把握确知某治疗措施或某指标是不会劣于现有的,才作单侧检验;若不知何者为优,应行双侧检验。因为在同一t值的界限上,单侧检验的概率(P)仅为后者的一半,也就是说单侧检验较双侧检验更易得出差别有统计意义的结论,不可随意制定。一般讲,绝大多数研究以采用双侧检验为妥。

  (二)t′检验与t检验的区别

  当两样本均数的方差非齐性时,应以t′替代t检验。例如:甲组32例血清某指标值为53.9±49.6(μmol/L);乙组6例的结果为26.6±7.2(μmol/L),若不考虑两样本方差大小,t检验示t=1.331,P>0.05,提示两组血清该指标的平均含量差异无显著意义。但先作方差齐性检验,F=47.4,P<0.01,示这两样本方差差异有极显著意义。据此应采用t′检验,t′=2.952>t′0.012.875,P<0.01。显然,与上述结论恰恰相反。

  四、卡方(χ2)、校正χ2与直接概率法(或精确法)检验

  这三种检验方法为一类用途较广、但也易混淆的、适用于计数资料检验的方法。应注意,鉴于总数与理论值的不同,应采用相适合的检验方法。

  例1.192例出生体重≥4000g的新生儿发生难产与窒息数分别为151例与22例;3475例出生体重≥3500~4000g的新生儿发生难产与窒息数分别为185与265例;2451例出生体重≥2500~3500g的新生儿发生难产与窒息数分别为

  122与169例。3组的构成比:难产与新生儿窒息率分别为:78.6%、5.3%、5.0%与11.4%、7.6%、6.9%。据此贸然认为出生体重≥2500~3500g为最佳新生儿分娩体重的结论是不可靠的。经χ2分析,后两组的难产与窒息率间和前两组窒息率间差异均无显著意义(P均>0.05)。故可认为,单据本研究结果是难以得出上述临床上认可的结论的。这涉及到上述“统计无显著意义,而临床却是有意义”的问题,应进一步复查或增加样本测试。杜绝单纯根据百分率的大小贸然下结论。

  例2.某药治疗感染衣原体(CT)的中、晚期孕妇各11例和36例,她们的新生儿感染CT数各为3例和23例。χ2检验得χ2=4.570,P<0.05。据此误认为,某药治疗中孕期感染CT孕妇的新生儿感染CT数少于晚孕期才开始治疗的新生儿感染数。根据统计原则,其中一个数的理论值为4.9(<5)时,应采用校正χ2计算,得χ2=3.209,p>0.05。显然,正确结论恰与上述相异。

  例3.以精确法替代χ2检验。某新技术测试8例卵巢内胚窦瘤患者,5例呈阳性反应;测试25例卵巢颗粒细胞瘤患者中6例阳性。χ2检验得χ2=4.042,P<0.05。误认为该新技术测前组的阳性率高于后组。但鉴于总例数33例(<40),且其中一个数的理论值为2.7(<5),故应改用精确法检验,结果首次计算p值,已达0.102,>双侧检验的有显著性意义的界限0.025,故P>0.05。结论也恰相反。

  五、相关与回归分析

  相关分析只是以相关系数(r)来表示两个变量间直线关系的密切程度和相关方面的统计指标。无论是正相关(r为正值)或负相关(r为负值),只是经相关系数的统计意义检验(如t检验)后,当P<0.05时,即示差异有显著意义时,才能依据|r|值的大小来说明两变量间相关的密切程度。因此,表示相关性,除写出r值外,应注明P值;切不可将相关的显著性误解为相关程度;也应注意:相关分析是不能单纯用于阐明两事物或现象间存在着本质的联系,即使两变量间存在高度相关关系(即有一定的统计联系),也不能证明它们间存在着因果关系。如欲证明两事物间的内在联系,必需凭借专业知识从理论上加以阐明。

  “相关”是表示两个变量间相互关系的密切程度,而回归分析是提示两个变量间的从属关系。在回归分析中,应注意由X变量值推算Y,与以Y变量值推算X的回归线是不一样的;直线回归方程的适用范围,一般仅适合于自变量X原测数据的范围,故绘制回归线时,X值切不能超越实测值的范围而任意延长。

  可见,这两种分析,说明的问题是不同的,但相互又有联系。在作回归分析时,一般先作相关分析,只有在相关分析有统计意义(即回归有统计意义)的前提下,求回归方程和回归线才有实际意义。决不能把毫无实际意义的两个事物或两种现象进行相关与回归分析。

  六、数据的正确书写

  1.文稿内各数据的书写必须前后一致;总数应等于各分组的数据之和。

  2.对不同指标,有其不同数据精度的要求,这应结合专业知识加以判断。如新生儿出生体重是以公斤为单位,记录测定数据精确到小数点后的第二位数字即可。

  3.测定数据的书写,不能超越其测量仪器测试的精确度范围。

  4.同一指标的前后数据应保持同一精确度。

  5.经计算,出现比预定小数点后两位数多的数字,应采取“≤4舍、≥6入”与“5‘奇’进‘偶’出”方法,以决定小数点后第三位数字是“舍”还是“入”,即5前为单数则入,双数则舍。

  6.未经统计检验,文稿内不宜出现推断性的比较结果的结论。如“××结果的百分率高或低于××结果的百分率”、“本文结果较××报道的多或少或类似”等结论。这在综述类文章撰写过程中也需注意;欲予以比较,也应注意两者的可比性。

  上述是统计学中较为基础的概念,但又是文稿中常见的、较易出现差错的内容。因此可以认为,统计学是医护人员必需掌握并能熟练应用的一门重要知识;藉此,可不断地从自身和他人的研究中获取更多、更新和更可靠的专业信息。关键词:统计学问题

篇十二:统计研究方面的问题

P>  文档可编辑

  经济治理类“十二五〞规划教材

  统计学

  -基于典型案例、问题和思想主讲林海明

  第一章绪论

  【引言】我们从如下9个重要事例,说

  文档可编辑

  文档可编辑

  明统计学有什么用。事例1:二次世界大战中,最剧烈的空

  战是英国抗击德国的空战,英军为了提高战斗力,急需找到英军战机空战中的危险地域加固钢板,统计学家瓦尔德用统计学方法找到了危险地域,英军用钢板加固了这些危险地域,使英军取得了空战的胜利。

  事例2:上世纪20-30年代,为了找到中国革命的主力军和道路,政治家毛泽东

  文档可编辑

  文档可编辑

  悟出了统计学的频数方法,用此找到了中国革命的主力军是农民,中国革命的道路是农村包围城市。由此不屈不饶的奋斗,由弱变强,建立了独立自主的X,他还觉察了“没有调查,就没有发言权〞的科学论断。

  事例3:1998年,美国博耶研究型大学本科生教育委员会发表了题为《重建本科生教育:美国研究型大学开展蓝图》的

  文档可编辑

  文档可编辑

  汇报,该汇报指出:为了培养科学、技术、学术、政治和富于制造性的领袖,研究型大学必须“植根于一种深刻的、永久性的核心:探究、调查和觉察〞。这说明了统计学中调查的重要性。

  事例4:在居民收入贫富差距的测度方面,美国统计学家洛仑兹〔1907〕、意大利经济学家基尼〔1922〕找到了统计学的洛仑兹曲线、基尼系数,由此给出了居民收

  文档可编辑

  文档可编辑

  入贫富差距的划分结果,为政府改进居民收入贫富不均的问题提供了政策依据。

  事例5:二战后产品质量差的日本,以田口玄一为代表的质量治理学者用统计学方法找到了3σ质量治理原则,用其大幅提高了企业的产品质量,其产品畅销海内外,日本因此成为当时的第二经济强国。该学科现已开展到了6σ质量治理原则。

  事例6:在第二次世界大战的苏联卫国

  文档可编辑

  文档可编辑

  战争中,专家们用英国统计学家费歇尔〔1925〕的最大似然法、无偏性,援助苏军破解了德军坦克产量的军事秘密,由此苏军组织了充分的军事力量并联合盟军,打败了德军的疯狂进攻并占据了柏林。

  事例7:在产品质量检验方面,英国统计学家戈赛特〔1908〕、波兰统计学家奈曼〔1934〕找到了统计学的t-检验方法,为企业、质量监督部门、消费者的产品质量

  文档可编辑

  文档可编辑

  检验,大大提高了工作效率,t-检验成为二十世纪质量改进的第一次大奉献。

  事例8:在身高方面,矮父亲儿子的身高有比父亲高的趋势吗?高父亲儿子的身高有比父亲矮的趋势吗?英国统计学家高尔顿〔1886〕用德国数学家高斯的最小二乘法〔1801〕找到了统计学的回归分析方法,解决了该问题。该方法推广应用到经济学中,获得了三届诺贝尔经济学奖。

  文档可编辑

  文档可编辑

  事例9:某些商品或大量商品价格的突然上涨,会给老百姓的生活带来恐慌,会引起社会的普遍关注,如何及时反映市场商品价格的变化呢?德国经济学家帕歇〔1874〕找到了统计学的指数分析方法,为政府解决问题提供了政策依据。

  上述事例,我们看到了统计学在军事、政治、教育、社会、经济、质量治理、生物学领域的重要应用,看到了学者领袖瓦

  文档可编辑

  文档可编辑

  尔德、毛泽东、洛仑兹、基尼、田口玄一、费歇尔、戈赛特、高斯、高尔顿、帕歇的人文奉献和力量,看到了如下变量的数据:战机空战中的危险地域,革命的主力军和道路,大学的核心,居民收入,产品质量,坦克产量,身高,商品价格。这些事例的进一步描述是本书一些章节开头局部的典型案例,通过这些典型案例读者可以对统计学的作用有一个较深刻的了解,由此衔

  文档可编辑

  文档可编辑

  接各章所要学习的内容。经济学家萨缪尔森认为:在许多与经

  济学有关的学科中,统计学特别重要。事实上,在诺贝尔经济学奖获奖者中,三分之二以上的成果与统计和定量分析有关。

  杜邦公司总经理理查德指出:现代公司在许多方面是依据统计来行事的。

  202X年,我国经济学家、教育学家顾海良认为,统计学是二十一世纪最有前途

  文档可编辑

  文档可编辑

  的一门学科。鉴于统计学为世界社会经济、科学技

  术的开展和进步作出了庞大奉献,202X年,第64届联合国大会第90次会议通过决议,每年10月20日为“世界统计日〞。

  202X年,我国将统计学上升为一级学科。

  事实上,统计学和数据已渗透到社会生活、科学技术的方方面面。统计学如此

  文档可编辑

  文档可编辑

  重要,那么究竟什么是统计学?统计学是如何解决实际问题的?统计学与数学、经济学等实质性学科有何区别与联系?这些是本章第一节所要介绍的内容。

  第一节统计学的含义和作用

  一、什么是统计学?统计学开展至今已有300多年。历史上,英文中的统计statistics与“国家〞同

  文档可编辑

  文档可编辑

  一词根,即自从有了国家,总揽者就用统计来治理国家。1846年,比利时统计学家凯特勒在他的《概率论书简》《社会物理学》中认为:统计学是一门既研究社会现象又研究自然现象的方法论科学。我们将从如下案例来认识统计学的含义和作用:

  【典型案例1】瓦尔德援助英军找到了英军战机空战中的危险地域

  二战时期,英国和德国在英吉利海峡

  文档可编辑

  文档可编辑

  上空的空战非常惨烈,正义与邪恶到达了你死我活的胶着状态,为了提高英国空军的战斗力,英国统计学家瓦尔德被英国空军司令咨询:飞机上什么地域应该加强钢板?

  经过他的探究和设计,他和助手拿了飞机模型到机场,查看从空

  文档可编辑

  英国统计学家瓦尔德

  文档可编辑

  战中返航的军机受敌军创伤的弹孔位置,在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,几天后,他的飞机模型上几乎布满了有弹孔的地域,因为没有弹孔地域被击中的飞机都没有返航,有弹孔地域被击中的飞机照样返航,故没有弹孔地域是军机的危险地域,于是他提议,把剩下少数几个没有弹孔的地域加强钢板〔颠覆了事前哪里有弹孔,

  文档可编辑

  文档可编辑

  钢板就加强哪里的传统做法〕。英国人按此加固了飞机,在最后一次空战后,英国空军司令说:如果德国再发动一次空战,我们就完了……但德国再也没有对英国发动一次空战了,英国胜利了!

  该案例是军事问题+统计学+智慧的成果,生动而充满人性的力量!瓦尔德因在统计决策领域的奉献而成为该领域的领袖。

  从典型案例1中分析和提炼有《大不列

  文档可编辑

  文档可编辑

  颠百科全书》中的定义:统计学是搜集、处理、分析和解释数

  据,以便更好决策的一门方法论学科。数据是反映客观事物的特征及其表

  现,是统计学的研究对象。当其表现是非数值时,是定性数据,如飞机员的姓名、性别等;当其表现是数值时,是数量数据,如飞机的弹孔位置等;当其表现是图像时,是图像数据,如飞机模型上布满了弹孔的

  文档可编辑

  文档可编辑

  地域等;当其表现是声音时,是声音数据,如飞机的轰鸣声等。

  分析数据的方法有描述统计、推断统计。

  如典型案例1中,“瓦尔德在他的飞机模型上逐个不重不漏地标示从空战中返航军机受敌军创伤的弹孔位置,几天后,他的飞机模型上几乎布满了有弹孔的地域〞是描述统计及其结果。描述统计是将所搜

  文档可编辑

  文档可编辑

  集的数据处理后,用数值、表格或图形形式表现的有用信息。

  “他的飞机模型上没有弹孔地域是军机的危险地域〞是推断统计及其结果。英军全部军机称为总体,总体的局部称为样本,推断统计就是依据样本数据特征去估量或检验总体的数据特征。典型案例1的调查有特别性:所掌握的数据只有样本数据从空战中返航军机受敌军创伤的弹孔位置,

  文档可编辑

  文档可编辑

  这里的调查是破坏性的,不可能对总体的全部个体都进行观察和实验取得结果,而我们所需要的是总体的数据特征-英军全部军机空战中的危险地域。这时必须用推断统计来解决问题,这是现代统计学的主要内容。

  从典型案例1中分析和归纳有统计学的作用:

  在结合实质性学科的过程中,统计学

  文档可编辑

  文档可编辑

  是能觉察客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。

  当然,领袖是少数,执行者和参与者是多数,每个人都有自己的合理位置。面对事例3中美国培养各领域领袖和当今各学科领域尖端知识、技术的严峻挑战,中国各学科领域应努力践行“探究、调查、觉察〞,培养和拥有自己各领域的领袖,这些领袖能引领中国人在相应的领域获得

  文档可编辑

  文档可编辑

  应有的独立性、自主性、公平性和话语权。各学科领域培养和拥有自己的领袖应该是每个学科领域应有的使命和奋斗目标。

  要觉察客观世界规律,对统计数据通常有要求:客观性、适用性、精确性和及时性。客观性是指能反映客观事实而不受任何偏见的影响或任何势力的干扰;适用性是指统计数据能适应解决问题的目的;精确性是指统计数据能够反映真实情况,

  文档可编辑

  文档可编辑

  不出现较大的误差;及时性是指统计数据应及时搜集、整理、使用。

  二、统计学是如何解决实际问题的?古人云:与其给人一堆猎物,不如给人一杆猎枪。因此,统计学解决实际问题的思路〔步骤〕很重要。从典型案例1中分析和提炼有统计学解决实际问题的根本思路〔步骤〕是:①提出与统计有关的实际问题;

  文档可编辑

  文档可编辑

  ②建立有效的指标体系;③搜集数据;④选用或制造有效的统计方法整理、显示所搜集数据的特征;⑤依据所搜集数据的特征、结合定性、定量的知识作出合理推断;⑥依据推断给出更好决策的建议。不解决问题时,重复第②-⑥步。学习中,当我们识别了这六步,就有

  文档可编辑

  文档可编辑

  了一个结构较完整的知识理解。上述第一步尤其重要,数学家哈尔莫斯指出“问题是数学的心脏〞,同样我们认为,问题是科学的心脏,因为有问题才了解目的,有问题才了解做什么,有问题才有进步、提高和期望。

  三、统计学的开展和应用领域上述引言的重要事例中,从统计学的深刻开展看,产生了统计调查、统计分布、

  文档可编辑

  文档可编辑

  参数估量、假设检验、相关与回归分析、时间序列分析、多元统计分析等丰富的统计学理论。从统计学在各领域的应用上看,产生了应用统计学领域及其家族,见表11。事实上,只要有数据的地方,就会有统计学的应用,而各个领域都有数据,因此,统计学在各个领域都在发挥觉察客观世界规律,更好决策的作用。

  表1-1应用统计学一览表

  文档可编辑

  文档可编辑

  统计学理论和应用统计学总是相互促

  军经政营金社教贸事济治销融会育易学学学学学学学学

  物生医质心化理物学量理学学学治学

  理

  军经政营金社教贸

  物生医质心化

  事济治销融会育易

  理物学量理学

  统统统统统统统统

  统统统治统统

  计计计计计计计计统计学计计计理计计

  统

  计

  文档可编辑

  文档可编辑

  进,共同提高的。统计理论的研究为应用统计提供方法论根底,应用统计学在对统计方法的实际应用中,常会对统计学理论提出新的问题,开拓统计学理论的研究领域。当然,统计学也可从自身不完善的理论中提出新问题。

  作为经济和治理类的学生,所要学习的统计学主要是社会经济统计学。其是一门以社会经济现象的数据为特定研究对象

  文档可编辑

  文档可编辑

  的应用统计学。由于社会经济现象所具有的复杂性和特别性,社会经济统计学不仅要应用一般的统计方法,而且还需要研究自己独特的方法,如核算的方法、指数方法、综合评价方法等。

  通过社会经济统计,国家可以精确、及时、全面、系统地掌握国民经济和社会开展情况,对国民经济和社会运行监督和预警,为宏观调控和决策提供依据。企业

  文档可编辑

  文档可编辑

  可以及时了解商品市场和要素市场运行的状况和企业自身的经营动态,为企业营销决策、投资理财决策提供参考。

  四、统计学与数学、经济等实质性学科的联系与区别

  〔一〕统计学与数学在典型案例1中,数学只用到了空间解析几何的飞机模型。即在统计学解决实际问题的步骤中,在数据的特征描述环节中

  文档可编辑

  文档可编辑

  会用到数学的一些公式和结论,但用得不多,会用就行,根本上不需要数学推导和证明。数学中的概率论等,为统计学提供了数量分析的理论根底。统计学理论以抽象的数量为研究对象,其大局部内容也可以看作是数学的分支。

  统计学与数学的区别:从成果评价标准看,数学注重从假设到结论逻辑推导的正确性,而统计注重从客观世界觉察规律

  文档可编辑

  文档可编辑

  及其更好决策。因此,会出现某些人数学学得差,但统计会学得好的情况。从研究对象看,数学以最一般的形式研究数量的联系和空间形式。统计学特别是应用统计学则是研究数据。从研究方法看,数学主要是逻辑推理和演绎论证的方法。而统计本质上是归纳的方法。统计学家特别是应用统计学家需要深刻实际,进行调查或实验去取得数据,研究时不仅要运用统计的

  文档可编辑

  文档可编辑

  定量方法,而且还要结合某一特意领域的定性知识。

  〔二〕统计学与经济学在统计学解决实际问题的步骤中,在第①②⑤⑥步会与经济学的知识相结合。经济学涉及大量经济数据,因此,统计学是开展经济研究不可或缺的重要工具。通过统计的实证研究,可以援助人们认识有关的数据规律,同时检验经济学理论的真

  文档可编辑

  文档可编辑

  实性和完善程度。经济学等实质性学科对经济统计学起着重要的指导作用。不仅统计指标体系的设定离不开经济学科的问题,而且应用统计方法也在很大的程度上受所研究对象性质的影响。它们的区别可从定义、特点中比较。

  〔三〕统计学与相关实质性学科在统计学解决实际问题的步骤中,在第①②⑤⑥步会与相关实质性学科的知识

  文档可编辑

  文档可编辑

  相结合。同样,统计学是开展实质性学科定量研究不可或缺的重要工具,通过统计的实证研究,可以援助人们认识相关实质性学科的数据规律,同时检验相关实质性学科理论的真实性和完善程度。相关实质性学科对统计学应用起着重要的指导作用。不仅统计指标体系的设定离不开实质性学科的问题,而且应用统计方法也在很大的程度上受所研究对象性质的影响。它

  文档可编辑

  文档可编辑

  们的区别可从定义、特点中比较。统计学解决实际问题中,都会涉及到

  上述数据、变量、总体、样本等根本概念,这些是本章第二节介绍的内容。

  第二节统计学的根本概念

  一、总体及其单位统计学解决任何一个问题,都有待认识的客观事物的全体,如典型案例1中英军

  文档可编辑

  文档可编辑

  的全部战机;事例4中的全部居民。统计学将待认识的客观事物的全体称为总体,即统计总体是依据肯定目实在定的,由客观存在的、具有某种同质性的许多个别事物构成的整体。

  同质性是确定统计总体的根本标准,它是依据统计的研究目的而定的。研究目的不同,所确定的总体也不同,其同质性的意义也随之变化。例如,研究某地区居

  文档可编辑

  文档可编辑

  民贫困户的生活状况,那么,该地区贫困线下的居民户则构成了统计总体,贫困线下的居民户是同质的,而贫困线上的居民户是非同质的。

  统计总体还应具备大量性,即统计总体应该由足够数量的同质性单位构成。

  总体单位〔简称单位〕是组成总体的各个个体。如典型案例1中英军的每架战机;事例4中的每个居民。

  文档可编辑

  文档可编辑

  二、样本统计学解决问题的目的是认识总体的数据特征。但是,当调查是破坏性的,或者出于本钱、时间等因素时,不必要或不可能对构成总体的全部单位都进行调查。如:典型案例1中的全部军机;某企业的轿车产品。这时,需要采纳肯定的方法,从总体〔又称母体〕中抽取一局部单位,作为总体的代表加以研究。如:典型案例1

  文档可编辑

  文档可编辑

  中是查看从空战中返航的军机;从某企业制造的轿车中抽取16辆进行调查。这种由总体的局部单位组成的集合称为样本〔又称子样〕。构成样本的单位称为样品,样本中样品的数目称为样本容量。

  三、标志、指标(参数)和统计量统计调查中,都是从总体单位的特征及其表现认识开始的,如:典型案例1中每架英军战机的类型;事例4中每个居民的收

  文档可编辑

  文档可编辑

  入。我们将这些总体单位普遍具有的属性或特征称为标志。

  标志按其表现分为品质标志和数量标志两种。品质标志说明单位属性方面的特征,品质标志的表现只能用非数值来描述。如:典型案例1中英军战机的类型,事例4中每个居民的性别。数量标志说明单位数量方面的特征,表现用数值来描述,如:典型案例1中英军战机的弹孔位置,事例4

  文档可编辑

  文档可编辑

  中每个居民的收入。统计总体具有的数量特征的概念和数

  值称为统计指标,也称为参数。例如事例4中居民人口数100万人,总收入31.4亿元。统计指标由两项根本要素构成,即指标的概念和指标的取值。指标的概念是对所研究现象本质的抽象概括,也是对总体数量特征的质的规定性。确定统计指标必须有肯定的理论依据,使之与社会经济或科学

  文档可编辑

  文档可编辑

  技术的范畴相吻合。统计指标按表示形式可以分为数量指

  标和质量指标。但凡反映现象总规模、总水平的统计指标称为数量指标。例如事例4中居民总数100万人、总收入31.4亿元等,这些指标反映现象或过程的总规模和水平,所以也称为总量指标,用绝对数来表示。但凡反映现象相对水平和工作质量的统计指标称为质量指标,例如事例5中企业

  文档可编辑

  文档可编辑

  职工平均工资5000元、工人出勤率93%等。质量指标是总量指标的派生指标,用相对数或平均数来表示,以反映现象之间的内在联系和比照关系。

  单个指标不能反映总体的全貌,这便需要设立指标体系。统计指标体系是由一系列相互联系的统计指标组成的有机整体,用以反映所研究现象各方面相互依存相互制约的关系。例如,企业竞争力指标

  文档可编辑

  文档可编辑

  体系,居民生活质量指标体系等。样本具有的数量特征的概念和数值称

  为统计量。如:某汽车制造企业抽取16辆轿车的平均行驶里程50万公里,合格率94%等。人们通常用统计量估量相应的参数。

  四、数据〔一〕变量与变量值

  将上述标志、指标和统计量的名称进行归纳就是变量。即说明现象的某一事实

  文档可编辑

  文档可编辑

  或数量的特征称为变量,变量的具体表现是变量值,数据就是变量及其表现,也可称为反映客观事物的事实或数量依据。如:收入是一个变量,收入的表现是变量值。将在特定研究过程中搜集的全部数据集合在一起,称为数据集。

  〔二〕数据的计量尺度品质标志的居民性别用无序的文字

  男、女计量,居民的中意度用有顺序的非

  文档可编辑

  文档可编辑

  数值计量,数量指标用绝对数来表示,质量指标用比照的数来表示,因此,搜集数据时需要用到以下四种由低到高的尺度:定类尺度、定序尺度、定距尺度和定比尺度,计量尺度的不同决定了不同的数据分析与处理方法。

  1.定类尺度是说明客观现象无序类别的计量。定类尺度的主要数学特征是“=〞或“≠〞。如居民的性别是男、女计量,

  文档可编辑

  文档可编辑

  战机的类型是战斗机、轰炸机、侦察机等计量,这一场合的所使用的数值只作为无序分类的代码。如居民性别用“1〞表示男性,用“0〞表示女性。在统计处理中,对于不同的类别,可以计算单位数。

  2.定序尺度是说明客观现象有序类别的非数值计量。定序尺度的主要数学特征是“<〞或“>〞。例如,对居民的中意度计量可以分为非常中意、中意、一般、不

  文档可编辑

  文档可编辑

  中意、非常不中意五类,在这里,定序尺度能确切地说明中意高于一般,一般高于不中意……。这一场合的所使用的数值只作为有序分类的代码。

  3.定距尺度是说明客观现象数值间距有意义的计量。其用确切的数值反映现象之间在量方面的差异,使用的计量单位一般为实物单位〔自然或物理〕或者价值单位。定距尺度的主要数学特征是“+〞

  文档可编辑

  文档可编辑

  “–〞“×〞。如总量指标是定距尺度计量的。

  4.定比尺度是说明客观现象两个数值比是有意义的计量。定比尺度的主要数学特征是“÷〞。如质量指标中的相对数、平均数是定比尺度计量的。

  定类尺度、定序尺度的数据统称为定性数据,定距尺度、定比尺度的数据统称为定量数据。定性变量是指带有定性数据

  文档可编辑

  文档可编辑

  的变量,定量变量是指带有定量数据的变量。

  依据定量变量值连续出现与否,定量变量分为连续性变量与离散型变量。连续型变量是指变量在某一地域内的取值是连续不断的,无法一一列举。如:军机的弹孔位置,产品的寿命等。离散型变量是指变量的取值是间断的,可以一一列举。例如,产品数,职工人数等。

  文档可编辑

  文档可编辑

  依据变量值确定与否,变量分为确定性变量与随机变量。确定性变量是受确定性因素影响的变量,即影响变量值变化的因素是明确的,是可解释和可操作的。如参数。随机变量则是受许多微小的不确定因素〔又称随机因素〕影响的变量,是变量值不确定、事前不了解、测了才了解的变量。如员工的起床时间,统计量等。社会经济现象既有确定性变量也有随机变

  文档可编辑

  文档可编辑

  量。统计学所认识的对象中主要是随机变量。

  〔三〕数据的类型依据对客观现象观察的角度不同,统

  计数据可分为:横截面数据、时间序列数据和面板数据。例如,202X年全国各省、市、自治区的居民收入总值就属于横截面数据。横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位进行

  文档可编辑

  文档可编辑

  观察而获得的数据。例如,“十二五〞期间我国按年份顺序的居民收入总值就属于时间序列数据。时间序列数据又称为动态数据,它是指在某一段时期内按时间顺序对同一总体进行观察而获得的数据。面板数据则是同时在时间和截面空间上取得的二维数据。例如202X-202X年30个企业的总产值数据。从某一年份看,它是由30个企业总产值数值组成的截面数据;从某一企

  文档可编辑

  文档可编辑

  业看,它是由10年企业总产值数据组成的一个时间序列数据。面板数据则由30个企业10年的数据组成,共有300个观测值。

  文档可编辑

篇十三:统计研究方面的问题

P>  数据分析中要注意的统计学问题数据分析是一门数学类的学科。数据分析中涉及的统计问题有很多。下面是百分网小编为大家带来的数据分析中要注意的统计学问题。欢迎阅读。

  一、均值的计算在处理数据时,经常会遇到对相同采样或相同实验条件下同一随机变量的多个不同取值进行统计处理的问题。此时,往往我们会不假思索地直接给出算术平均值和标准差。显然,这种做法是不严谨的。这是因为作为描述随机变量总体大小特征的统计量有算术平均值、几何平均值和中位数等多个。至于该采用哪种均值,不能根据主观意愿随意确定,而要根据随机变量的分布特征确定。反映随机变量总体大小特征的统计量是数学期望,而在随机变量的分布服从正态分布时,其数学期望就是其算术平均值。此时,可用算术平均值描述随机变量的大小特征;如果所研究的随机变量不服从正态分布,则算术平均值不能准确反映该变量的大小特征。在这种情况下,可通过假设检验来判断随机变量是否服从对数正态分布。如果服从对数正态分布,则几何平均值就是数学期望的值。此时,就可以计算变量的几何平均值;如果随机变量既不服从正态分布也不服从对数正态分布,则按现有的数理统计学知识,尚无合适的统计量描述该变量的大小特征。此时,可用中位数来描述变量的大小特征。因此,我们不能在处理数据的时候一律采用算术平均值,而是要视数据的分布情况而定。二、直线相关与回归分析这两种分析,说明的问题是不同的,既相互又联系。在做实际分析的时候,应先做变量的散点图,确认由线性趋势后再进行统计分析。一般先做相关分析,只有在相关分析有统计学意义的前提下,求回归方程才有实际意义。一般来讲,有这么两个问题值得注意:一定要把回归和相关的概念搞清楚,要做回归分析时,不需要报告相关系数;做相关分析的时候,不需要计算回归方程。相关分析中,只有对相关系数进行统计检验(如t检验),P&lt;0.05时,才能一依据r值的大小来说明两个变量的相关程度。必须注意的是,不能将相关系数的假设检验误认为是相关程度的大小。举个例子:当样本数量很小,即使r值较大(如3对数据,r=0.9),也可能得出p&gt;0.05这种无统计学意义的结论;而当样本量很大,如500,即使r=0.1,也会有P&lt;0.05的结果,但这种相关却不具有实际意义。因此,要表明相关性,除了要写出r值外,还应该注明假设检验的P值。三、相关分析和回归分析之间的区别相关分析和回归分析是极为常用的2种数理统计方法,在环境科学及其它研究领域有着广泛的用途。然而,由于这2种数理统计方法在计算方面存在很多相似之处,因此在应用中我们很容易将二者混淆。最常见的错误是,用回归分析的结果解释相关性问题。例如,将“回归直线(曲线)图”称为“相关性图”或“相关关系图”;将回归直线的R2(拟合度,或称“可决系数”)错误地称为“相关系数”或“相关系数的平方”;根据回归分析的结果宣称2个变量之间存在正的或负的相关关系。相关分析与回归分析均为研究2个或多个变量间关联性的方法,但2种方法存在本质的差别。相关分析的目的在于检验两个随机变量的共变趋势(即共同变化的程度),回归分析的目的则在于试图用自变量来预测因变量的值。实际上在相关分析中,两个变量必须都是随机变量,如果其中的一个变量不是随机变量,就不能进行相关分析。而回归分析中,因变量肯定为随机变量,而自变量则可以是普通变量(有确定的取值)也可以是随机变量。很显然,当自变量为普通变量的时候,这个时候你根本不可能回答相关性的问题;当两

  个变量均为随机变量的时候,鉴于两个随机变量客观上存在“相关性”问题,只是由于回归分析方法本身不能提供针对自变量和因变量之间相关关系的准确的检验手段,因此这又回到了问题二中所讲的,如果你要以预测为目的,就不要提相关系数;当你以探索两者的“共变趋势”为目的,就不要提回归方程。

  回归分析中的R2在数学上恰好是Pearson积矩相关系数r的平方。因此我们不能错误地理解R2的含义,认为R2就是“相关系数”或“相关系数的平方”。这是因为,对于自变量是普通变量的时候,2个变量之间的“相关性”概念根本不存在,又谈什么“相关系数”呢?

  四、相关分析中的问题相关分析中,我们很容易犯这么一个错误,那就是不考虑两个随机变量的分布,直接采用Pearson积矩相关系数描述这2个随机变量间的相关关系(此时描述的是线性相关关系)。关于相关系数,除有Pearson积矩相关系数外,还有Spearman秩相关系数和Kendall秩相关系数等。其中,Pearson积矩相关系数可用于描述2个随机变量的线性相关程度,Spearman或Kendall秩相关系数用来判断两个随机变量在二维和多维空间中是否具有某种共变趋势。因此我们必须注意的是,Pearson积矩相关系数的选择是由前提的,那就是2个随机变量均服从正态分布假设。如果数据不服从正态分布,则不能计算Pearson积矩相关系数,这个时候,我们就因该选择Spearman或Kendall秩相关系数。五、t检验用于比较均值的t检验可以分成三类:第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t检验,都必须在满足特定的前提条件下应用才是合理的。若是单组检验,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布。t检验是目前在科学研究中使用频率最高的一种假设检验方法。t检验方法简单,其结果便于解释。简单、熟悉加上外界的要求,促成了t检验的流行。但是,由于我们对该方法理解得不全面,导致在应用过程中出现不少问题,有些甚至是非常严重的错误,直接影响到结论的可靠性。常见错误:不考虑t检验的应用前提,对两组的比较一律用t检验;将各种实验设计类型一律视为多个单因素两水平设计,多次用t检验进行均值之间的两两比较。以上两种情况,均不同程度地增加了得出错误结论的风险。而且,在实验因素的个数大于等于2时,无法研究实验因素之间的交互作用的大小。正确做法:当两样本均值比较时,如不满足正态分布和方差齐性,应采用非参检验方法(如秩检验);两组以上的均值比较,不能采用t检验进行均值之间的两两比较。因此我们必须注意,在使用t检验的时候,一定要注意其前提以及研究目的,否则,会得出错误的结论。六、常用统计分析软件国际上已开发出的专门用于统计分析的商业软件很多,比较著名有SPSS(StatisticalPackageforSocialSciences)、SAS(StatisticalAnalysisSystem)、BMDP和STATISTICA等。其中,SPSS是专门为社会科学领域的研究者设计的(但是,此软件在自然科学领域也得到广泛应用);BMDP是专门为生物学和医学领域研究者编制的统计软件。

  当然,excel也能用于统计分析。单击“工具”菜单中的“数据分析”命令可以浏览已有的分析工具。如果在“工具”菜单上没有“数据分析”命令,应在“工具”菜单上运行“加载宏”命令,在“加载宏”对话框中选择“分析工具库”。

  特别推荐一款国产软件——DPS,其界面见附图。其功能较为强大,除了拥有统计分析功能,如参数分析,非参分析等以外,还专门针对一些专业编写了专业统计分析模块,随机前沿面模型、数据包络分析(DEA)、顾客满意指数模型(结构方程模型)、数学生态、生物测定、地理统计、遗传育种、生存分析、水文频率分析、量表分析、质量控制图、ROC曲线分析等内容。有些不是统计分析的功能,如模糊数学方法、灰色系统方法、各种类型的线性规划、非线性规划、层次分析法、BP神经网络、径向基函数(RBF)等,在DPS里面也可以找到。

Top