马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?注册
x
本帖最后由 ffxxff770603 于 2015-1-22 08:59 编辑
医学统计学绪论
医 学 统 计 学(MedicalStatistics) Statistics:“a sciencedealing with the collection, **ysis,interpretation and presentation ofmasses of numerical data” ----------Webster 辞典 统计学是收集、分析、解释与呈现数据资料的一门科学。统计学是收集和分析数据的科学与艺术。( a science and art) ----------------《不列颠百科全书》 统计学是数学的一个分支,它是一门用有效的方法收集和分析带有随机影响的数据的学科,且其目的是解决特定的问题。 -----------**孺院士 统计学是研究如何有效地收集、整理和分析受随机影响的数据,并对所考虑的问题作出推断或预测,直至为采取决策和行动提供依据和建议的一门学科。 ----------茆诗松 ★医学统计学(medical statistics):临床医学、基础医学、公共卫生学和医疗卫生服务研究中的一门基础学科,是关于收集数据、分析数据和由数据得出结论的一组概念、原则和方法。 ★统计学的重要作用在于能够透过偶然现象来探测其规律性,使研究结论具有科学性。 第一节医学统计学的作用 案例一、1962年美国医学学会杂志(JAMA)曾发表了一篇关于胃溃疡治疗新技术的报告,该报告根据动物实验和24名患者的临床试验结果得出结论,即将冷冻液导入胃中使胃冷却可以缓解溃疡症状,之后这一研究成果在临床中被广泛应用。后证实这种方法无效甚至有害。
案例二、20世纪80年代早期,两项观察性研究结果提示孕妇在怀孕期间补充维生素可以低新生儿神经管缺陷(NTD)的风险,但一直无法证实。该项研究使用统计学方法确定了服用叶酸组与对照组的差别不是简单偶然出现的,而是归因于叶酸的作用。 问题: 1. 胃溃疡治疗新技术的研究结论为什么会出现错误? 2. 为了证明服用叶酸的作用,应如何进行分组? 3. 如何准确地估计两组出现神经管缺陷的发病率? 4. 如何比较两组NTD的发病率是否有差别? 这些问题的解决,都需要运用统计学设计原则和统计分析方法。 第二医学统计学的基本内容 统计学的基本内容包括统计设计、数据整理、统计描述、统计推断 。
统计设计根据研究目的,制定总体研究方案,主要包括实验分组或抽样方法、样本含量估计、数据管理与质量控制、拟使用的统计分析方法等。统计设计是对实验全过程总的设想和安排,能够提高研究效率,并使结果更加准确和可靠。
Fisher 在他的著作中多次强调,统计学家与科学研究者的合作应该在实验设计阶段,而不是在需要数据处理的时候。 试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。统计学家或许只能告诉你试验失败的原因。 数据整理主要是指对数据进行分组、对数据质量进行的检查,考虑数据分布及变量转换,检查异常值和数据是否符合特定的统计分析方法要求等。 统计描述描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。统计描述结果的表达方式主要是统计指标、统计表和统计图。
统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。参数估计的重要性在于可以给出区间估计;假设检验重点则是比较参数的大小。
第三节医学统计学的基本概念 一、同质与变异 同质(homogeneity):指根据研究目的所确定的观察单位其性质应大致相同。
观察单位(observed unit):研究对象的基本单元,可以是一个人、一个地点、一只动物、一份生物样品等。
变异(variation):性质相同的事物,如果观察同一指标,各观察单位之间由于存在个体差异,也会使测量结果不同。二、变量与数据类型 变量(variable):反应实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据(data)。 定量数据(quantitativedata ):也称计量资料。变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。 定性数据(qualitativedata ):也称计数资料。变量的观测值是定性的,表现为互不相容的类别或属性。 有序数据(ordinaldata ):也称半定量数据或等级资料。变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。 复杂的定量资料可以转化为简单的定性、等级资料,但反之不行。对于一份数据而言可能同时包含这三种资料,辨别资料的不同类型的原因就在于,根据资料而选用的不同统计方法。 三、总体和样本
总体( population ):根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。
样本(sample):从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。
参数(parameter):描述总体分布特征的统计指标,称参数(parameter), 常用希腊字母μ﹑σ表示。
统计量 根据样本观察值计算出的统计指标,称统计量(statistic),常用拉丁字母
表示。
参数是事物固有的,在一定条件下不变;统计量却因样本的不同而不同,但统计量的分布是有规律的。
四、误差
系统误差(systematicerror): 误差的大小通常恒定或按照一定规律变化,具有明确的方向性。
随机测量误差(randommeasurement error ) : 各种偶然因素造成误差,误差没有固定的大小和方向,但具有一定的统计规律(如服从正态分布)。
抽样误差(samplingerror): 由于抽样而引起的样本统计量与总体参数间的差异,在统计学上称为抽样误差。
五、概率
概率(probability):描述某事件发生可能性大小的度量。事件A发生的概率可以写成 P (A) ,其取值范围为0≤P (A)≤1
医学上常用的是统计概率:P=f/N
0≤ P (A) ≤1
必然事件,概率为 1;不可能事件,概率为 0 。
小概率事件:发生概率P≤0.05的随机事件,表明在一次抽样研究中不大可能发生或发生的可能性很小。小概率原理是统计推断的基础。常把P≤0.05作为事物差别有统计学意义。P≤0.01 作为事物差别有高度统计学意义的界限。
|