一、统计学的基本数学思想
统计的基本数学思想:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,通过研究样本的情况来估计总体的相应情况. 所以样本的数据选取至关重要!所以样本必须具有代表性、广泛性和随机性. 二、抽样方法
目的:获取有代表性的样本
为了使所抽的样本具有代表性,有以下抽样方法: (1)简单随机抽样
定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本nN, 如果每次抽取时总体内的各个个体被抽到的机会都相等,称这种抽样方法为简 单随机抽样
特点:①被抽取样本的总体中个体有限 ②逐个不放回抽样
③每次抽取时,总体中各个个体被抽到的可能性相同 分类:①抽签法
定义:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中, 搅拌均匀后每次从中抽取一个号签,连续抽取n次,就得到一个容量为n 的样本 ②随机数法
定义:利用随机数表、随机数骰子或计算机产生的随机数进行抽样 优点:操作简单易行
缺点:只能在个体不多的情况下进行.如果总体中的个体数很多,抽签法编号的工作量 大;使用随机数表也不方便快捷;“搅拌均匀”也非常困难.最终使样本失去代 表性 (2)系统抽样
步骤:①采用随机的方式将总体中的个体编号.为简便起见,有时可直接利用个体所带 有的号码,如考生的准考证号、街道上各户的门牌号,等等
②确定分段的间隔k,对编号进行分段.当 kN(n是样本容量)是整数时,取 nNN;若(n是样本容量)不是整数,可以先从总体中剔除几个个体, nn 使得总体中剩余的个体数能被样本容量整除
③在第1段用简单随机抽样确定起始的个体编号llk
④按照事先确定的规则抽取样本(通常是将l加上间隔k,得到第2个编号 lk,再将(lk加上k,得到第3个编事情l2k,这样继续下去,直到 获取整个样本) 思考:为什么k(3)分层抽样
定义:一般地,在抽样时,将总体分成互不交叉的层,然后按一定比例,从各层独立 地抽取一定数量的个体,将各层抽取的个体合在一起作为样本,这种抽样方法 是一种分层抽样 步骤:①分层
②按比例确定每层抽取个体的个数 ③各层(方法可以不同) ④合成样本
例子:调查某高一学生的平均身高、某高中生的视力 三、样本估计总体(单一数据) 目的:对样本进行处理
样本处理的两种方式:(1)图表 (2)样本的数字特征
考题三种:(1)图表 (2)样本的数字特征 (3)图表样本的数字特征 (1)图表
类型:频率分布表、频率分布直方图、频率分布折线图、总体密度曲线、茎叶图 步骤:1.求极差
2.决定组距和组数:分组合适即可. 一般样本容量越大,分组越 多.组数 组
N?lk? n极差例:样本容量不超过100时,按照数据的多少,常分为5-12 组距
3.将数据分组 4.列频率分布表
5.频率分布直方图
由频率分布表来画频率分布直方图 注意:<1>纵坐标表示的是频率分组 频数累计 频数 频率 组距
<2>由<1>可知小长方形的面积=组距频率频率 组距 <3>在频率分布直方图中,各小长方形的面积的总和等于1 6.频率分布折线图
将频率分布直方图中各小长方形上端中点连接,就得到频率分布折线图 7.总体密度曲线
当总体中的个体较多时,抽取样本的的容量就增加,若作图时组数增加, 组距减少,相应的频率分布折线图越接近一条光滑曲线,即是总体密度曲线. 总体密度曲线是一个函数图像,所以,统计学和函数也有一定的关系 8.特例:茎叶图
优点:<1>能反映原始数据
<2>展示数据的分布情况:众数、中位数、平均数 (2) 样本数字特征(众数、中位数、平均数、标准差、方差) 设样本数据为x1,x2......,xn,x 则 标准差公式:s 方差s22221x1xx2x.......xnx n221x1xx2x......xnxn
2 思维:有标准差的公式我们可知:标准差反映数据的分散程度(解释:有标准差可
知s0,故当s取最小值0时,数据不分散,即:x1x2x3........xn) (3)由图表求样本的数字特征
①由频数分布直方图求样本的数字特征 众数:最高矩形的中点
中位数:中位数左右直方图的面积相等
平均数:频数分布直方图每个小矩形的面积乘以小矩形底边中点的横坐标之和(此 处与后面的期望一致,两者有一定的关系,稍后在学)
标准差、方差:略,此处不研究! 故现阶段求方差、标准差只能利用原始数据 ②由总体密度曲线求样本的数字特征:略,此处不研究 思路:由频数分布直方图还原原始数据后再求标准差、方差 四、样本预测未来(变量之间的关系)
变量之间的关系核心思路:通过研究两变量之间的关系来预测未来 (1)图表
散点图:既然是研究变量之间的关系,图像是最好的选择!所以说建立直角坐标系, 将相应的对应关系描在坐标系中,即可得到散点图(类似函数描点) 回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,则就说这两条 直线具有线性关系,这条直线叫做回归直线 变量间的线性关系:正相关、负相关 回归直线的方程求法:设为ykxb
nnxixyiyxiyinxyi1i1knn22 2 xxxnxiii1i1bykx 回归直线的特点是:必过x,y,这是考查点! 预测未来:将xx0代入回归直线的方程ykxb即可求出y0
第三章 概率
一、基本概念
(1)必然事件:在条件S下,一定会发生的事件,叫相对于条件S的必然事件
(2)不可能事件:在条件S下,一定不会发生的事件,叫相对于条件S的不可能事件 (3)确定事件:必然事件和不可能事件统称为相对于条件S的确定事件
(4)随机事件:在条件S下可能发生也可能不发生的事件,叫相对于条件S的随机事件 (5)频数与频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试 验中事件A出现的次数nA为事件A出现的频数;称事件A出现的比例fnAnA为 n 事件A出现的频率:对于给定的随机事件A,如果随着试验次数的增加,事件A发生 的频率fnA稳定在某个常数上,把这个常数记作P(A),称为事件A的概率 (6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数nA与试验总次数n 的比值
nA,它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断 n 增多,这种摆动幅度越来越小。我们把这个常数叫做随机事件的概率,概率从数量上 反映了随机事件发生的可能性的大小.频率在大量重复试验的前提下可以近似地作为 这个事件的概率.(求概率的两种方法!高考选择题的命题点!)
二、概率的基本性质
基本概念:(1)事件的包含、并事件、交事件、相等事件
(2)若A∩B为不可能事件,即A∩B=ф,那么称事件A与事件B互斥; (3)若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互 为对立事件
(4)当事件A与B互斥时,满足加法公式:P(A∪B)=P(A)+P(B);若事件 A与B为对立事件,则A∪B为必然事件,所以P(A∪B)=P(A)+P(B)=1, 于是有P(A)=1—P(B)
基本性质:(1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1 (2)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B (3) 事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)=P(A)+P(B) =1,于是有P(A)=1—P(B)
(4)互斥事件与对立事件的区别与联系,互斥事件是指事件A与事件B在 一次试验中不会同时发生,其具体包括三种不同的情形:(1)事件A 发生且事件B不发生;(2)事件A不发生且事件B发生;(3)事件 A与事件B同时不发生,而对立事件是指事件A与事件B有且仅有一 个发生,其包括两种情形;(1)事件A发生B不发生;(2)事件B 发生事件A不发生 三、古典概型
(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性
(2)古典概型的解题步骤 ①求出总的基本事件数
②求出事件A所包含的基本事件数,然后利用公式PA四、几何概型
(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积) 成比例,则称这样的概率模型为几何概率模型 (2)几何概型的概率公式 PAA包含的基本事件数
总的基本事件个数构成事件A的区域长度(面积或体积)
试验的全部结果所构成的区域长度(面积或体积)(3)几何概型的特点:①试验中所有可能出现的结果(基本事件)有无限多个 ②每个基本事件出现的可能性相等
课本例题解析:
例1、(课本探究,P119)再投筛子试验中,可以定义许多事件,例如: 目的:理解事件之间的关系,并能进行概率运算
C1出现1点;C2出现2点;C3出现3点;C4出现4点 C5出现5点;C6出现6点
D1出现点数不大于1D2出现点数大于3;D3出现点数小于5;
E出现点数小于7;F出现点数大于6
;H出现点数为奇数 G出现点数为偶数解析:事件的包含:C1H、D1D3、D3E等等 相等事件:C1D1
并事件:当C1∩C2=Φ,且当D2发生,则事件C1或C2发生,即是: D2C1∪C2(C1C2)
交事件:D3∩E=C4、D2∩E=C4+C5+C6
互斥事件:C1与C2、D1与D2等等. 则PC1C2PC1PC2 对立事件:G与H,对立事件必定是互斥事件!满足概率的加法公式! 例2、(课本古典概率模型的概念,P124) 目的:理解古典概率?
(1)试验中所有可能出现的基本事件只有有限个 (2)每个基本事件出现的可能性相等
我们将具有这两个特点的概率模型称为古典概率模型
解析:(1)假设试验中所有可能出现的基本事件有无限个,则是几何概率模型 (2)例:扔一枚硬币,出现正面朝上的概率?若扔一枚图钉,顶尖朝上的概率 呢?
扔一枚硬币,会出现两种情况:一正、一负,故总的基本事件个数为2. 其中正面朝上的基本事件个数为1,且两种情况出现的可能性相等,所以
P正P负1 2若扔一枚图钉,会出现两种情况:顶尖朝上、顶尖朝下,故总的基本事件个数为2. 其中顶尖朝上的基本事件个数为1,但两种情况出现的可能性不相等,所以P正P负1 2例、3 (课本几何概率模型概念,P136)
目的:研究古典概率与几何概率之间的内在联系
解析:(1)几何概率模型出现的基本事件是无限多个,这是和古典概率模型的地方 (2)既然几何概率是无限多种情况,我们方法是:建立直角坐标系,将所有情 况以坐标点的形式描在平面直角坐标系中,由于点动成面,所以这个面的 面积就代表了“总的基本事件个数”,其中满足事件A的所有坐标点构成 的面的面积代表“事件A包含的基本事件数”,故:
PAA包含的基本事件数构成事件A的区域长度(面积或体积)总的基本事件个数试验的全部结果所构成的区域长度(面积或体积) (3)综合上述:古典概率和几何概率是一种思维过程!
例4、 (课本例题,P如图3.3-3的正方形中内接一个圆,随机往正方形中撒一把豆子, 139)
用用随机模拟的方法估计圆周率的值
目的:概率的两种求法:(1)统计学 (2)概率学 解析:(1)统计学:收集(样本)、处理数据(样本).
数据:设随机撒一把豆子N粒,其中落在圆内的豆子数为n粒. 类似于 每次扔一个豆子,独立重复N次,其中有n次扔在圆内,这是独 立重复事件,得到数据:n个圆内、Nn个圆外 处理数据:设事件A为落在圆内,故PAn落在圆内的豆子数=
落在正方形中的豆子数Nn N 得出结论:在一次试验中,落在圆内的概率为 (2)概率学:几何概率
设圆的半径为r,事件A为豆子落在圆内,则一次试验中落在圆内的概率:
构成事件A的区域长度(面积或体积)r2 PA 试验的全部结果所构成的区域长度(面积或体积)2r2 (3)统计学与概率学的关系:
圆的面积落在圆中豆子数nr2 则可得:即:. 2正方形的面积落在正方形中的豆子数N2r 故4n N 思考:(2016全国卷3,10)从区间0,1内随机抽取2n个数x1,x2,x3....xn, y1,y2,y3....yn,构成n个数对x1,y1、x2,y2、x3,y3....xn,yn,其中 两数的平方和小于1的数对共有m个,则采用随机模拟的方法得到的圆周率 的近似值为
( ) A.
4n2n4m2m B. C. D. mmnn
因篇幅问题不能全部显示,请点此查看更多更全内容