上一篇 下一篇 回到顶部 目录 返回首页
目录

高考数学从零开始:概率与统计,数据里能看出什么

发表于
更新于
22 33.6~43.2 分钟 15122

前言

概率与统计在高考中通常是一道中等难度的解答题,加上选择填空中的基础小题,总分值在 17-22 分左右。这个板块的特点是:概念多、公式多、应用性强

概率与统计可以分成三个部分来理解:统计(数据的收集与描述)、概率(随机事件的度量)、随机变量及其分布(用数学语言描述随机现象)。


第一部分:统计

1.1 抽样方法

抽样方法

适用场景

操作方法

简单随机抽样

总体较小、个体差异不大

抽签法、随机数表法

系统抽样

总体较大、个体差异不大

等距抽样(每隔 k 个抽一个)

分层抽样

总体有明显差异(如男女、年级)

按比例从各层中抽取

核心原则:每个个体被抽中的可能性相等。

1.2 用样本估计总体

数字特征

特征

计算公式

意义

平均数

$\bar{x} = \frac{1}{n}\sum_{i=1}^{n}x_i$

数据的中心位置

中位数

排序后中间的数

不受极端值影响

众数

出现次数最多的数

数据的"热点"

方差

$s^2 = \frac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^2$

数据的离散程度

标准差

$s = \sqrt{s^2}$

方差的算术平方根

方差越大,数据越分散(不稳定);方差越小,数据越集中(稳定)。

1.3 频率分布直方图

画图步骤

  1. 求极差(最大值 - 最小值)

  2. 决定组距和组数

  3. 分组,统计每组的频数和频率

  4. 画直方图

直方图的纵轴是 $\frac{\text{频率}}{\text{组距}}$,每个小矩形的面积 = 频率。

所有小矩形面积之和 = 1。

1.4 线性回归

散点图:将数据点 $(x_i, y_i)$ 画在坐标系中,观察是否近似呈直线分布。

回归直线方程:$\hat{y} = \hat{b}x + \hat{a}$

其中:
$$\hat{b} = \frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})}{\sum_{i=1}^{n}(x_i - \bar{x})^2} = \frac{\sum x_iy_i - n\bar{x}\bar{y}}{\sum x_i^2 - n\bar{x}^2}$$
$$\hat{a} = \bar{y} - \hat{b}\bar{x}$$

重要性质:回归直线一定过样本点的中心 $(\bar{x}, \bar{y})$。

1.5 独立性检验

$2 \times 2$ 列联表

$Y_1$

$Y_2$

合计

$X_1$

a

b

a+b

$X_2$

c

d

c+d

合计

a+c

b+d

n

$K^2$ 统计量
$$K^2 = \frac{n(ad - bc)^2}{(a+b)(c+d)(a+c)(b+d)}$$

$K^2$ 临界值

判断

$K^2 \geq 3.841$

有 95% 的把握认为两个变量有关

$K^2 \geq 6.635$

有 99% 的把握认为两个变量有关

$K^2 < 3.841$

没有充分证据表明两个变量有关


第二部分:概率

2.1 随机事件的关系与运算

关系

定义

符号

包含

事件 A 发生则事件 B 一定发生

$A \subseteq B$

并事件

事件 A 或事件 B 至少有一个发生

$A \cup B$

交事件

事件 A 和事件 B 同时发生

$A \cap B$

互斥

事件 A 和事件 B 不能同时发生

$A \cap B = \varnothing$

对立

事件 A 和事件 B 互斥,且必有一个发生

$A \cap B = \varnothing$,$A \cup B = \Omega$

互斥 vs 对立:对立是互斥的加强版。互斥的两个事件可以都不发生,对立的两个事件必有一个发生。

2.2 概率的基本性质

性质

公式

非负性

$0 \leq P(A) \leq 1$

必然事件

$P(\Omega) = 1$

不可能事件

$P(\varnothing) = 0$

对立事件

$P(\bar{A}) = 1 - P(A)$

互斥事件

$P(A \cup B) = P(A) + P(B)$

一般情况

$P(A \cup B) = P(A) + P(B) - P(A \cap B)$

2.3 古典概型

条件

  1. 试验的所有可能结果只有有限个

  2. 每个结果出现的可能性相等

公式:$P(A) = \frac{\text{事件 A 包含的基本事件数}}{\text{基本事件总数}}$

解题关键:正确计数。常用工具:列举法、树状图、排列组合。

2.4 几何概型

条件:试验结果有无限多个,且每个结果出现的可能性相等。

公式:$P(A) = \frac{\text{构成事件 A 的区域长度(面积/体积)}}{\text{试验全部结果构成的区域长度(面积/体积)}}$

常见模型

  • 时间问题:两人在约定时间内到达,求相遇概率

  • 面积问题:在区域内随机取点,落在某子区域的概率

  • 角度问题:在圆周上随机取点

2.5 条件概率与独立事件

条件概率:$P(B|A) = \frac{P(AB)}{P(A)}$($P(A) > 0$)

理解:在事件 A 已经发生的条件下,事件 B 发生的概率。

乘法公式:$P(AB) = P(A) \cdot P(B|A) = P(B) \cdot P(A|B)$

事件独立:如果 $P(AB) = P(A) \cdot P(B)$,则事件 A 与事件 B 相互独立。

独立的含义:事件 A 是否发生不影响事件 B 发生的概率。

推论:若 A 与 B 独立,则 A 与 $\bar{B}$、$\bar{A}$ 与 B、$\bar{A}$ 与 $\bar{B}$ 也独立。

2.6 全概率公式与贝叶斯公式

公式

表达式

全概率公式

$P(B) = \sum_{i=1}^{n} P(A_i)P(B

贝叶斯公式

$P(A_k

其中 $A_1, A_2, \dots, A_n$ 是样本空间的一个划分(两两互斥,且并集为全集)。

应用场景

  • 全概率公式:已知各种原因导致结果的概率,求结果发生的总概率

  • 贝叶斯公式:已知结果发生了,反推是某个原因导致的概率


第三部分:随机变量及其分布

3.1 离散型随机变量

分布列

X

$x_1$

$x_2$

$\dots$

$x_n$

P

$p_1$

$p_2$

$\dots$

$p_n$

性质

  • $p_i \geq 0$

  • $\sum_{i=1}^{n} p_i = 1$

期望(均值):$E(X) = \sum_{i=1}^{n} x_i p_i$

方差:$D(X) = \sum_{i=1}^{n}(x_i - E(X))^2 p_i = E(X^2) - [E(X)]^2$

3.2 常见离散型分布

分布

模型

分布列

期望

方差

两点分布

一次试验成功/失败

$P(X=1)=p$,$P(X=0)=1-p$

$p$

$p(1-p)$

二项分布 $B(n, p)$

n 次独立重复试验中成功的次数

$P(X=k) = C_n^k p^k (1-p)^{n-k}$

$np$

$np(1-p)$

超几何分布

不放回抽样中的成功次数

$P(X=k) = \frac{C_M^k C_{N-M}^{n-k}}{C_N^n}$

$\frac{nM}{N}$

泊松分布

单位时间内事件发生次数

$P(X=k) = \frac{\lambda^k}{k!}e^{-\lambda}$

$\lambda$

$\lambda$

二项分布 vs 超几何分布

  • 二项分布:有放回抽样(或独立重复试验),每次概率不变

  • 超几何分布:不放回抽样,概率会变化

  • 当总体很大时,超几何分布近似于二项分布

3.3 连续型随机变量 — 正态分布

正态分布 $X \sim N(\mu, \sigma^2)$:

概率密度函数:$f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$

图像特征

  • 关于 $x = \mu$ 对称的钟形曲线

  • $\mu$ 决定对称轴位置,$\sigma$ 决定曲线的"胖瘦"($\sigma$ 越小越瘦高)

3σ 原则

区间

概率

$(\mu - \sigma, \mu + \sigma)$

0.6826

$(\mu - 2\sigma, \mu + 2\sigma)$

0.9544

$(\mu - 3\sigma, \mu + 3\sigma)$

0.9974

标准化:如果 $X \sim N(\mu, \sigma^2)$,则 $Z = \frac{X - \mu}{\sigma} \sim N(0, 1)$(标准正态分布)。

3.4 期望与方差的性质

性质

公式

线性变换的期望

$E(aX + b) = aE(X) + b$

线性变换的方差

$D(aX + b) = a^2 D(X)$

和的期望

$E(X + Y) = E(X) + E(Y)$

独立时和的方差

$D(X + Y) = D(X) + D(Y)$(X 与 Y 独立)

方差的重要性质:常数项不影响方差,系数的平方影响方差。


第四部分:计数原理

4.1 分类加法与分步乘法

原理

核心

公式

分类加法

完成一件事有 n 类办法,各类互不重叠

$N = m_1 + m_2 + \dots + m_n$

分步乘法

完成一件事需要 n 个步骤,每步缺一不可

$N = m_1 \times m_2 \times \dots \times m_n$

判断标准:如果各种办法可以互相替代(任选一种都能完成),用加法;如果必须按顺序完成多个步骤,用乘法。

4.2 排列与组合

概念

公式

是否考虑顺序

排列 $A_n^m$

$\frac{n!}{(n-m)!}$

考虑顺序

组合 $C_n^m$

$\frac{n!}{m!(n-m)!}$

不考虑顺序

关系:$C_n^m = \frac{A_n^m}{m!}$,即组合数 = 排列数除以重复的次数。

4.3 组合数的性质

性质

公式

对称性

$C_n^m = C_n^{n-m}$

递推公式

$C_n^m = C_{n-1}^{m-1} + C_{n-1}^m$

二项式定理

$(a+b)^n = \sum_{k=0}^{n} C_n^k a^{n-k}b^k$

4.4 常见计数模型

模型

方法

例子

捆绑法

相邻元素先捆绑

3 个人必须站在一起

插空法

不相邻元素插空

3 个人不能相邻

隔板法

n 个相同元素分给 m 个人

10 个球放进 3 个盒子

间接法

总数 - 不符合条件的

至少/至多问题


第五部分:常见考点与解题策略

5.1 概率题的解题步骤

  1. 判断概率模型:古典概型?几何概型?二项分布?

  2. 确定随机变量:X 表示什么?可能取值有哪些?

  3. 求分布列:计算每个取值的概率

  4. 求期望和方差:代入公式计算

  5. 作答:根据题目要求给出结论

5.2 如何判断分布类型

场景

分布类型

n 次独立重复试验,每次成功概率 p

二项分布 $B(n, p)$

不放回抽样,总体 N 个,M 个成功品

超几何分布

单位时间内事件发生次数(稀有事件)

泊松分布

测量误差、身高、成绩等自然现象

正态分布

5.3 期望与方差的求解技巧

  • 如果 X 服从已知分布,直接套用期望方差公式

  • 如果 X 是多个随机变量的和,利用期望的线性性质

  • 利用 $D(X) = E(X^2) - [E(X)]^2$ 有时比定义法更简便


第六部分:易错点清单

易错点

正确做法

混淆互斥和独立

互斥 = 不能同时发生;独立 = 互不影响(两个概念完全不同)

排列组合搞混

看问题是否跟顺序有关:排座位跟顺序(排列),选人不跟顺序(组合)

二项分布概率公式漏掉组合数

$P(X=k) = C_n^k p^k (1-p)^{n-k}$,$C_n^k$ 不能丢

超几何分布分母写错

分母是 $C_N^n$(从 N 个中取 n 个),不是 $C_N^M$

方差公式记错

$D(aX+b) = a^2D(X)$,常数项 b 不影响方差

正态分布 3σ 区间记错

记住 $\mu \pm \sigma$ 是 68%,$\mu \pm 2\sigma$ 是 95%

条件概率分母搞错

$P(B

古典概型重复计数或遗漏

用树状图或列表确保不重不漏


小结

概率与统计的核心可以归纳为两个思想、三个分布、两类方法

  • 两个思想:用样本估计总体、用概率描述随机性

  • 三个常用分布:二项分布、超几何分布、正态分布(理解各自的应用场景)

  • 两类计数方法:分类加法与分步乘法、排列与组合

概率与统计是高考中最容易拿满分的板块之一,关键是要读懂题意、选对模型、计算准确。遇到实际应用题,先翻译成数学语言再求解。