Skip to content

2. 贝叶斯决策论

贝叶斯决策论为模式识别提供了理论基础,通过概率方法来进行最优决策。

贝叶斯决策理论基础

贝叶斯定理

对于模式识别问题,我们有:

其中:

  • :后验概率
  • :类条件概率密度函数(似然函数)
  • :先验概率
  • :证据因子

贝叶斯决策规则

最小错误率决策:选择具有最大后验概率的类别

最小风险决策:当不同错误的代价不同时

其中风险函数为:

多元正态分布的判别函数推导

多元正态分布是模式识别中最重要的概率分布之一。对于 维特征向量 ,多元正态分布的概率密度函数为:

为了简化计算,我们通常使用判别函数 ,其中:

情况一:协方差矩阵为对角阵(独立同分布)

当各特征相互独立且方差可能不同时,协方差矩阵为对角阵:

推导过程

第一步:计算行列式和逆矩阵

第二步:计算二次型

第三步:得到判别函数

特点

  • 决策边界为超椭球面
  • 各特征维度独立处理
  • 计算复杂度较低

情况二:所有类的协方差矩阵相同

当所有类别具有相同的协方差矩阵时,即 ,这是线性判别分析(LDA)的基础假设。

推导过程

第一步:展开判别函数

第二步:展开二次型

第三步:消除公共项 由于 对所有类别都相同,在比较不同类别时可以忽略。

第四步:得到线性判别函数

这可以写成线性形式:

其中:

  • (权重向量)
  • (偏置项)

决策边界

两类 之间的决策边界由 确定:

特点

  • 决策边界为超平面(线性边界)
  • 这是**线性判别分析(LDA)**的理论基础
  • 计算效率高,广泛应用于实际问题

情况三:协方差矩阵任意(一般情况)

这是最一般的情况,每个类别都有自己独特的协方差矩阵 ,对应二次判别分析(QDA)

推导过程

完整的判别函数

第一步:展开二次型

第二步:整理得到二次判别函数

其中:

第三步:二次型的标准形式 判别函数可以写成:

其中:

  • (二次项系数矩阵)
  • (线性项系数向量)
  • 如上所定义(常数项)

决策边界

两类之间的决策边界由 确定,这是一个二次方程

特点

  • 决策边界为二次曲面(椭圆、抛物线、双曲线等)
  • 这是二次判别分析(QDA)的理论基础
  • 能够处理更复杂的分类问题,但计算复杂度较高
  • 需要更多的训练样本来准确估计协方差矩阵

三种情况的比较

情况协方差矩阵假设判别函数形式决策边界参数数量适用场景
情况一对角阵(独立)加权欧氏距离超椭球面特征独立,方差不同
情况二所有类相同线性函数超平面经典LDA,效率高
情况三任意矩阵二次函数二次曲面复杂分布,QDA

其中 是类别数, 是特征维数。

模式识别课程学习笔记