二元决策是指在两个可能的选择之间做出选择的决策过程,通常用“是/否”、“成功/失败”、“通过/拒绝”等二元值来表示。这种决策模式常用于统计学、机器学习、经济学、工程学等领域,尤其是在分类问题、信号检测、风险分析和逻辑控制中。
✍️提及
MATLAB生物细胞瞬态滞后随机建模定量分析
一、二元决策的基本概念
在二元决策中,通常将两个可能的决策结果分别用二元数 0 和 1 表示:
- 1 表示“正例”或“是”的决策结果(如检测为某病、审批通过)。
- 0 表示“负例”或“否”的决策结果(如检测为无病、审批拒绝)。
此外,二元决策系统通常通过对输入变量的分析来判断事件的属性,如信号是否存在、用户是否违约等。在机器学习中,二元决策即是二分类问题,比如是否诈骗、是否违约等分类任务。
二、二元决策的评估指标
在二元决策中,为了评估决策的准确性和有效性,常用以下统计指标:
- 混淆矩阵(Confusion Matrix)
- 真阳性(TP):预测为1且实际为1的数量。
- 假阳性(FP):预测为1但实际为0的数量。
- 真阴性(TN):预测为0且实际为0的数量。
- 假阴性(FN):预测为0但实际为1的数量。
- 准确率(Accuracy)
- 表示决策正确的比例:
$\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN}$
- 精确率(Precision)
- 表示预测为正例的样本中实际为正例的比例:
$\text{Precision} = \frac{TP}{TP + FP}$
- 召回率(Recall)
- 表示所有实际为正例的样本中被正确预测为正例的比例:
$\text{Recall} = \frac{TP}{TP + FN}$
- F1分数(F1 Score)
- 精确率和召回率的调和平均值,是综合指标:
$\text{F1 Score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$
三、二元决策的模型
- 逻辑回归(Logistic Regression)
- 基于逻辑函数的回归模型,输入变量与事件发生的概率关联,适用于概率估计和二元分类。
- 决策树(Decision Tree)
- 使用树结构将数据划分,直到每个节点仅包含单一类别。决策树简单且可解释性好,但易于过拟合。
- 支持向量机(SVM)
- 用于寻找最优决策边界,使两类样本的间隔最大化,适用于高维数据的二分类。
- 贝叶斯分类器(Naive Bayes Classifier)
- 依赖于贝叶斯定理,假设特征条件独立,用于快速构建简单且高效的二元分类模型。