智能OPPO手机价格联盟

常用决策分析方法(基本方法)

医研云2021-01-12 14:30:29


 

上一节我们说了决策分析的基本概念,这一节我们谈谈决策分析常用的三种方法:决策树法、Bayes方法、Markov方法。


决策树法


决策树法(decision tree-based method):是通过确定一系列的条件(if-then)逻辑关系,形成一套分层规则,将所有可能发生的结局的概率分布用树形图来表达,生成决策树(decision tree),从而达到对研究对象进行精确预测或正确分类的目的。




树的扩展是基于多维的指标函数,在医学领域主要用于辅助临床诊断及卫生资源配置等方面。


决策树分类:

  • 按功能分:分类树和和回归树

  • 按决策变量个数:单变量树和多变量树

  • 按划分后得到分类项树:二项分类树和多项分类树


决策树的3类基本节点:

  1. 决策节点(用□表示)

  2. 机会节点(用○表示)

  3. 结局节点(用◁表示)


从决策节点引出一些射线,表示不同的备选方案,射线上方标出决策方案名称。射线引导到下一步的决策节点、机会节点或结局节点。从机会节点引出的线表示该节点可能出现的随机事件,事件名称标在射线上方,先验概率在下方。每个结局节点代表一种可能的结局状态。在结局节点的右侧标出各种状态的效用(utility),即决策者对于可能发生的各种结局的(利益或损失)感觉和反应,用量化值表示。

 

绘制决策树基本规则:

  1. 各支路不能有交点

  2. 每一种方案各种状态发生概率之和为1

 

决策树分析法步骤:

1 提出决策问题,明确决策目标

2 建立决策树模型--决策树生长

2.1决策指标的选择的两个步骤:

2.1.1 提出所有分值规则

2.1.2 选择最佳规则

2.2 估计每个指标的先验概率

3 确定各终点及计算综合指标

3.1 各终点分配类别

3.2 各终点期望效用值得确定

3.3 综合指标的计算

3.4 计算值排序选优

 

树生长停止情况:

  1. 子节点内只有一个个体

  2. 子节点内所有观察对象决策变量的分布完全一致,不能再分

  3. 达到规定标准

 

一棵树按可能长到最大,通常是过度拟合(overfit)的。

训练集:用于决策树模型建立的数据集

测试集:决策树进行测评的数据集。

过度拟合的树需要剪枝,即去掉噪声(拟合中的误差)。剪枝需要兼顾复杂度(节点数目)和预测精度(决策损失)。

决策损失(decision lose):指随机抽取的某一个个体,在树的某决策节点被错误分类所引起的效用损失。

 

建立决策树的目的在于获得最高精度的分类或预测值,以期为决策提供依据。可按照这几个特性对其评估:准确、简洁、易行、易理解和能发掘复杂数据内在关系。

 

Bayes方法


在实际决策过程中,决策者通常是将状态变量当作随机变量,状态变量发生的可能性用先验概率(prior probability)表示,以期望值准则(expectation rule)作为选择最优方案的标准。

但是先验概率来源于历史资料和主观判断,有一定偏差。为了提高质量,就需要进行实验、抽样等工作计算出当前条件下的概率,这就是后验概率(posterior probability)。后验概率是对先验概率的修正。

根据自然状态的先验概率和条件概率,利用样本信息求得后验概率并进行决策的方法就称为贝叶斯决策(Bayesian decision)。

 

基本步骤:

  1. 先验分析

  2. 后验分析

  3. 决策分析

 

Markov方法


马尔科夫模型(Markov model):是利用某一变量的现在状态和动向来预测该变量未来的状态及动向,以辅助决策的一种分析方法。

马尔科夫模型与其他模型的主要区别是:它不需要从复杂的预测因子中寻找各因素之间的相互规律,而只需要考虑事件本身的历史状况及演变特点,通过计算状态转移概率预测自身状态的变化。

马尔可夫链为状态空间中从一个状态到另一个状态转换的随机过程。该过程要求具备“无记忆”的性质:即已知现在状态,将来状态与过去状态相互独立。这种特定类型的“无记忆性”称作马尔可夫性质。在马尔可夫链的每一步,系统根据条件概率保持现有状态或转为其他状态。状态的改变叫做转移,状态改变概率称为转移概率。


马尔科夫模型优于决策树发的特点主要有两个方面:

  1. 允许状态之间的相互转移,及模型中的双向箭头,而决策树只能是单向射线。

  2. 模型中加入了时间效应,可以进行贴现,更接近现实。




马尔科夫模型当前应用非常火热,什么机器学习,人工智能等等几乎都是必须提到,google的网页排序计算就是依据这个模型计算的。但是模型还是有点复杂,大家知道就可以了。