贝叶斯推理的案例
展开全部 参加常规x光透视检查的40岁妇女中,患乳腺癌的概率是1%。
如果一个妇女患了乳腺癌,她的胸透片呈阳性的概率是80%。
如果一个妇女她没有患乳腺癌,她的胸透片呈阳性的概率是9.6%。
现有一个该年龄段的妇女她的胸透片呈阳性,那么她实际患乳腺癌的概率有多少?如果把患乳腺癌和不患乳腺癌作为两个互斥事件H和一H,他们的概率分别为P(H)和P(一H);把胸透片呈阳性作为在H和一H中都能观察到某一共同特征D,它在两个事件中出现的概率分别为P(D/H)和P(D/-H);那么,当D出现时,根据以上概率信息就可以计算出事件H发生的概率P(H/D)。
一般将P(H)和P(一H)称为基础概率(base rate),将P(D/H)称为击中率(hit rate),将P(D/-H)称为误报率(false-alarm rate),将P(H/D)称为后验概率,其计算方法为:P(H/D)=P(H)P(D/H)/[(P(H)P(D/H)+P(D/-H)P(-H)]这就是贝叶斯公式,利用贝叶斯公式进行推断的过程则称之为贝叶斯推理。
根据公式,P(H/D)=(1%*80%)/(1%*80%+99%*9.6%)=0.078。
也就是说,阳性的检查结果表明该妇女有7.8%的可能性患病。
但是Eddy用该问题让内科医生判断,结果95%的答案介于70%~80%,远高于7.8%。
尽管贝叶斯公式只是一些简单的乘法、加法以及除法过程的结合,一个并没有学过该公式的人也有可能在推断中不自觉的应用这种方法,但是在包括上述乳腺癌问题在内的许多研究均发现,人们常常会犯类似的推理错误,称之为基础概率忽略(base-rate neglect)现象.Kahneman等(1982)提出启发—偏差理论(heuristics and biases approach)来解释这一现象,并由此引发了关于贝叶斯推理问题的大量研究和争论国内外关于贝叶斯推理问题的研究方法主要是实验法,将不同类型贝叶斯问题呈现给被试并要求他们解答,采用一定的指标对被试的解题过程和结果进行评价,据此来考察贝叶斯推理的认知过程和影响因素。
本文以贝叶斯推理的影响因素为线索回顾了以往的研究,并对其中的一些问题进行了初步的分析和探讨。
某地区居民的肝癌发病率为0.0004,现用甲胎蛋白法进行普查。
医学研究表明,化验结果是存有错误的。
已知患有肝癌的人其化验结果99%呈阳性(有病),而没患肝癌的人其化验结果99.9%呈阴性(无病)。
试问:在化验结果呈阳性的人中可能有多少人患有肝癌?如果我们用A表示样本的观察证据“化验结果呈阳性”,用H表示假说命题“被检查者患有肝癌”,那么由上面可知:P(H)(即某地区居民的肝癌发病率)=0.0004P('H)(即某地区居民没患肝癌的比率)=1-0.0004=0.9996P(E/H)(即患有肝癌者其化验结果呈阳性的比率)=0.99P(E/'H)(即没患肝癌者其化验结果呈阳性的比率)=1-0.999=0.001现在需要我们推断的是P(H/E),即在化验结果呈阳性的条件下,假说“被检查者患有肝癌”的比率。
显然,根据重新解释过的贝叶斯定理,我们可以很容易地得出P(H/E)的值。
P(H/E)=0.0004*0.99/((0.0004*0.99)+(0.9996*0.001))=0.284这表明,在化验结果呈阳性的人中,真患肝癌的人不到30%。
这个结果可能会使人吃惊,但仔细分析一下就可以理解了。
因为肝癌发病率很低,在10000个人中约有4人患肝癌,而9996个人不患肝癌。
对10000个人用甲胎蛋白法进行检查,按其错检的概率可知,9996个不患肝癌者中约有9996*0.001≌9.994个呈阳性,另外4个真患肝癌者的检查报告中约有4*0.99≌3.96个呈阳性。
仅从13.954(9.994+3.96)个呈阳性者中看,真患肝癌的3.96个人约占28.4%。
从上例可以看出,贝叶斯推理实际是借助于新的信息修正先验概率的推理方法。
显然,这样的方法如果运用得当,可以使我们在依据概率作出决断时,不必一次收集一个长期过程的大量资料,而可以根据事物发展的情况,不断利用新的信息来修正前面的概率,作出正确决策。
下面的例子很好地说明了这一点。
有甲、乙、丙三家工厂生产同一种零件,市场占有率分别为10%、25%和65%。
已知甲、乙、丙三家工厂生产零件的不合格率分别是30%、20%和10%。
现从市场上某批零件中随机抽取一件,经检验该零件不合格,则这个零件由甲厂、乙厂、丙厂生产的可能性各是多少?在没有抽取零件之前,我们知道,来自甲厂的产品其可能性是10%,来自乙厂的可能性是25%,来自丙厂的可能性是65%,这些就是先验概率。
相比来说,丙厂生产产品的概率最高。
现在我们在市场上随机抽出的是不合格品,这是一个新的信息,可以利用这个信息修正先验概率。
如果我们用E表示“抽出的零件是不合格品”,用H1、H2和H3分别表示假说命题“这个零件是由甲厂生产的”、“这个零件是由乙厂生产的”、“这个零件是由丙厂生产的”,那么由上面可知:P(H1)=0.1 P(H2)=0.25 P(H3)=0.65P(E/H1)=0.3 P(E/H2)=0.2 P(E/H3)=0.1根据贝叶斯推理我们可以很容易地得出P(H /E)、P(H )和P(H/E)。
其中P(H1/E)=0.1*0.3/((0.1*0.3)+(0.25*0.2)+(0.65*0.1))=0.207P(H2/E)=0.25*0.2/((0.1*0.3)+(0.25*0.2)+(0.65*0.1))=0.345P(H3/E)=0.65*0.1/((0.1*0.3)+(0.25*0.2)+(0.65*0.1))=0.448显然,根据上面的结果,我们判断该零件是丙厂生产的可能性已从65%下降到44.8%,而该零件是乙厂生产的可能性已从...
贝叶斯推理,概率,怎样得出41%的?
贝叶斯理论,是英国数学家贝叶斯(1701年—1761年) Thomas Bayes发明创造的一系列概率论理论,并广泛应用于数学、工程等领域。
在数学领域,贝叶斯分类算法应用于统计分析、测绘学,贝叶斯公式应用于概率空间,贝叶斯估计应用于参数估计,贝叶斯区间估计应用于数学中的区间估计,贝叶斯风险、贝叶斯统计、贝叶斯序贯决策函数、经验贝叶斯方法应用于统计决策论。
在工程领域,贝叶斯定理应用于人工智能、心理学、遗传学,贝叶斯分类器应用于模式识别、人工智能,贝叶斯分析应用于计算机科学,贝叶斯决策、贝叶斯逻辑、人工智能应用于人工智能,贝叶斯推理应用于数量地理学、人工智能,贝叶斯学习应用于模式识别。
在其他领域,贝叶斯主义应用于自然辩证法,有信息的贝叶斯决策方法应用于生态系统生态学。
贝叶斯定理的定理定义
贝叶斯定理定义如下:1)该定理也称贝叶斯推理,早在18世纪,英国学者贝叶斯(1702~1763)曾提出计算条件概率的公式用来解决如下一类问题:假设H[1],H[2]…,H[n]互斥且构成一个完全事件,已知它们的概率P(H[i]),i=1,2,…,n,现观察到某事件A与H[,1],H[,2]…,H[,n]相伴随机出现,且已知条件概率P(A/H[,i]),求P(H[,i]/A)。
贝叶斯公式(发表于1763年)为: P(H[i]/A)=P(H[i])*P(A│H[i])/{P(H[1])*P(A│H[1]) +P(H[2])*P(A│H[2])+…+P(H[n])*P(A│H[n])}2)意义贝叶斯推理的问题是条件概率推理问题,这一领域的探讨对揭示人们对概率信息的认知加工过程与规律、指导人们进行有效的学习和判断决策都具有十分重要的理论意义和实践意义。
3)应用:贝叶斯定理可用于投资决策分析,具体步骤如下:1 列出在已知项目B条件下项目A的发生概率,即将P(A│B)转换为 P(B│A);2 绘制树型图;3 求各状态结点的期望收益值,并将结果填入树型图;4 根据对树型图的分析,进行投资项目决策。
贝叶斯网络的特性
1、贝叶斯网络本身是一种不定性因果关联模型。
贝叶斯网络与其他决策模型不同,它本身是将多元知识图解可视化的一种概率知识表达与推理模型,更为贴切地蕴含了网络节点变量之间的因果关系及条件相关关系。
2、贝叶斯网络具有强大的不确定性问题处理能力。
贝叶斯网络用条件概率表达各个信息要素之间的相关关系,能在有限的、不完整的、不确定的信息条件下进行学习和推理。
3、贝叶斯网络能有效地进行多源信息表达与融合。
贝叶斯网络可将故障诊断与维修决策相关的各种信息纳入网络结构中,按节点的方式统一进行处理,能有效地按信息的相关关系进行融合。
对于贝叶斯网络推理研究中提出了多种近似推理算法,主要分为两大类:基于仿真方法和基于搜索的方法。
在故障诊断领域里就我们水电仿真而言,往往故障概率很小,所以一般采用搜索推理算法较适合。
就一个实例而言,首先要分析使用哪种算法模型:a.)如果该实例节点信度网络是简单的有向图结构,它的节点数目少的情况下,采用贝叶斯网络的精确推理,它包含多树传播算法,团树传播算法,图约减算法,针对实例事件进行选择恰当的算法;b.)如果是该实例所画出节点图形结构复杂且节点数目多,我们可采用近似推理算法去研究,具体实施起来最好能把复杂庞大的网络进行化简,然后在与精确推理相结合来考虑。
在日常生活中,人们往往进行常识推理,而这种推理通常是不准确的。
例如,你看见一个头发潮湿的人走进来,你认为外面下雨了,那你也许错了;如果你在公园里看到一男一女带着一个小孩,你认为他们是一家人,你可能也犯了错误。
在工程中,我们也同样需要进行科学合理的推理。
但是,工程实际中的问题一般都比较复杂,而且存在着许多不确定性因素。
这就给准确推理带来了很大的困难。
很早以前,不确定性推理就是人工智能的一个重要研究领域。
尽管许多人工智能领域的研究人员引入其它非概率原理,但是他们也认为在常识推理的基础上构建和使用概率方法也是可能的。
为了提高推理的准确性,人们引入了概率理论。
最早由Judea Pearl于1988年提出的贝叶斯网络(Bayesian Network)实质上就是一种基于概率的不确定性推理网络。
它是用来表示变量集合连接概率的图形模型,提供了一种表示因果信息的方法。
当时主要用于处理人工智能中的不确定性信息。
随后它逐步成为了处理不确定性信息技术的主流,并且在计算机智能科学、工业控制、医疗诊断等领域的许多智能化系统中得到了重要的应用。
贝叶斯理论是处理不确定性信息的重要工具。
作为一种基于概率的不确定性推理方法,贝叶斯网络在处理不确定信息的智能化系统中已得到了重要的应用,已成功地用于医疗诊断、统计决策、专家系统、学习预测等领域。
这些成功的应用,充分体现了贝叶斯网络技术是一种强有力的不确定性推理方法。
权鸿