3.2 贝叶斯网络
3.2.1 贝叶斯网络的数学模型
贝叶斯网络又称为信念网络,由〈V,E,Θ〉三部分组成。其中〈V,E〉表示有向无环图(Directed Acyclic Graph,DAG)。V是网络中节点的集合,是为有限的非空集合;E是网络中有向边(或弧)的集合,是由V中的不同元素的有序对构成的集合。如果一个有向图无法从某个节点出发,经过若干条边后仍能够回到该节点,则称这个有向图为有向无环图。若存在有向边从节点Y指向节点X,则Y被称为是X的父节点;与此相应的,X被称为是Y的子节点。X的父节点集用pa(X)表示,子节点集用de(X)表示,而非后代节点集则用nd(X)表示。
定义3.1(条件独立) 假设概率空间(Ω,P),A、B和C是定义在Ω上的随机变量子集。若满足P(A|B,C)=P(A|C),则称A和B关于C条件独立,记作IP(A,B|C)。
定义3.2(马尔可夫条件) 假设有向无环图G=〈V,E〉,且V的联合概率分布为P(V)。对任意的X∈V,在X的父节点集pa(X)已知的情况下,如果X独立于其非后代节点集nd(X),即IP(X,nd(X)|pa(X)),则称G=〈V,E〉符合马尔可夫条件。
贝叶斯网络同样满足马尔可夫条件,它也是对联合概率分布进行图形化的描述,目的是为了降低表述联合概率分布以及推理的复杂性。贝叶斯网络的定义如下:
定义3.3(贝叶斯网络) 假设贝叶斯网络中的节点集为V={V1,V2,…,Vn},则贝叶斯网络ℕ可以表示为二元组ℕ=(G,Θ)。其中,G=〈V,E〉表示节点关系的有向无环图,称之为贝叶斯网络结构;Θ={θ1,θ2,…,θn}表示每个节点Vi在它的父节点集pa(X)的条件下的条件概率,称之为贝叶斯网络参数。
根据马尔可夫条件可知,在贝叶斯网络中,每个节点Vi在pa(X)状态已知的情况下,独立于nd(X)。根据条件独立性,可以将P(V)分解为如下的形式:
这种按照有向无环图对联合概率进行分解的方式也称为回归分解或者链式分解,其中的每个元素P(Vi|pa(Vi))都可以被看作是潜在的函数φ(Vi|pa(Vi))。
图3.2中给出了包含5个节点的简单贝叶斯网络模型,其中假定用“0”表示事件未发生,“1”表示事件发生。节点A(冬天)只有子节点B(喷水器)和C(下雨),并无父节点,这种只有子节点而无父节点的节点也被称为根节点。相反,节点D(湿草地)及节点E(湿滑路面)则只有父节点而无子节点,这样的节点被称叶节点。
图3.2 包含5个节点的简单贝叶斯网络
图3.2中各个节点的分布律如下:
根据式(3.9)可知,该图3.2中5个节点的联合概率分布可以表示为
这样可以结合贝叶斯网络参数求解出联合概率分布。