非线性回归分析与SAS智能化实现
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第7章 三项型指数曲线模型

三项型指数曲线模型,是三个以e为底的指数项相加而成的。在药代动力学中,二室模型药物血管外给药或三室模型药物静脉注射后,其“药 时”曲线是一条三项型指数曲线。

7.1 问题与数据

【例7-1】 已知某药物为双室模型药物,口服后,测得各时间点的血药浓度结果见表7-1。试拟合该药物的“药 时”曲线。

表7-1 某药物静脉注射后各时间点的血药浓度

7.2 分析与解答

已知药物为双室模型药物,且采用口服,故其“药 时”曲线可由三项型指数曲线模型来拟合。SAS程序如下,程序名设为nr7 1.sas。

    data nr7_1;
      input x y@ @ ;
      cards;
       0.1   4.7   0.3  13.2
       0.5   20.8  1.0  36.3
       2.5   61.4  5.0  68.1
       7.5   61.1  10.0 52.1
       15.0  37.3  20.0 27.5
       25.0  21.1  30.0 16.9
       40.0  11.4  50.0 8.2
       60.0   5.9
       ;
    run;
    % trinomial(nr7_1);

【程序说明】 程序中调用了自编的三项型指数曲线拟合的专用宏程序trinomial,此宏程序含有一个宏参数,即数据集的名称。使用时给出宏参数的取值并替换程序左侧cards语句之后的数据即可,操作起来简单方便。

【SAS输出结果及其解释

本程序运行后,输出结果如下。

图7-1为例7-1资料的散点图。

图7-1 例7-1资料的散点图

该资料拟合三项型指数曲线所得的回归方程为:

y = -124.6229*exp(-0.4793*x) +89.4276*exp(-0.1197*x)+35.1908*exp(-0.0298*x)

残差平方和为:0.0262。

可见,宏程序拟合该资料效果最好的三项型指数曲线方程(原理参见7.3节)为:

y = -124.6229e-0.4793x +89.4276e-0.1197x +35.1908e-0.0298x

残差平方和为0.0262,拟合效果非常好。由于该资料散点组合情形非常多(有84种组合情形),此处不再像第6章那样以表格(见表6-2)展示该宏程序的拟合效果。此处仅给出残数法与非线性最小二乘法拟合效果比较的结果:残数法所得的84个曲线回归方程中对资料拟合效果最好的那个曲线方程是y = -146.8e-0.4284x +105.2e-0.1515x +42.5588e-0.0329x,其残差平方和为1.9282,而非线性最小二乘法所得的曲线回归方程对资料拟合后的残差平方和仅为0.0262,较前者减少了98.64%,故非线性最小二乘法拟合效果是最好的。

图7-2可形象地展示本法(非线性最小二乘法)所得的三项型指数曲线方程对资料7-1的拟合效果。

图7-2 非线性最小二乘法所得三项型指数曲线方程对例7-1资料的拟合效果图

7.3 计算原理

7.3.1 曲线方程

三项型指数曲线模型的方程如下:

式中,α>0,β>0,γ>0,且还有一个潜在的条件,即αβγ。否则,上式可转换为二项型指数曲线方程或一般的指数曲线方程。所以,α,β,γ与之间必然存在着大小之分。

7.3.2 常见曲线形态

三项型指数曲线常见形态见图7-3,其中图7-3(a)和图7-3(b)较为常用。

图7-3 三项型指数曲线模型的常见形态

7.3.3 计算方法

现假设α>β>γ,则当x足够大时,Ae-αxBe-βx均将趋向于0。式(7-1)可简化为:

对式(7-2)进行以e为底的对数变换,则有:

对结果变量y进行自然对数变换,得到新变量lny,然后以其为纵轴变量,以时间变量x为横轴变量,在平面直角坐标系内绘制散点图,记为lny-x图。若在此散点图中,由后向前选取连续的几个(3个或3个以上)基本呈直线趋势的散点,即可拟合一条回归直线。此回归直线的斜率为-γ,截距为lnC。然后,可求出γ值(等于斜率的相反数)和C值(等于exp(截距))。

γ值和C值代入式(7-2)可得到各散点上结果变量的预测值。同样,可计算其他散点(即建立回归直线时所用散点之前的那些点,称为外推点)上结果变量的预测值,称为外推值。

对式(7-1)进行变换,可得:

式中,y为外推点的实际值,Ce-γx为外推点的外推值,二者的差值是第一残数值,记为y残1。因α>β,

x足够大时,Ae-αx将趋向于零。式(7-4)和式(7-5)分别可简化为:

对以上二式进行以e为底的对数变换,依次可得:

两式中均存在一个默认假设,式(7-8)默认y - Ce-γx > 0,式(7-9)默认Ce-γx -y > 0。若实际值与外推值之差大于0的外推点个数多于二者之差小于0的外推点个数,则可舍弃其余外推点,仅以二者之差大于0的这些外推点按照式(7-8)进行分析;反之,若实际值与外推值之差大于0的外推点个数少于二者之差小于0的外推点个数,则可仅以二者之差小于0的这些外推点按照式(7-9)进行分析。

作lny残1 -x图,自后向前选取连续的几个(3个或3个以上)基本呈直线趋势的散点,拟合回归直线后,得截距和斜率为-β和lnB(对应式(7-8))或-β和ln(-B)(对应式(7-9))。然后,可求出β值(等于斜率的相反数)和B值(等于exp(截距)或-exp(截距))。

至此,已分别计算出β,γ,B,C的值。在lny残1 -x图中,将其余外推点的横坐标值代入式(7-6)或式(7-7)等号右侧的表达式(即Be-βx-Be-βx)中,可计算出这些点上结果变量的第一残数值外推值,而根据式(7-4)或式(7-5)可知,Be-βx +Ae-αx-Be-βx -Ae-αx是这些点上结果变量的第一残数值实际值。第一残数值实际值与其外推值之差值是第二残数值,记为y残2。计算公式如下:

对式(7-10)和式(7-11)分别进行以e为底的对数变换,依次可得:

式(7-12)和式(7-13)中均存在一个默认假设,即y残2 > 0。若式(7-10)中y残2 < 0,则等式两边均需乘以-1,可得:

若式(7-11)中y残2 < 0,则等式两边均需乘以-1,可得:

对式(7-14)和式(7-15)分别进行自然对数变换,所得结果依次同式(7-13)和式(7-12)。

所以,若第一残数值的实际值与外推值之差大于0的外推点个数多于二者之差小于0的外推点个数,则可舍弃其余外推点,仅以二者之差大于0的这些外推点继续进行分析;反之,若第一残数值的实际值与外推值之差大于0的外推点个数少于二者之差小于0的外推点个数,则可仅以二者之差小于0的这些外推点继续进行分析。

作lny残2 -x图,自后向前选取连续的几个(3个或3个以上)或全部基本呈直线趋势的散点,拟合回归直线后,得截距和斜率为-α和lnA(对应式(7-12))或-α和ln(-A)(对应式(7-13))。然后,可求出α值(等于斜率的相反数)和A值(等于exp(截距)或-exp(截距))。

至此,可计算出全部参数α,β,γ,A,B,C的值。

7.4 分析步骤

7.4.1 分析策略

以上求解模型的方法称为残数法,它是把三项型指数曲线模型分解成三个指数成分,然后对这三个指数成分通过分段曲线直线化的方式得到相应指数成分的参数估计值,也就可以得到拟合的三项型指数曲线模型了。

但是,此法在计算过程中需要进行曲线直线化,而后再采用最小二乘法使各阶段变量变换后所得新变量离均差平方和最小,这并不一定能使原结果变量的离均差平方和最小,所以其模型的拟合精度仍存在一定的提高空间。

以残数法计算所得的参数估计值为初始值,再借助于SAS软件STAT模块中的NLIN过程,采用非线性最小二乘法继续进行拟合,可得到拟合效果更好的曲线模型。

上述策略的框图如图7-4所示。

图7-4 三项型指数曲线模型分析策略框图

7.4.2 实施步骤

首先,以专业知识为依据,当判定某资料可能属于三项型指数曲线范畴时,再采用以下步骤实施三项型指数曲线拟合。

实施步骤与6.4.2小节相同。区别主要在于第二步,在进行散点的全面组合时,需要在SAS宏内使用三个do循环,计算次数有所变化。

参考文献

[1] 薛仲三. 医学统计方法和原理(内部资料). 北京:军事医学科学院,1984:276-287.

[2] 梁文权. 生物药剂学与药物动力学(第2版). 北京:人民卫生出版社,2006:164-240.

[3] SAS Institute Inc. SAS/STAT 9.2 User's Guide. Cary,NC:SAS Institute Inc.,2008:4261-4336.