2.2 课后习题详解
1.已知U(x,y)=4x2+3y2。
(1)计算。
(2)当x=1,y=2时,求这两个偏导数的值。
(3)写出U的全微分。
(4)当dU=0,计算dy/dx,即保持U不变,y和x的替代关系如何?
(5)说明当x=1,y=2时,U=16。
(6)当x=1,y=2时,x,y要以怎样的比例微小变化才能保持U=16不变?
(7)U=16的等高线是什么图形?它各点的斜率是多少?
解:(1)对于函数U(x,y)=4x2+3y2,其关于x和y的偏导数分别为:
(2)当x=1,y=2时,(1)中的偏导数值分别为:
(3)U的全微分为:
(4)当dU=0时,由(3)可知:8xdx+6ydy=0
从而可以解得:
(5)将x=1,y=2代入U的表达式,可得:U=4×1+3×4=16。
(6)由(4)可得,在x=1,y=2处,当保持U=16不变,即dU=0时,有:
(7)当U=16时,该函数变为4x2+3y2=16,因而该等高线是一个以原点为中心的椭圆。由(4)可知,该等高线在(x,y)处的斜率为:
2.假设某企业的总收入只由产量决定,且关系式为R=70q-q2,总成本也只由q决定,C=q2+30q+100。
(1)要使利润(R-C)最大化,产量定为多少?最大利润是多少?
(2)说明(1)问题的答案满足极值的二阶条件。
(3)结果满足“边际收益=边际成本”原则吗?请解释。
解:(1)公司的利润函数为:π=R-C=-2q2+40q-100
利润最大化的一阶条件为:
从而可以解得利润最大化时的产量为:q*=10
相应的最大化的利润为:π*=-2×102+40×10-100=100
(2)在q*=10处,利润最大化的二阶条件为:
因而满足利润最大化的二阶条件。
(3)在q*=10处,边际收益为:
边际成本为:
因而有MR=MC=50,即“边际收益等于边际成本”准则满足。
3.设f(x,y)=xy,在x+y=1的约束条件下分别用代入消元法和拉格朗日乘数法求最大值。
解:(1)代入消元法
由x+y=1可得:y=1-x,将其代入f可得:f=xy=x-x2,
从而有:
可以解得:x=0.5,y=0.5,f=0.25。
(2)拉格朗日乘数法
构造拉格朗日函数:L=xy+λ(1-x-y)
一阶条件为:
从而可以解得:x=y=0.5,f=xy=0.25。
4.上一题的对偶问题是给定xy=0.25,求x+y的最小值。用拉格朗日乘数法求解。比较这两题中算出的拉格朗日乘数的大小,并解释其关系。
解:(1)设最小化问题的拉格朗日函数为:L=x+y+λ(0.25-xy)
一阶条件为:
由前两个方程式可得:x=y,联立第三个方程式,解得:x=y=0.5。
(2)将本题与第3题进行比较可知,两种情况下求得的拉格朗日乘数的值分别为0.5和2,互为倒数。这是因为第3题中受约束的最大化问题是本题中受约束的最小化问题的一个对偶问题。
5.垂直向上抛球,t秒后高度为f(t)=-0.5gt2+40t(其中g是重力加速度)。
(1)达到最高点时t为多少?将其写成g的函数。
(2)用上一问的结果解释当g发生改变时,最高点高度如何变化。
(3)用包络定理求解第(2)小题。
(4)在地球上g=32,但在不同的地方略有不同。如果两地g相差0.1,球能达到的最大高度大约差多少?
解:(1)对高度函数f(t)=-0.5gt2+40t关于时间求导数可得:
从而可以解得使高度最大的时间为:t*=40/g,从而可知小球处于最高处的时间t与参数g成反比例关系。
(2)将t*=40/g代入高度函数中可得:
从而有:
即随着g的增大,最大高度将变小。
(3)由包络定理可知:取决于g,这是因为t*取决于g。
因而有:
(4)当g=32时,最大高度为:f=800/32=25;
当g=32.1时,最大高度为:f'=800/32.1≈24.92;
因而两地最大高度的差异为:∆f=f'-f=24.92-25=-0.08。
6.为了建造一艘油轮,我们把一块长3x,宽x的铁皮四角各剪去一块边长为t的正方形,再折起来,就形成了无盖油箱的结构。
(1)证明油箱的体积V=t(x-2t)(3x-2t)=3tx2-8t2x+4t3。
(2)对于给定的x,为了使油箱容积最大,t应该取多少?
(3)把V视为x的函数,V是否有最大值?
(4)如果造船厂只有1000000平方英尺的铁皮,即t,x满足约束条件3x2-4t2=1000000。现在求解V的最大值。此时的结果和(2),(3)两个问题有什么区别?
解:(1)如图2-1所示,长方形四个角处去掉一个边长为的正方形后叠起来的油箱是一个长方体,该长方体的长为(3x-2t),宽为(x-2t),高为t,因而其体积为:V=t(x-2t)(3x-2t)=3tx2-8t2x+4t3
图2-1 油轮模型的制作
(2)V关于t求导数可得:
从而可以解得:
即:t1=0.225x,t2=1.11x
二阶条件为:
因此,只有当t=0.225x时,才有
即只有当t=0.225x才能使给定x下的V最大。
(3)当t=0.225x时,V≈0.67x3-0.04x3+0.05x3≈0.68x3。因而当x增大时,V随之增大,没有极限。因此,不存在一个x使得所装油的体积最大。
(4)受约束的最优化问题为:
设拉格朗日函数为:
一阶条件为:
从而可以利用拉格朗日乘数法求得最优的t*、x*。显然,该受约束的最大化问题的解将有别于(2)和(3)中求解出来的解。
7.考虑条件极值问题,使y最大化,其中y=x1+5lnx2。x1,x2满足约束条件k-x1-x2=0,k为任意常数。
(1)当k=10时,求解该条件极值问题。
(2)证明k=4时,x1=-1。
(3)如果要求自变量必须非负,k=4时的最优解是多少?
(4)当k=20时,求解之,并与问题(1)的结果做比较,能得出什么结论?
(注:这个问题涉及的函数称为“准线性函数”,在消费者行为理论中还会用到。)
解:(1)设拉格朗日函数为:
一阶条件为:
联立以上方程组可解得:
当k=10时,最优解为:x1=x2=5。
(2)当k=4时,由(1)的解x1=k-5可得:x1=4-5=-1。因此,结论成立。
(3)如果此问题的解非负时,最优解为:x1=0,x2=4,y=5ln4。因为任何正的x1的值都将使y变小。
(4)如果k=20,则由(1)可得最优解为:x1=15,x2=5。因为x2给y提供了一个递减的边际增量,而x1却没有,所以,所有的最优解要求一旦x2增至5,额外的增量应该全部由x1的增加来实现。
8.假定一个企业的边际成本函数是MC(q)=q+1。
(1)这个企业的总成本函数是什么?解释为什么总成本函数只取决于一个代表了固定成本的积分常数。
(2)在之前的经济学课程中已经学习到,在企业做出定价决策(p)时,产量q和价格p要满足关系p=MC(q)。如果企业依照这个利润最大化规律进行决策,那么在p=15时,企业的产量是多少?假设企业在这个价格时不赚不赔,那么企业的固定成本是多少?
(3)如果价格上涨到20,企业将获得多少利润?
(4)请证明,如果继续假设企业依据利润最大化规律做决策,那么企业的利润能够写成价格p的一元函数。
(5)求解价格从p=15上涨到p=20后利润的增量有两种计算方法:①直接使用(4)中的函数求解;②对逆边际成本函数MC-1(p)=p-1积分,积分下限为p=15,积分上限为p=20。请分别使用这两种方法计算利润增量,并使用包络定理在直观上解释结果。
解:(1)由企业的边际成本函数是MC(q)=q+1,设企业的固定成本为F,则企业的总成本函数为:
由于企业的边际成本是指企业多生产一单位的产品所增加的企业成本。用公式描述企业总成本函数和边际成函数之间的关系就是
而上述所求的总成本函数代表了在此边际成本函数下的总成本函数族。此时,要使总成本函数唯一,主要取决于固定成本F。
所以说,总成本函数只取决于一个代表了固定成本的积分常数。
(2)在企业做出定价决策(p)时,产量q和价格p要满足关系p=MC(q)。如果企业依照这个利润最大化规律进行决策,那么在p=15时,企业的产量满足:15=q+1,解得:q=14。
企业在这个价格时不赚不赔,此时的企业利润为零,即:π=pq-TC(q)=15×14-(142/2+14+F)=0,解得此时企业的固定成本为:F=98
(3)如果价格上涨到20,则企业产量满足:20=q+1
解得:q=19
此时,企业将获得利润为:π=pq-TC(q)=20×19-(192×0.5+19+98)=82.5
(4)如果继续假设企业依据利润最大化规律做决策,由p=MC(q)可将企业的产量表示为:q=p-1。那么企业的利润函数为:
由于F为常数,所以说,如果继续假设企业依据利润最大化规律做决策,那么企业的利润函数能够写成价格p的一元函数。
(5)价格从p=15上涨到p=20后利润的增量有两种计算方法:
①直接使用(4)中的函数求解:∆π=π(20)-π(15)=82.5
②通过对逆边际成本函数MC-1(p)=p-1积分进行求解,积分下限为p=15,积分上限为p=20。
在两种方法下,求解的利润增量相等。即拉格朗日表达式在计算有约束条件下的问题和没有约束条件的问题时,包络定理起了相同的作用。
9.凹函数和拟凹函数
通过比较两者的定义来证明凹函数必为拟凹函数(2.114式和2.98式),你能从直观上解释你的证明吗?它的逆命题是否正确,即拟凹函数是否是凹函数?如果不正确,请举出一例。
2.98式为:
2.114式为:
解:(1)下面给出该命题的两种证明方法:
①利用凹函数和拟凹函数的定义
函数f(x),对定义域S(凸集)上任意两点x1,x2∈S,θ∈[0,1],如果有f[θx1+(1-θ)x2]≥θf(x1)+(1-θ)f(x2),则称函数f(x)为凹函数。
函数f(x),对定义域S(凸集)上任意两点x1,x2∈S,θ∈[0,1],如果有f[θx1+(1-θ)x2]≥min{f(x1),f(x2)},则称函数f(x)为拟凹函数。
显然,对于凹函数有:f[θx1+(1-θ)x2]≥θf(x1)+(1-θ)f(x2)≥min{f(x1),f(x2)}
因而可以从凹函数推出拟凹函数,反之,则不成立。
②利用数学中关于拟凹函数的性质
本题的证明将利用如下定理:
(二阶连续可微)函数f:A→R是拟凹函数,当且仅当对每一个x∈A,海塞矩阵D2f(x1,x2)在子空间中都是半负定的,也就是说,当时
下面来证明:
因为f(x1,x2)是一个凹函数,而二阶连续可微函数f(x)是凹函数,当且仅当其海塞矩阵是半负定的,所以对于海塞矩阵
有:
即:
而海塞矩阵D2f(x1,x2)是负定的,从而可知,海塞矩阵D2f(x1,x2)在子空间中至少是半负定的,因而可知f(x1,x2)也是一个拟凹函数。对于拟凹函数,其加边矩阵是半负定的,即有:
(2)直观的,从图形上看,函数f(x)为拟凹表示线段x1、x2之间的点的函数值要高于点A,或者说曲线ACB之间的点都高于点A。显然,当函数f(x)是凹函数,曲线呈一个倒置的锅状,则上述性质是满足的。从这一点看,凹函数一定是拟凹函数。
(3)逆命题不正确,即拟凹函数不一定是凹函数。如图2-2所示,在曲线AC段,函数是凸的;而在CB段,函数是凹的。这说明拟凹函数的概念要比凹函数更弱。
图2-2 凹函数与拟凹函数
10.你即将碰到一个经济学中特别重要的函数:柯布―道格拉斯函数:
其中0<α,β<1
(1)用定义的“原始”做法证明它是拟凹函数。
(2)用y=c的等高线围成的区域是凸集的办法证明它是拟凹函数。
(3)证明当α+β>1时该函数不是凹函数。(这也说明拟凹函数不一定是凹的)。
注:柯布―道格拉斯函数在扩展章节中有介绍。
解:(1)分别对柯布―道格拉斯函数求一阶、二阶导数可得:
显然中的所有项都是负的,从而可得:
因而可知柯布―道格拉斯函数是一个拟凹函数。
(2)如果
则
因而当α、β>0时,x2是x1的凸函数。关于拟凹函数的一个重要性质是,如果函数f(x)是拟凹的,则当且仅当集合是凸集,其中k是任意常数。集合为函数f(x)的上等值集合。
(3)根据定义,满足f11<0,f11 f22-f122>0的函数为凹函数。
当α+β>1时,该式是负的,因而此时函数不是凹函数,从而可知,并非所有的拟凹函数都是凹函数。
11.幂函数
另一种常见的函数是“幂函数”:y=xδ,其中,0≤δ≤1(有时我们也会考察δ小于0的情形,在这类情况下一般使用y=xδ/δ的形式以保证微分表达式有适当的符号)。
(1)证明幂函数是凹函数(自然也是拟凹函数)。注意只有当δ<1时函数才是严格凹的。
(2)证明多元幂函数也是凹的(也是拟凹的)。这里由于交叉偏导数f12=f21=0,凹性很明显。解释为什么交叉偏导数为零?
(3)用(2)中描述的单调映射可以给函数附加上“规模效应”。
函数g是否具有凹性?是否具有拟凹性?
解:(1)当0≤δ<1时,因为y'=δxδ-1≥0,y"=δ(δ-1)xδ-2<0,所以此时函数y=xδ是严格凹函数。
(2)对于幂函数
有:
因为f11,f22<0,且f12=f21=0,所以f11 f22-f122>0满足,因而该函数是凹函数。
根据多元幂函数的表达式可知,对一个变量求一阶偏导得到的方程式与另一个变量无关,所以交叉偏导数为0。
(3)因为y是拟凹函数,所以g=yγ也是拟凹函数。但是,当δγ>1时,g不是凹函数,证明如下。
g=yγ,则
有:
因为0≤δ≤1,所以,当δγ>1时, g11g22-g122<0,g不是凹函数;当δγ≤1时,g是凹函数。
12.由于在本书中经常会在有约束的优化问题中使用包络定理,通过在下面这个简单的例子中证明该定理可能会帮助读者多一些直观上的理解。假设要最大化一个二元函数,同时这个函数还与参数a有关f(x1,x2,a)。这个最大化问题中的约束条件为g(x1,x2,a)=0。
(1)写出求解这个问题的拉格朗日表达式,并写出其一阶条件。
(2)将包含x的两个一阶条件相加。
(3)将(2)中的求和式对a求导数。这一结果将告诉我们随着a的变化,x必须要改变相对应的量,才能使一阶条件成立。
(4)我们已经从本章中学到,这个问题中的目标函数和约束条件可以写成a的函数:f[x1(a),x2(a),a],g[x1(a),x2(a),a]=0。将第一个函数对a求导数。这一结果表明的是在x取最优值时目标函数值随a值变化的情况。求导结果中必须要有两项,一项中含有x,另一项为单独的∂f/∂a。
(5)将(4)中第二个等式即约束条件对a求导。结果中有一项含有x,另一项只含有∂g/∂a。
(6)把(5)中的结果乘上λ(拉格朗日乘数),并且运用(3)中的一阶条件,将这两个结果带入(4)的微分式中。应该可以得到:
这个等式就是在x取到最优值时,拉格朗日表达式的偏微分。这也就证明了包络定理。请在直觉上解释这一证明为何能够保证x被调整到最优值。
(7)请解释本书例2.8中如何在篱笆周长这个例子中运用包络定理,即篱笆周长P的变化如何影响篱笆包围的面积?并使用包络定理说明,在这个例子中拉格朗日乘数如何施加约束。
解:(1)这个最大化问题为:
构造拉格朗日函数:L=f(x1,x2,a)+λ·g(x1,x2,a)
一阶条件为:
(2)包含x的两个一阶条件相加得:f1+f2+λ(g1+g2)=0
(3)将(2)中的求和式对a求导得:
(4)将目标函数对a求导得:
①
(5)将约束条件对a求导得:
②
(6)将②乘以λ再加入①式,有:
因为x1(a),x2(a)表示f取极值时与a对应的x,因此f1+λg1=0,f2+λg2=0。所以
从直观上解释,这一证明是从拉格朗日表达式中推导出来的,因此能够保证x取到最优值。
(7)根据例2.8有:面积A=xy,约束条件为P=2x+2y,所以A=x(0.5P-x),从而
即周长P增加一个单位时,面积增加0.125P个单位。拉格朗日乘数通过f1+f2+λ(g1+g2)=y+x-4λ=0施加约束,由此可求得拉格朗日乘数为λ=0.25(x+y)=0.125P。
13.泰勒逼近
泰勒定理说的是任意函数在任意光滑点附近都可以用一系列原函数及微分的线性组合近似表示。下面是泰勒定理在一元函数和二元函数中的运用。
(1)任意连续和可导的一元函数f(x),在a点附近可以用下列等式逼近:f(x)=f(a)+f'(a)(x-a)+0.5f''(a)(x-a)2+有关的f"',f"",…。
仅用前三项逼近就称为二次泰勒逼近。对f''(x)<0中的凹函数使用二次泰勒逼近可以说明,任何凹函数要么正好在a点的切线上,要么在a点的切线下方。
(2)任意二元函数f(x,y)在点(a,b)处的二次泰勒逼近为:
f(x,y)=f(a,b)+f1(a,b)(x-a)+f2(a,b)(y-b)+0.5[f11(a,b)(x-a)2+2f12(a,b)(x-a)(y-b)+f22(y-b)2]
同样的,使用上述逼近可以说明,任意的凹函数(由f11 f22-f122>0定义)要么正好在点(a,b)的切线上,要么在点(a,b)的切线下方。
证明:(1)f(x)在a点的二次泰勒逼近式为f(x)=f(a)+f'(a)(x-a)+0.5f''(a)(x-a)2
因为f''(a)<0,(x-a)2>0可得f(x)≤f(a)+f'(a)(x-a)
上面的方程表明的是f(x)在a点的切线方程,因此,任何凹函数要么位于a点的切线上,要么在该点切线的下方。
(2)f(x,y)在(a,b)点的二次泰勒逼近式为f(x,y)=f(a,b)+f1(a,b)(x-a)+f2(a,b)(y-b)+0.5[f11(a,b)(x-a)2+2f12(a,b)(x-a)(y-b)+f22(y-b)2]
根据凹函数的性质,有
上面的方程表明的是f(x,y)在(a,b)点的切线方程,因此,任何凹函数要么位于(a,b)点的切线上,要么在该点切线的下方。
14.由于期望这个概念在经济学理论中有很重要的作用,下面将会在这里进一步总结这个统计学概念的性质。贯穿这个问题,我们都假设x是一个连续随机变量,概率密度函数为f(x)。
(1)(Jensen不等式)假设g(x)是一个凹函数。证明E[g(x)]≤g[E(x)]。提示:在点E(x)处作函数g(x)的切线。这个切线的性质是,对所有的x和c+dE(x)=g[E(x)]都有c+dx≥g(x),其中c和d是常数。
(2)用(1)中的方法证明如果g(x)是凸函数,那么有E[g(x)]≥g[E(x)]。
(3)假设x只能取非负值,即0≤x≤∞,使用分步积分法证明:
其中,F(x)是x的累积分布函数[]。
(4)(马尔科夫不等式)证明,如果x只能取正值,则下面的不等式成立:
提示:
(5)考虑概率密度函数f(x)=2x-3,其中x≥1。
①证明上述函数确实是一个概率密度函数。
②求出其累积分布函数F(x)。
③使用(3)中的结果计算其期望。
④证明这个函数满足马尔科夫不等式。
(6)在一些经济学问题中会用到条件期望这个概念。即在某些事件发生的条件下,x的期望表示为E(x∣A)。计算条件期望需要知道在事件A发生的条件下x的概率密度函数(用f(x∣A)表示)。定义了上述表达式,可以得到
下面用一个例子来说明这些关系。
令f(x)=x2/3,其中-1≤x≤2
①证明上述函数是一个概率密度函数。
②计算期望E(x)。
③计算-1≤x≤0的概率。
④考虑事件0≤x≤2,并记为事件A。求解f(x∣A)。
⑤计算E(x∣A)。
⑥在直觉上解释上述结果。
证明:(1)在点E(x)处作函数g(x)的切线,则对所有x和c+dE(x)=g[E(x)]有c+dx≥g(x)
因此E[g(x)]≤E(c+dx)=c+dE(x)=g[E(x)]。
(2)在点E(x)处作函数g(x)的切线,则对所有x和c+dE(x)=g[E(x)]有c+dx≤g(x)
因此E[g(x)]≥E(c+dx)=c+dE(x)=g[E(x)]。
(3)
所以,对于0≤x≤∞,有
(4)马尔科夫不等式证明如下:
(5)①对任意x≥1,有f(x)>0,且
所以,f(x)是密度函数。
②f(x)的累积分布函数
③f(x)的期望函数
④因为
又x≥1,则有,从而
所以,f(x)满足马尔科夫不等式。
(6)①对任意-1≤x≤2,有f(x)=x2/3≥0,且
所以,f(x)是概率密度函数。
②f(x)的期望函数
③
④
⑤
⑥由以上结果可知:要消除x的最低值,应增加剩余值的预期值。
15.从随机变量方差的定义式出发,可以推导出一些结论。
(1)证明Var(x)=E(x2)-[E(x)]2。
(2)使用马尔科夫不等式(练习题14(4))证明下面的不等式成立,其中x为非负数。
这一结果告诉我们一个随机变量偏离期望的程度是有限制的。令k=hσ,上述结果可以转化为:
举个例子,一个随机变量偏离期望超过两个标准差的概率永远小于0.25,这个结果也被称为切比雪夫不等式。
(3)Var(x+y)=Var(x)+Var(y)+2Cov(x,y)说明,如果两个(或两个以上)的随机变量是独立的,那么它们的和的方差等于方差的和。把这一结果推广到n个随机变量,每个随机变量的期望和方差都是μ和σ2。这n个随机变量的和的期望为nμ,方差为nσ2。这n个随机变量的均值的期望为μ,方差为σ2/n。这有时被称为大数定理:随着随机变量个数的增加,其均值的方差会逐渐收敛到0。
(4)利用(3)的结果证明,如果x1和x2是两个同期望、同方差的独立随机变量。这两个随机变量的加权平均值X=kx1+(1-k)x2(0≤k≤1)的方差在k=0.5时取到最小值,那么合理设置k的取值能够使X的方差减少多少?
(5)如果(4)中的两个随机变量方差不相等,最后的结果会发生怎样的变化?
解:(1)根据方差的数学定义得:
(2)根据马尔科夫不等式,有:
令k=hσ,则有:
(3)如果两个(或两个以上)的随机变量是独立的,即:如果x,y相互独立,则有Var(x+y)=Var(x)+Var(y)
对于相互独立的n个随机变量,其期望和方差满足:E(xi)=μ,Var(xi)=σ2,i=1,2,…,n
则这n个随机变量和的期望和方差分别为:
E(x1+x2+…+xn)=E(x1)+E(x2)+…+E(xn)=nμ
Var(x1+x2+…+xn)=Var(x1)+Var(x2)+…+Var(xn)=nσ2
这n个随机变量的均值的期望和方差分别为:
随着随机变量个数n的增加,其均值方差的极限为:
(4)由题意得,X的方差为:Var[kx1+(1-k)x2]=[k2+(1-k)2]·σ2=(2k2-2k+1)·σ2
一阶条件满足:(4k-2)·σ2=0
解得,k=0.5,又二阶导数为4σ2≥0,所以此时X的方差达到最小值,为:
(5)此时,方差为
一阶条件满足:
解得:
16.这里介绍一些与随机变量x1和x2的协方差有关的关系式。
(1)证明Cov(x1,x2)=E(x1x2)-E(x1)E(x2),上述关系的一个重要应用就是,当Cov(x1,x2)=0时,E(x1x2)=E(x1)E(x2),即随机变量乘积的期望等于这两个随机变量期望的乘积。
(2)证明Var(ax1+bx2)=a2Var(x1)+b2Var(x2)+2abCov(x1,x2)。
(3)在第15题第(4)问中,我们计算了X=kx1+(1-k)x2(0≤k≤1)的方差。如果Cov(x1,x2)≠0,上面的结论——当k=0.5时,X的方差最小,是否还成立?
(4)两个随机变量的相关系数定义为:
分别从数学上和直观上解释为什么-1≤Corr(x1,x2)≤1。
(5)假设随机变量y是x的线性变换y=α+βx。证明:
这里,β也被称为y关于x的回归系数。如果使用真实数据,上述表达式也被称为最小二乘(OLS)回归系数。
解:(1)根据协方差数学定义得:
当Cov(x1,x2)=0时,有:E(x1x2)=E(x1)·E(x2)
(2)由方差的定义得:
(3)此时,有:
一阶条件为:
解得:
且二阶导数为:4Var(x1)-4Cov(x1,x2)≥0,因此结论依然成立。
(4)有:
根据柯西-施瓦茨不等式,有:
因此:Corr2(x1,x2)≤1。
所以-1≤Corr(x1,x2)≤1。
从直观上理解,相关系数度量的是两个变量之间的相关关系,当两个变量之间正线性相关时,相关关系最强,此时相关系数为1;当两个变量之间负线性相关时,相关关系最弱,此时相关系数为-1。两个变量之间的相关关系介于正线性相关和负线性相关之间,因此相关系数介于-1到1之间。
(5)随机变量y是x的线性变换y=α+βx时,y和x的相关系数为:
由于y与x正线性相关,所以Corr(x,y)=1,从而