第四节 常用描述性统计概念
一、随机变量与描述性统计量
1.随机变量
1)定义
将一个能取得多个可能值的数值变量X称为随机变量。
(1)离散型随机变量:随机变量X最多只能取可数的不同值;
(2)连续型随机变量:随机变量X的取值无法一一列出,可以遍取某个区间的任意数值。
2)随机变量的分布
(1)如果X是离散型的,X最多可能取n个值x1, x2, …, xn,并且记pi=P{X=xi}是X取xi的概率,所有概率的总和。
(2)如果X是一个连续型随机变量,则改用概率密度函数来刻画X的分布性质。
2.随机变量的数字特征与描述性统计量
1)期望(均值)
随机变量X的期望(或称均值,记作E(X))衡量了X取值的平均水平;它是对X所有可能取值按照其发生概率大小加权后得到的平均值。
在X 的分布未知时,我们用抽取样本X1, …,Xn的算术平均数(也称样本均值)作为E(X)的估计值。
【例1.6·单选题】表1-1列示了对某证券的未来收益率的估计。
表1-1 某证券的未来收益率
该证券的期望收益率等于( )。[2014年11月证券真题]
A.15%
B.5%
C.0%
D.10%
【答案】B
【解析】该证券的期望收益率为。
2)方差与标准差
(1)含义。
对于投资收益率,用方差(σ2)或者标准差(σ)来衡量它偏离期望值的程度。其中, σ2=E[(r-Er)2],它的数值越大,表示收益率r偏离期望收益率的程度越大,反之亦然。
(2)方差和标准差的计算公式。
(3)σ 2与σ的估计。
对于r 分布未知的情况,我们可以抽取其样本r1,r2, …,rn,然后分别用样本方差与样本标准差来估计σ2与σ。
3)分位数
(1)含义。
分位数通常被用来研究随机变量X 以特定概率(或者一组数据以特定比例)取得大于等于(或小于等于)某个值的情况。
一般来说,设0<α<1,随机变量X的上α 分位数是指满足概率值P{X≥xα}=α 的数xα;下α 分位数是指满足概率值P{X≤xα}=α的数xα。
(2)分位数的统计意义。
分位数的统计意义如图1-1所示。
图1-1中左右两侧的阴影部分面积均为α,于是变量X会以概率α 取得不超过下α分位数的取值,也可以概率α 取得不小于上α 分位数的取值。
图1-1 分位数的统计意义
(3)分位数的计算。
直接计算X的分位数比较困难,尤其是X分布未知时,所以用样本X1, …, Xn来估计分位数。
首先将样本按照数值从小到大排列成X(1), …, X(n),然后用样本中第nα大的数作为上α分位数xα,用样本中第nα小的数作为下α分位数xα*。如果nα不是整数,我们就取与nα相邻的两个整数位置的样本值的平均数作为分位数。
4)中位数
中位数是用来衡量数据取值的中等水平或一般水平的数值。对随机变量X 来说,它的中位数就是上50%分位数X50%,这意味着X的取值大于其中位数和小于其中位数的概率各为50%。对一组数据来说,中位数就是大小处于正中间位置的那个数值。
【例1.7·单选题】在某企业中随机抽取7名员工来了解该企业2013年上半年职工请假情况,这7名员工2013年上半年请假天数分别为1, 5, 3, 10, 0, 7, 2。这组数据的中位数是( )。
A.3
B.10
C.4
D.0
【答案】A
【解析】对一组数据来说,中位数就是处于正中间位置的那个数值。例如,对于X 的一组容量为5的样本,从小到大排列为X1, …,X5,这组样本的中位数就是X3;如果换成容量为10的样本X1, …,X10,由于正中间是两个数X5,X6,我们可用它们的平均数来作为这组样本的中位数。本题中,该组数据从小到大的顺序为:0,1,2,3,5,7,10,居于中间的数据是3。
二、正态分布
1.含义
如果连续型随机变量X的概率密度函数曲线如图1-2所示,则称X服从参数为(μ, σ2)的正态分布,记为X~N(μ, σ2),其中μ是X的期望,σ >0为X的标准差。
特别的,当μ=0, σ=1,即X~N(0, 1)时,称X服从标准正态分布。
图1-2 正态分布概率密度函数曲线
2.分布特点
正态分布距离均值越近的地方数值越集中,而在离均值较远的地方数值则很稀疏。这意味着正态分布出现极端值的概率很低,而出现均值附近的数值的概率非常大。同时图像越“瘦”,正态分布集中在均值附近的程度也越大。
三、随机变量的相关性——相关系数
1.含义
相关系数是从资产回报相关性的角度分析两种不同证券表现的联动性。通常用ρij表示证券i和证券j的收益回报率之间的相关系数。
2.特征
(1)相关系数的绝对值大小体现了两个证券收益率之间相关性的强弱。如果a证券与b证券之间的相关系数绝对值|ρab|比a证券与c证券之间的相关系数绝对值|ρac|大,则说明前者之间的相关性比后者之间的相关性强。
(2)相关系数ρ ij总处于+1和-1之间,亦即|ρij|≤1。
① 若ρij=1,则表示ri和rj完全正相关。
② 若ρij=-1,则表示ri和rj完全负相关。
③ 若ρij=0,则表示两个变量间完全独立,无任何关系,即零相关。
【例1.8·单选题】证券间的联动关系由相关系数ρ 来衡量,ρ 值为1,表明( )。
A.两种证券间存在完全反向的联动关系
B.两种证券的收益有同向变动倾向
C.两种证券的收益有反向变动倾向
D.两种证券间存在完全正向的联动关系
【答案】D
【解析】ρ是两个证券的相关系数,在完全正相关下,ρ=1,表明两种证券存在完全正向的联动关系。
【过关练习】
单选题(以下备选项中只有一项最符合题目要求)
1.证券投资组合的期望收益率等于组合中证券期望收益率的加权平均值,其中对权数的表述正确的是( )。
A.所使用的权数是组合中各证券未来收益率的概率分布
B.所使用的权数之和可以不等于1
C.所使用的权数是组合中各证券的投资比例
D.所使用的权数是组合中各证券的期望收益率
【答案】C
【解析】由n项资产A1, …, An构成资产组合A=w1A1+…+wnAn,其中wi是权数,为投资于资产Ai的资金所占总资金的比例,;若Ai的期望收益率为ri,则资产组合A的期望收益率r为r=w1r1+…+wnrn。
2.证券X的期望收益率为12%,标准差为20%,证券Y的期望收益率为15%,标准差为27%,如果这两个证券在组合中的比重相同,则组合的期望收益率为( )。
A.13.5%
B.15.5%
C.27.0%
D.12.0%
【答案】A
【解析】根据公式,可知该组合的期望收益率为
E(rp)=wx E(rx)+wy E(ry)=10% × 50%+15% × 50%=13.5%。
3.假如你有一笔资金收入,若目前领取可得10000元,而3年后领取可得15000元。如果当前你有一笔投资机会,年复利收益率为20%,每年计算一次,则下列表述正确的是( )。
A.3年后领取更有利
B.无法比较何时领取更有利
C.目前领取并进行投资更有利
D.目前领取并进行投资和3年后领取没有区别
【答案】C
【解析】若将10000元领取后进行投资,年利率为20%,每年计息一次,3年后的终值为FV=10000 ×(1+0.2)3=17280(元)。将10000元领取后再投资3年,比3年后可领取的15000元多2280元,因此选择目前领取并进行投资更有利。
4.顾先生希望在5年末取得20000元,则在年利率为2%,单利计息的方式下,顾先生现在应当存入银行( )元。
A.19801
B.18004
C.18182
D.18114
【答案】C
【解析】根据单利现值的计算公式,可得(元)。
5.资产负债表的下列科目中,不属于所有者权益的是( )。
A.长期股权投资
B.资本公积
C.股本
D.未分配利润
【答案】A
【解析】资产负债表中,所有者权益包括四个部分:①股本,即按照面值计算的股本金;②资本公积,包括股票发行溢价、法定财产重估增值、接受捐赠资产、政府专项拨款转入等;③盈余公积,分为法定盈余公积和任意盈余公积;④未分配利润,指企业留待以后年度分配的利润或待分配利润。A项属于企业的资产。
6.下列关于财务报表中的各个项目的关系,描述不正确的是( )。
A.资产=负债+所有者权益
B.净现金流量=经营活动产生的现金流量+投资活动产生的现金流量+筹资活动产生的现金流量
C.流动资产=流动负债
D.净利润=息税前利润-利息费用-税费
【答案】C
【解析】资产负债表中,“资产=负债+所有者权益”恒成立,但是“流动资产=流动负债”一般情况下不成立;利润表中,企业的净利润等于息税前利润(EBIT)减去利息费用和税费;现金流量表中,其基本结构分为经营活动产生的现金流量、投资活动产生的现金流量、筹资活动产生的现金流量,三部分现金流加总则得到净现金流。
7.某企业的年末财务报表中显示,该年度的销售收入为30万,净利润为15万,企业年末总资产为120万,所有者权益为80万。则该企业的净资产收益率为( )。
A.12.5%
B.18.75%
C.25%
D.37.5%
【答案】B
【解析】净资产收益率也称权益报酬率,强调每单位的所有者权益能够带来的利润,其计算公式为:净资产收益率=净利润/所有者权益=15÷80×100%=18.75%。
8.通常将一定数量的货币在两个时点之间的价值差异称为( )。
A.货币时间差异
B.货币时间价值
C.货币投资价值
D.货币投资差异
【答案】B
【解析】货币时间价值是指货币随着时间的推移而发生的增值。由于货币具有时间价值,即使两笔金额相等的资金,如果发生在不同的时期,其实际价值量也是不相等的。
9.某人希望在5年后取得本利和1万元,用于支付一笔款项。若按单利计算,利率为5%。那么,他现在应存入( )元。
A.8000
B.9000
C.9500
D.9800
【答案】A
【解析】根据单利现值计算公式,5年后取得本利和1万元的现值为(元)。
10.分析两种不同证券表现的联动性的统计量是( )。
A.相关系数
B.方差
C.标准差
D.平均值
【答案】A
【解析】相关系数是从资产回报相关性的角度分析两种不同证券表现的联动性。相关系数的绝对值大小体现两个证券收益率之间相关性的强弱。如果a证券与b证券之间的相关系数绝对值|ρab|比a证券与c证券之间的相关系数绝对值|ρ ac|大,则说明前者之间的相关性比后者之间的相关性强。