统计学思维:如何利用数据分析提高企业绩效
上QQ阅读APP看书,第一时间看更新

数据汇总方法

当我们收集到所有客观性数据和主观性数据后,接下来要做的就是将这些数据汇总成一张总表,一家企业占一行,同时确保每家企业的每个项目(列)中都没有数据缺失。

最常见的表格形式为:第一行是项目名称,第二行开始输入数据。从左往右,第一列是企业代码(上市企业代码或帝国数据银行用的企业代码等),第二列是企业名称,第三列是代表“赚钱程度”的总资产收益率,第四列及之后是可能影响到企业收益性的各种解释变量(如表1-6所示)。

表1-6 数据汇总的表格示例

如果你发现有些单元格中的信息是怎么也没法收集和录入的,那么在对整体分析影响不大的情况下,你可以选择将含有这一项目的企业从分析对象中剔除。又或者,当这一列是无法用数字衡量的定性值(如所属行业的细分类等)时,你可以尝试设置“无匹配值”或“其他”等新分类;当这一列是定量值时,你可以暂时取其他企业的平均值或中间值(五级量表法的话就取第三级)作为替代。这种处理方法比较现实可行。

如果大家想进一步了解上述处理方法存在的问题或现代统计学理论与方法,那么推荐大家去读读《不完整数据的统计分析》(岩崎学著,经济学人出版)或《缺失数据的统计科学》(高井启二等著,岩波书店出版)这两本书。

那么,究竟是哪种企业属性或哪类竞争资源左右了企业收益?收集完数据后,我们终于可以开始统计分析之旅,找寻这一问题的答案了。