数据可视化基础与应用
上QQ阅读APP看书,第一时间看更新

第1章 认识数据可视化

导读案例 南丁格尔玫瑰图

南丁格尔玫瑰图又名鸡冠花图或极坐标区域图,是一种圆形的直方图,由弗罗伦斯·南丁格尔发明。

南丁格尔玫瑰图将柱形图转化为更美观的饼图形式,是极坐标化的柱图。不同于饼图使用角度表示数值或占比,南丁格尔玫瑰图使用扇形的半径表示数据的大小,各扇形的角度则保持一致。南丁格尔玫瑰图如图1-1所示。

图1-1 南丁格尔玫瑰图

注:图中数字的单位为人。

南丁格尔玫瑰图的发明者——弗罗伦斯·南丁格尔是一名女护士。19世纪50年代,英国、法国、土耳其和俄罗斯爆发了克里米亚战争。南丁格尔主动申请担任战地护士。当时的医院卫生条件极差,伤兵死亡率高达42%,直到1855年卫生委员会的相关负责人来到医院改善整体的卫生环境后,伤兵的死亡率才降至2.5%。南丁格尔注意到这件事,认为政府应该改善战地医院的卫生环境,这样才能拯救更多的生命。南丁格尔女士肖像如图1-2所示。

图1-2 南丁格尔女士肖像

出于人们对资料统计不重视的忧虑,她设计出一种色彩缤纷的图表,让数据能够更让人印象深刻。图1-3是著名的南丁格尔玫瑰图,图中蓝色(浅灰色)区域表示死于感染的士兵数量,红色(白色)区域表示死于战场重伤的士兵数量,深色区域表示死于其他原因的士兵数量。图1-3中有如下两个非常明显的特征。

① 两幅图中蓝色(浅灰色)区域的面积明显大于其他颜色区域的面积。这意味着大部分的士兵伤亡不是因为战争造成的,而是在恶劣的卫生环境下感染的。

② 图1-3(a)中的扇形面积远小于图1-3(b)中的扇形面积。这说明卫生委员到达后(1855年3月),死亡人数明显下降,证明卫生环境的改善带来的效果。

图1-3 南丁格尔玫瑰图示例

注:本书采用黑白印刷,彩图请参考本书提供的相关资料。

图1-3的英文版图片出现在南丁格尔游说英国政府加强公众医疗卫生建设和相关投入的文件里。这让政府官员了解到改善医院的卫生环境可以显著地降低英军的死亡率,因此她的医疗改良提案得以通过。该提案挽救了众多生命。

南丁格尔玫瑰图适合比较大小相近的数值,因为图表会将数据的比例夸大,又因圆形具有周期的特性,因此也适合用来表示周期内的时间概念。南丁格尔玫瑰图的优势与缺点如下。

优势:较为直观地对比各系列的数值差异。

缺点:因为半径和面积是平方关系,因而会将数据的比例夸大,不适用于差异过大的数据。

知识准备 什么是数据可视化