企业的社保负担及其影响评估
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.5 中国工业企业数据和全国税收调查数据的对比分析

全国税收调查数据在现有的研究中还使用得较少,因此我们先对全国税收调查数据进行分析和描述性统计。全国税收调查数据由财政部和税务总局按照分层随机抽样的方法选取企业填报。全国税收调查数据包含的样本企业数量众多,覆盖各种类型的增值税纳税人及非增值税纳税人,而且既包含重点调查企业(规模较大、纳税金额较多的企业),又有大量中小企业(抽样调查但不是重点调查的企业),因此具有较好的代表性。

与文献中应用较多的中国工业企业数据库相比,全国税收调查数据有以下三方面的优势。第一,除企业基本信息和财务数据外,全国税收调查数据能较好地记录企业的税费缴纳情况,并且税务部门统计的数据更加翔实和准确,这为研究企业的社会保险的缴纳情况提供了更好的数据支撑。第二,与中国工业企业数据库主要包含规模以上企业不同,全国税收调查数据包含为数众多的中小企业。中小企业是中国经济最活跃的组成部分,基于规模以上工业企业的研究往往无法充分反映中小企业的情况,全国税收调查数据库为弥补这一研究上的缺陷提供了丰富的数据资料(数据中包含了大量服务业企业及个体户)。第三,目前研究者所用的中国工业企业数据库主要局限于2008年之前的数据,对金融危机以来的宏观经济形势和企业生产经营行为鲜有涉及。然而,金融危机之后,中国经济开始步入“新常态”,经济增长阶段转换和结构调整同时发生,经济特征发生了结构性转变,基于中国工业企业数据库得出的研究结论可能难以适用于当前的中国经济。全国税收调查数据库跨越了金融危机之后的时间段,可以对学术界和政策层关心的一系列经济问题给出有力的证据。

全国税收调查数据的时间跨度为2007年到2011年,一共5年的时间。数据中的企业来自除港澳台以外的全国31个省、自治区、直辖市,企业类型既有大中型的国有企业和集体企业,也包括数量众多的中小民营企业,并且这些企业分布在21个行业大类、\1\221个国民经济行业小类。此外,我们剔除了相关的缺漏值和异常值。全国税收调查数据包含了我们分析所需的主要变量,其中企业计提的全年工资奖金总额、基本养老保险费等其他社保指标可以帮助分析企业的社保缴纳情况。实证所使用的数据是非平衡的面板数据,一共有280万左右的样本,其中2007年有34\1\248家企业,2008年有46\1\235家企业,2009年有65\1\290家企业,2010年有69\1\270家企业,2011年有65\1\235家企业。

全国税收调查数据与中国工业企业数据最大的差异在于企业的规模和行业分布的不同。相较于中国工业企业数据,全国税收调查数据包括了大量的非国有企业中的小规模企业,占比约60%此比例是指非国有企业中小规模企业的占比。,并且包含了众多的非工业企业,主要是服务业企业,其占比为49%,行业的分布情况如图1-1所示。

图1-1 中国工业企业数据与全国税收调查数据行业分布