2.3 研究方法和数据说明
现实中,增值税税收优惠是否具有上述理论分析发现的效益,有待实证检验。然而,开展实证检验的前提条件是充分掌握增值税税收优惠的基础信息。中国有关部门已完成税收优惠(也称税式支出)的分类体系(包括税收优惠政策的政策目标、受益纳税人所在行业和受益纳税人所有权属性等)和金额测算方法等文件的编制,并形成了专门的税收优惠测算方法指引。本章基于该指引确定的计算公式,利用从2007年全国税收调查数据库中随机抽取的5000个纳税人(主要是企业)的相关数据,测算增值税税收优惠的规模,据此分析其结构和效益,以揭示中国增值税税收优惠的真实状况,具体的研究方法和数据说明如下。
2.3.1 研究方法与步骤
1.将《中国税式支出测算方法指引》与全国税收调查对应起来
通过这一步,使得来自全国税收调查的抽样样本能够对应到《中国税式支出测算方法指引》里的具体政策。我们发现5000个纳税人可以分为以下3类:第一,能够对应到具体税收优惠政策的纳税人;第二,享受了某项优惠政策,但无法明确对应到具体税收优惠政策的纳税人;第三,明确未享受优惠政策的纳税人。其中,前两类纳税人作为下一步测算税收优惠金额的样本,而第三类纳税人不予考虑。
2.核实数据准确性
样本数据来自财税部门每年一度的全国税收调查,由各地财税机关负责具体的数据调查工作,并采取网上直报的方式汇总数据。由于有财税机关的管理与监督,全国税收调查的数据质量是有保障的。在后续分析使用的5000个纳税人样本里,既有大中型制造业企业,也有中小规模的服务业企业,还有一定数量的个体经营者,具有较好的代表性。为了谨慎起见,本章仍对样本的数据质量进行了检查,通过对主要变量之间内在的逻辑关系进行检查,未发现明显的数据错误。但是,我们发现样本数据存在一个不容忽视的问题:虽然部分纳税人报告了享受税收优惠政策的信息(即提供了税收优惠代码),但后续的税收减免数据却漏填了(即税收减免的相关变量数据空缺)。这会影响量化分析结果的精度。
3.克服数据漏填问题
为了克服上述问题,尽可能提高研究结论的准确性,本章使用极大似然方法和分位数回归估计等计量模型估计了纳税人的税收优惠率,然后利用估计出来的税收优惠率来估算漏填的税收优惠金额。计量模型如下:
(2—9)式是极大似然估计方法使用的模型,terαtioi为第i个样本的税收优惠率(=该纳税人增值税的税收优惠金额/该纳税人缴纳的增值税税款);L(θ)为似然函数;θ为纳税人享受税收优惠政策的概率;为θ的取值范围(处于0~1的实数);Zi为纳税人特征变量(包括行业类别、所有权属性、增值税缴纳方式、主营业务收入、所处地区等)。(2—10)式是分位数回归估计使用的模型,terαtioi和Zi的含义与(2—9)式相同;Qτ(terαtioi | Zi)为给定纳税人特征(即给定Zi)的情况下,τ分位点的税收优惠率(τ分别取0.25、0.5和0.75);α为常数项;β为回归系数向量;ui为随机扰动项。
使用极大似然估计方法需要先估计出使似然函数L(θ)达到最大值的参数θ,然后再用估计出来的θ估算漏填的税收优惠金额;而使用分位数回归估计方法需要先估计出回归系数,然后将漏填数据纳税人的特征变量的数值代入,再估算出这些纳税人的税收优惠金额。我们将采用上述两种方法估算出来的税收优惠金额的均值作为漏填金额的近似值。
4.测算纳税人享受的增值税税收优惠金额
根据有关部门编制的《中国税式支出测算方法指引》里的计算原理,利用全国税收调查提供的相关变量,确定每个抽样纳税人增值税税收优惠金额的具体计算公式。[6] 为了提高测算结果的可信度,本章使用了以下3种口径:
第一种是宽口径,即假定填报了优惠政策代码但无法明确对应到税收优惠政策的那些纳税人,实际上享受了某种税收优惠政策,只是由于疏忽未能准确填写政策优惠代码。此时,有效样本的数量是5000个,且在计算税收优惠规模时,须把上述纳税人的税收优惠金额考虑在内。
第二种是窄口径,即假定上述纳税人实际上未享受任何税收优惠政策,而只是误填了优惠政策代码。此时,有效样本的数量仍是5000个,但在计算税收优惠规模时,将上述纳税人的税收优惠金额视为0。
第三种是折中口径,即假定上述纳税人不能提供有效信息。此时,有效样本的数量不再是5000个,而是3002个。[7]
利用抽样样本的测算结果,结合这5000个纳税人以及全国税收调查总库的样本代表性,推算中国的增值税税收优惠总规模。
5.税收优惠的结构分析
利用税收优惠金额的测算结果,从政策目标、行业类别和所有权属性等多个维度,对增值税的税收优惠进行结构分析,以明确增值税税收优惠的用途和受惠对象。
6.税收优惠的效益分析
最后,使用3E方法(equity,efficiency和easiness)[毛捷(2011)],从公平性、经济社会效益和管理难易程度等角度研究两项受益面广、金额大的增值税优惠政策的效益。
2.3.2 数据说明
样本数据的具体说明如下:
1.样本数据的整体情况
在5000个样本里,剔除不享受任何增值税优惠政策和享受的优惠政策明确不属于税收优惠范畴的纳税人,共有4531个样本可用于计算增值税税收优惠金额。其中,可与《中国税式支出测算方法指引》里具体政策明确对应起来的样本有2533个,涉及的增值税税收优惠政策共计44项。上述样本覆盖了56个大类、361个小类的行业(按GB/T4754—2002标准),包括1247家国有企业(国有独资公司、国有改组的股份合作企业、国有联营企业、国有与集体联营企业以及其他国有企业)、193家集体企业(集体改组的股份合作企业、集体联营企业以及其他集体企业)、1667家有限责任公司(非上市的股份有限公司、上市的股份有限公司以及其他有限责任公司等)、675家“三资”企业(港澳台商经营企业、港澳台商投资股份有限公司、中外合作经营企业、中外合资经营企业、外商投资股份有限公司以及外商独资企业)、732家私营企业(私营独资企业、私营股份有限公司、私营合伙企业以及私营有限责任公司)、7家个体经营户以及10家其他企业。样本享受的增值税税收优惠政策包含了支持“三农”等15类政策目标。
2.样本代表性
根据表2—1,以主营业务收入为准,2007年全国税收调查(共计42.4万家企业)的样本代表性为56.28%,即代表了全国一半以上的纳税人。将主营业务收入分为10层,被调查纳税人在每一层的分布情况见表2—2。根据表2—2,大部分纳税人是中小企业或个体经营户(如处于第1层的369229家),也有部分大型企业(如处于第10层的1001家)。后续分析使用的5000个样本是从每一层的被调查纳税人里按大约1.2%的比例随机抽取的。
表2—1 2007年全国税收调查数据的样本代表性 单位:亿元
表2—2 2007年全国税收调查数据分层信息