1.2 研究思路与研究方法
1.2.1 研究思路
本书主要遵循“提出问题→特征事实→生成机制→经济后果→政策建议”的整体研究思路,对中国上市公司年报文本信息披露特征进行了系统、全面、深入的研究。具体研究思路如下:首先,提出研究问题。系统梳理国内外有关年报文本信息披露特征和企业同伴效应领域的相关文献,结合中国年报文本信息披露的现实背景,总结仍需进一步研究的方向,明确研究问题。其次,厘清特征事实。在梳理对比各种测量方法的基础上,选择恰当的测量视角和方法,对年报文本信息的特征等关键解释变量进行测量和评价,为后文实证研究提供变量基础。再次,分析生成机制。利用信息和竞争的同伴效应理论,分析年报文本信息披露特征生成机制的同伴效应,提出同伴企业年报文本信息披露特征影响目标企业年报文本信息披露特征的假设,并利用中国上市公司的样本数据进行实证检验。又次,探索经济后果。利用信息和竞争的同伴效应理论以及信息披露溢出效应理论,分析年报文本信息披露特征经济后果的同伴效应,提出同伴企业年报文本信息披露特征具有影响目标企业筹资、投资、经营活动的经济后果的假设,并利用中国上市公司的样本数据进行实证检验。最后,提出政策建议。对理论分析和实证研究的结论进行总结,进而在上述结论基础上提出相应的政策建议,并对进一步的研究方向进行展望。
1.2.2 研究方法
研究方法的选择取决于研究主题、内容和范式。本书将综合运用规范研究和实证研究范式,选择恰当的研究方法对年报文本信息披露特征的多维测量、生成机制与经济后果进行分析,以保证研究过程和研究结论的科学性、严谨性。具体研究过程中采用方法如下:
(1)大数据处理方法。上市公司年报文本近100GB,数据采集、清洗、存储的工作量巨大,利用大数据技术可以实现上述工作的计算机自动化处理。利用网络爬虫实现数据自动采集,利用OCR技术实现文本语料自动提取,利用数据分割和SQL数据库方法,对文本数据进行清洗和存储。
(2)自然语言处理和文本挖掘方法。利用中文分词算法对年报文本信息进行分词;利用文本去重、机械压缩、短句删除等技术,对年报文本信息进行清洗,建立公司年报文本信息语料数据库,利用词典法、有监督和无监督的机器学习算法构建年报文本信息语调、可读性等特征指标。
(3)实证研究方法。本书综合利用多种实证研究方法检验理论假设。具体为,利用均值线性回归模型检验同伴效应的生成机制和经济后果,利用更换核心变量测量、聚类稳健标准误等方法进行稳健性检验,利用滞后一期解释变量、工具变量法和面板数据固定效应模型等方法克服内生性问题。
此外,本书还综合使用文献研究、实地调研、案例分析、比较研究等多种方法解决问题提出、理论分析、政策分析等问题,以期得到科学的研究结论。