——国际比较的方法论
(资料图片)
■刘培林
比较出真知;乱比较难免会出谬知。本文提出国际比较的几个方法论问题,都是笔者的内省,不揣浅陋,野人献曝,写出来请方家指正。
国际比较作为一种归纳方法,基本道理是,一定条件下其他经济体的某些制度、战略、*策起到了某种效果,那么,另一经济体在类似条件下加以借鉴,也应该能起到类似效果;其他经济体呈现出某种共性,那么该共性很可能在另一经济体也表现出来。
为了得到可靠结论,就需要尽可能地控制地理、文化、人口规模、发展阶段、法律传统等因素,以提高可比性。但在公共*策研究中,从国际比较中得到经得住推敲的结论,实在不是一件容易的事。下面是几点体会。
第一,15岁和50岁不可比。同一时间点上不同发展阶段经济体之间的机械比较不可取。这一点很容易理解,但现实当中却不容易避免。
比如,拿中国的服务业比重和美国比,无疑会发现中国服务业比重低很多。于是说中国产业结构不合理、落后。如果分析停留在这里,倒也罢了。倘若继续往下走,得出中国应该出台这样那样的*策以使服务业比重尽快达到美国那样高的水平,就有害无益了。
笔者常常用这样一个例子来说明这种比较是多么不合理。山姆吃馒头,馒头上标着1、2、3三个数字。依次吃下这三个馒头后,饱了。在一旁观察的龙人发现,山姆吃下标号为1和2的馒头,都没有说吃饱;而一吃下去标号为3的馒头就说吃饱了。看起来1号和2号都没用,关键在于吃了第3号馒头。于是龙人拿起自己面前标号为3的馒头吃起来,希望吃下去这个馒头就饱了。这显然是荒谬的比较,在报纸杂志甚至严肃的学术刊物中却并不鲜见。
馒头故事看上去很不靠谱。中美之间发展差距如此之大,明显不可比。那么,人均GDP水平接近的经济体之间,可比性又如何呢?
第二,两个身高1.2米的人,未必都是6岁的孩子。同一时点上人均收入水平相当的经济体,相互比较时也需要谨慎。同一时间点上人均收入相同,虽然在一定程度上表明两个经济体发展阶段类似,但也并不表明一国的经验对另一国具有启示。
按照世界银行的世界发展指数,年中国人均GDP为美元。同年黑山、多美尼加、博茨瓦纳、圣文森特及格瑞纳丁群岛、利比亚、南非和伊拉克,人均GDP稍低于中国,介于美元到美元之间;马尔代夫、圣卢西亚、保加利亚、阿塞拜疆、哥伦比亚、白俄罗斯、格林纳达和土库曼斯坦,人均GDP稍高于中国,介于美元到美元之间。这些经济体人均GDP水平和中国接近,它们的经验是否一定可取?未必。这些经济体有些规模很小,和中国这样体量的经济体的可比性明显比较小。
考虑到这一点,选取规模较大的经济体来看,其经验就可取么?也未必。来看更具体的分析。过去20年中,南非人均GDP年增长速度的算术平均值是1.30%,保加利亚是3.61%,哥伦比亚是2.29%。而中国同期则是8.83%。从寻找促进经济社会进一步发展的*策出发,即使这些经济体年人均GDP水平和中国接近,它们很难为中国未来发展提供可资借鉴的经验。
这背后的道理有两方面。一是各国汇率决定因素非常复杂。二是这些经济体年人均GDP水平,本身就是其制度、战略和*策的结果。如果它们在过去20年中各方面发展得更好的话,它们年的人均GDP水平应该更高。如果说这些国家有什么值得中国吸取的话,应该是它们的教训。
第三,两个身高1.2米、体重23公斤的人,也未必都是6岁的孩子。按购买力平价衡量人均GDP相同的经济体,也未见得完全可比。
购买力平价衡量的人均GDP,在经济体之间横向可比性、跨年纵向可比性、跨国跨年的综合可比性,似乎都更好些。但购买力平价方法在解决了一些问题的同时,其实也带来一些问题。
购买力平价方法的合理性是所谓一价定律,即面包在不同国家的价格应该相同,电脑的价格也应该相同,理发的价格也如是。这听上去很有道理。但购买力平价所要衡量的,不只是一种产品,而是千千万万种产品。于是,该方法采用了一系列令人眼花缭乱的技术手段,根本精神是在国别间取平均值。比如,首先把消费品子类中各具体商品的相对价格取平均值,接下来进一步把各消费品子类支出在总支出中所占比重纳入考虑,进一步取平均值。这种多层次平均的根本目的,是在多种商品的背景下贯彻一价定律。这样做固然有很大价值;但也未必就绝对好于直接用汇率方法衡量的结果。具体来说,在生产者、消费者各自优化选择和市场引导之下,富裕程度不同的经济体之间,居民消费支出中衣食住行等各子类所占支出本就应该不同,各子类内部具体商品的相对价格也本该不同。一旦层层平均之后,实际上会低估富裕经济体货币购买力,高估贫穷经济体货币购买力。
考虑到这些因素,用购买力平价衡量的人均GDP为依据选取比较对象时,要注意三点。一是实际发展水平的差距,可能比购买力平价衡量的人均GDP差距大;可能比汇率方法衡量的人均GDP差距小。二是即使购买力平价衡量的人均GDP相近的经济体之间,经验的可借鉴性未必有多大,原因如前文所述,购买力平价方法衡量的人均GDP数据本身,也仍然是制度、战略和*策的结果。如果制度、战略和*策得当,一些经济体的人均GDP本来可能会更高。三是跨国跨时比较时,同样不能刻舟求剑。比如按照麦迪森的世界经济统计数据,年中国人均GDP水平相当于美国年和年的情形。那这意味着中国应该亦步亦趋地采纳美国那些时期的*策么?显然不是。
第四,西瓜籽和*瓜籽不一样。以两个例子说明这一点。
首先还以服务业比重为例。中国和美国直接进行服务业比重比较,明显不可取。一个看上去更合理的说法是,印度发展阶段比中国还低,可印度服务业比重比中国高,所以中国应该加快发展服务业。这样的比较不无道理,如果体制、*策和相关的人力资本水平改进了,中国服务业比重会比现有水平高。但必须搞明白印度服务业比重高,其实是制造业发展不足的镜像表现而已。考虑到印度服务业对整体经济的带动、在地理空间上的分布、受益人群的分布格局,很难说中国早早形成印度那样的服务业格局,就一定好。事实上,朝鲜由于坚持所谓先**策,*事活动比重大,无疑会导致其服务业比重很高。朝鲜发展阶段比印度还低,那是不是中印都应该像朝鲜那样发展服务业呢?答案不言而喻。
再举一个关于房价的例子。一个流行的说法是,孟买房价和上海一样高。这个说法本身并不太离谱。但笔者到孟买调研之后才理解,这个说法背后的故事并不简单:支撑上海房价的是海量的供和求;而支撑孟买高房价的则是很小的成交量。孟买的常见图景是,一片贫民窟当中立着一个火柴棍似的高楼。这个高楼的单价可能和上海相当,但周边贫民窟的土地拥有者都以这一个高楼的楼面价做参照,确定自己土地的出让价格。不妨做一个思想实验,倘若孟买给新楼盘的供地规模达到上海那么高的话,孟买的房价还会那么高么?
第五,西瓜子、香瓜瓤、*瓜皮凑不出什么可口的瓜来。具体来说,各种*策其实都是嵌套在更复杂的*策体系中的一个环节;在不同国家截取不同的*策,然后拼盘而成*策建议,并不可取。
比如,设想针对提高我国医疗服务水平这个目标,用上述拼盘的逻辑,很可能基于国际比较而给出这样的*策建议:像英国和古巴那样免费医疗;像美国那样把医疗总支出占GDP的比重提高到20%以上;像好多西方国家那样建立私人医生制度;像印度那样仿制专利药品,等等。这些大拼盘的建议,每一条或许都有一定可取之处,但拼盘的方法论有瑕疵。因为某一项具体的*策,实际上有其特定的原因和背景。希望把数学、物理、化学、语文各科状元的成绩都体现到自己孩子身上,愿望良好,但难以实现。更何况,有时候具体*策在作为比较对象的经济体中,本就没有起到非常好的效果。
第六,大烩菜值得吃,但不能因此认为白菜和粉条各自的原味,就都是烩过后的那样雷同。
大烩菜算是一种粗放的做菜方式。而有些看上去精致的数据分析,精神实质却类似于大烩菜这种粗放的做菜方式。比如,有人用二战以来全球所有经济体的平均增速为2%—3%为依据,说中国经济增速有很大概率在短期内回归到全球平均增速水平。
这种说法,就如同把不同发育阶段的人的身高混起来说事一样,不靠谱。人的寿命平均75岁,而长个子这件事基本上在20岁之前就完成了。一个人有75个样本值,其中前20个是身高为一定的正数,比如每年9厘米;而后面的55个样本中身高增速为零甚至为微弱的负数。把75个样本一起加以平均,得到的结果比如说是每年2.4厘米。这看上去是严谨的,这样的计算也不能说没有任何价值,比如,可以用这个平均数,去和火星人一生中身高年均增速进行比较。但是,倘若以75个样本的平均数作依据,指着另一个15岁的地球人说:“年轻人,你身高已经快速增长了15年了,下一年你身高增速有很大概率会回归人体身高增速的平均值,即降低到2.4厘米左右。”这显然不靠谱。
与人的发育阶段的例子类似,二战以来全球各经济体大致有三种类型较分明的增长,第一种是成熟国家,类似于成人,个子不再长了;第二种是还没有起飞,经济低增长,类似于还在婴儿期,个子长得慢;第三种是高速追赶,类似于青春期的小伙子,个子快速长大。当援引国际经验判断一个经济体的增长潜力时,需要首先搞清楚其处在哪个发育阶段。
作为结尾,笔者想说的是,国际比较作为一种归纳方法,本该是一种非常严谨的、科学的东西;但实际上却偏偏有点像艺术一样。拿捏好可比性,需要非常谨慎。笔者的粗浅体会是,应该主要借鉴20—30年前和本国当前发展阶段相近,且在这20—30年内实现较快经济社会发展的经济体的经验。
当然,在做国际比较时,具体问题具体分析的原则,更应该时刻记在心中。
(作者系国务院发展研究中心发展战略和区域经济研究部副部长)