别中伯克森悖论的“招”:从企业规模之争谈起

2021-04-19 14:53:00 来源:姚耀军澎湃新闻

“船大压风浪”,但“船小好调头”。就经济效益而言,究竟是大企业更好还是小企业更好?学术界对此并无定论。总结起来,主要存在如下两种观点:

观点一认为,大企业的经济效益更好。其理论基础,就是所谓的“规模经济”:随着企业规模的扩大,先进设备得以应用,专业分工更加明晰,分摊到每个产品上的固定成本越来越少,这些因素均会导致产品平均成本下降。

观点二认为,小企业的经济效益更好。其理论基础自然是所谓的“规模不经济”:随着企业规模的扩大,管理层次增多,需引入更多的激励与监督机制,结果不仅增加了管理费用,而且导致企业决策变得更迟缓。

截然相反的两种观点孰对孰错?显然要靠证据说话。最近,笔者评阅了一篇研究企业规模与经济效益关系的学术论文。基于某家商业银行历年的贷款客户数据,论文作者发现:企业规模越大,经济效益越低,两者呈现出负相关关系。这一研究结果被作者冠为“企业经济效益的‘规模诅咒’”,令人印象深刻。

那么,“规模诅咒”的研究结果是否很“靠谱”呢?鉴于样本数据量相当大,答案似乎是肯定的。但笔者却认为,此研究结果或许只是一个统计学谬误。理由是,即便企业规模与经济效益在理论上没有任何关系,基于作者所利用的样本数据,我们仍有很大机会观察到,两者将呈现出负相关关系。

为便于进行具体的解释,在此我们不妨设想这样一种场景:一个商业银行依据两种条件向企业授信,其中条件一是企业经济效益好,条件二是企业能够提供足够多的抵押品,而企业要获得贷款,须至少满足两个条件之一。

样本数据中的企业均为银行的贷款客户,根据上述场景就意味着:这些企业要么经济效益好,要么具有较大规模从而能够提供足够多的抵押品,要么既具有好的经济效益也具有较大的规模。

现在,我们首先考察样本数据中的小规模企业。既然有资格获得贷款,这些小规模企业的经济效益一定不错。我们再考察样本数据中的大规模企业。假设企业规模与经济效益在理论上无任何关系,那么平均而言,这些大规模企业的经济效益会处于中等水平。当然,根据上述银行授信条件,大规模企业的经济效益无论处于何种水平,均不会影响这些企业获得银行授信。

样本数据中的小规模企业具有好的经济效益,而大规模企业的经济效益平均而言却处于中等水平。因此,统计结果将显示:企业规模越大,经济效益通常越低。然而,这一负相关关系是虚假的——不要忘了,我们已经假设,企业规模与经济效益在理论上无任何关系!

上述统计结果,其实属于一个被称为“伯克森悖论”的统计学谬误。此悖论的产生机制其实很简单,那就是:两个事件相互独立,但若这两个独立事件会产生共同结果,则给定共同结果,这两个事件就不再相互独立了。

例如,我们假定“天下雨”与“洒水车经过”是两个独立事件,而这两个事件会产生共同结果:马路湿了。现在给定“马路湿了”,那么洒水车未经过就意味着天下雨了。反之亦然,天未下雨就意味着洒水车经过了。

在经济效益好的企业或者大规模企业才能获得贷款的例子中,企业经济效益好与企业规模大会产生共同结果:被银行授信。以银行的贷款客户数据为样本,则相当于给定了“被银行授信”这一共同结果。此时,企业具有好的经济效益与企业具有较大规模这两个事件,即便在理论上是相互独立的,我们仍会从贷款客户数据中发现两者具有关联性。

“伯克森悖论”最早起源于生物统计学家约瑟夫·伯克森在1946年的发现。工作于美国梅奥诊所的伯克森,对医院里的患者进行统计分析,结果发现:在患有糖尿病的人群中,同时患有胆囊炎的人占比较少;在未患糖尿病的人群中,患有胆囊炎的人占比较高。这似乎意味着,患上糖尿病可让病人免受胆囊炎的折磨,但从医学原理上看,这完全是无稽之谈。

伯克森敏锐地意识到,他遭遇了统计学谬误。为便于理解谬误何以产生,我们不妨设想世上只有糖尿病与胆囊炎这两种疾病。众所周知,患者并不一定会去医院看医生。但若分析对象是医院里的患者,则相当于给定了“患者去医院”这一共同结果。于是我们可推断:若患者未患糖尿病,则一定患有胆囊炎;若患者未患胆囊炎,则一定患有糖尿病。因此,即便这两种疾病在医学上毫无关系,但就医院里的患者而言,两种疾病看起来是存在关联的。

当然,世上并非只有糖尿病与胆囊炎这两种疾病,故基于对医院里患者的观察,我们仅能获得一个统计结论:糖尿病的患病率越高,胆囊炎的患病率通常越低。在医院里的患者身上,两种疾病的患病率呈现出负相关关系,当然这只是一种虚假的关系。

具有启发性的是,伯克森悖论可以解释不少日常生活现象。例如,约会中的女生经常抱怨,帅哥往往高冷,而热情有余的男生往往颜值不咋地。基于伯克森悖论的一个解释是:只要女神们定下的约会条件是,对方要么是帅哥,要么是暖男,最好既帅又暖,那么给定“已经与她们约会”这一共同结果,她们就会观察到,男生颜值越高,通常显得越高冷,即便男生的颜值高低与其是否热情本不相干。

再如,教育经济学研究已经表明,良好的家庭经济条件有利于学生取得好成绩。然而,在观察留学生这类群体时,我们经常发现“寒门出贵子”,亦即学生的家庭经济条件与其成绩往往负相关。如何解释这种现象呢?我们知道,家庭经济条件不好的学生能出国留学,多半凭着成绩好能申请到奖学金。对于那些家庭经济条件好的学生,即使成绩不太好,但只要愿意承担昂贵的学费,他们也能出国留学。根据伯克森悖论,一旦给定“已经留学”这一共同结果,我们就会在符合共同结果的群体中,亦即留学生群体中,观察到家庭经济条件较差的学生通常具有较好成绩这种现象。

还有,在接触一些公司的员工后,我们经常产生这样的印象:“技术男”往往缺乏社交能力,而社交能力强者往往在专业技术能力上表现欠佳。基于伯克森悖论的一个解释是,即便一个人的专业技术能力与社交能力在理论上没有任何关系,但若专业技术能力强与社交能力强是公司招聘员工的两个条件,而成功的应聘者至少须满足两个条件之一,则基于对公司员工的观察,我们仍会发现,一个人的专业技术能力与社交能力显得难以两全。

最后,让我们回到笔者所评阅的以“规模诅咒”为主题的这篇实证研究论文。从根源上看,这份研究之所以陷入了伯克森悖论,是因为作者利用了一个受到限制的样本。具体而言,那些规模较小同时经济效益差的企业,已被银行贷款客户数据系统性地遗漏了。实际上,任何有关伯克森悖论的现实例子,都可归因为观察结论来自于一个受到限制的样本。例如,样本或许遗漏了未去医院的患者、未入女神“法眼”的男生、未出国留学的学生、未在公司上班的人,等等。

伯克森悖论表明,对一个受到限制的样本进行观察,很容易以偏概全,产生误导性结论。因此,无论是在学术研究还是在日常生活中,我们都应警惕“眼见为实”的心态,要多想一想那些我们未看到但确实有可能发生的事情,以免中伯克森悖论的“招”。

(作者姚耀军为浙江工商大学金融学院教授)

}