2018 年中国出生人口有多少? - chenqin数据帝

统计统计。

img

从六年前在知乎回答第一个人口相关问题开始,我就一直强调一件事:生育率是很难通过外力改变的,即便是计划生育这样的强力政策,对生育率的改变也很有限。

正因为难以改变,才会有着极强的惯性。就像通过几颗颗星球短时期的运行轨迹,天文学家就能计算出它几十年后的相对位置一样,用十年前的人口数据,我们就能八九不离十地预计到今天的出生人口数字。我2012年时和导师写过一篇简单的文章,2013年发表在《金融研究》上,使用了2010年人口普查数据。当时的预测结果是中国人口在2024年会达到上限14.1亿,然后开始下降。具体到每一年来看,我们的模型认为到中国人口在2017年是13.89亿(实际值13.90亿,见中华人民共和国2017年国民经济和社会发展统计公报),2018年会达到13.94亿。

img

不过,在那篇6年前发表的文章里,我们使用的人口模型非常简陋,他高估了一孩数量,又没有预计到随之而来的二孩政策带来的二孩增加,错进错出,碰巧和当前的许多结果十分接近。在修正模型后,不考虑存量二孩的出生,我们的预测是2018年的出生人口在1452到1474万人之间。如果考虑到存量二孩生育意愿的持续释放,最终的出生人口必定要多于1474万人。那么,2018年大约会释放多少存量二孩生育意愿?做一个简单的反事实计算,将理论出生人口和实际出生人口作比较,可以发现2016年和2017年分别因全面二孩政策增加了了260万和220万出生人口。如果2018年全面二孩增加的人口能达到100万的量级,2018年的出生人口应当在1550万到1580万左右。因此,在2018年出生人口数字公布之前10天,我在这里先立一个flag,2018年出生人口绝不可能低于1500万。

再来看第二个问题——为什么这几年的出生人口开始快速下降?从1786万人,到1723万,到1550万到1580万上下,是什么原因,让我们经历了2016年的本世纪出生人口的最高峰之后,立刻迎来本世纪以来出生人口的最低谷? 许多人想用房价上升,或者是生存压力的变化来解释这个现象。这些东西能影响生育意愿吗?能。但会有多大影响?别忘了,1959年,大饥荒开始的第一年,出生人口下降幅度也就20%多。大饥荒可以说是一个突发事件,那么我们就要问两个问题——1,这两年的房价,是突发上涨,远超2009年或者2016年的上涨速度了吗?2,这两年的生存压力,是突发上升,远超1995到1997年的千万人大下岗,或者2008年的全球金融危机了吗?下图列出了从1990年到2017年的历年出生率,在这张图上,试试看把所有重要的所有大事件往线上装,你马上就能发现,比起出生率变动的大趋势,什么经济危机、房价上升,都是连浪花都激不起一朵的小插曲罢了。img

但如果排除了房价或者生存压力的影响,还有哪些原因导致了生育数量在这几年大幅度下降呢?主要有三个。第一,育龄女性总人数下降,且生育年龄处于峰值的女性逐渐减少,这个因素虽然难以解释短期生育波动,但却是导致生育长期下降的根本原因,见下图:img

以生育高峰22到30岁为例,2018年22岁的女性人口743万,30岁人口1219万,每推移一年,生育高峰的女性便减少500万人。且育龄女性峰值——1990年出生的女性人口——开始逐渐远离生育率峰值(26岁),生育数量减少也就成了必然。 第二,存量二孩意愿在2016和2017年快速释放之后,今年已经没有多少二孩生育意愿可供实现,他减少了二孩出生数量。在之前的文章中,我们计算了全面二孩政策可能会释放的生育意愿,按照2010年人口普查数字计算,可能会有1000万二孩生育意愿将被释放出来。全面放开二孩会出现哪些社会现象?www.zhihu.com但这个存量数字可能会随着时间的推移缩小,甚至逐渐消除。2013年和2015年时,我国各做了一次生育意愿的追踪调查,做成四格表的话见下图:在2013年想生二孩的一孩家庭,到了2015年再问,四成还想生(22.6/54.1),近六成改口不想生了(31.5/54.1)。img

那么,1000万左右的二孩生育意愿,扣除这几年内被消除的意愿,再减去2016和2017年分别已经实现的260万和220万,还剩多少呢?我估计大约在100万左右,这是我唯一不确定的数字,到底是过于乐观还是过于悲观,看10天之后的统计公报结果了。 第三,也是最容易让人忽略的一点,是女性教育结构的变化,他减少了一孩出生数量。几乎所有对人口进行预测的文章,都忽略了这点。可如果忽略了这一点,就没办法理解许多数据的「异常」变化。当单独二孩、全面二孩等政策放开时,二孩数量先上升再下降是很容易理解的。可是,为什么一孩数量却会单调下降得如此之快,从2010年的1000万人左右,下降到2017年的724万人?这件导致一孩数量大幅度下降的事件并没有发生在现在,而是发生在1990到1995年。先看下图:img

上图数据来自2015年1%人口抽样调查表4-1,呈现了不同出生年份和性别的人口在2015年时获得本科教育的概率。上图我们可以看到三个阶段一,1980年以前出生的人口,无论是男性(蓝线)还是女性(橙线),能获得大学教育的比例都在10%以下。而且女性获得本科教育的比例也总是比男性更低。二,从1980年开始到1990年,男性和女性能够获得本科教育的比例进入停滞期,仅从10%上升到12%。这批人口在1998到2008年左右进入大学,在此期间虽然有大幅度的扩招,但仍然赶不上这个阶段的大规模人口出生增长——从每年1900万人,上升到每年2800万人。在这个时间段内,1986年出生的女性,第一次在获得本科教育的概率上超过了男性。三,从1991年开始,一切都改变了。仅仅5年,1995年出生的女性获得本科教育的概率就上升到33%,且已经开始甩开同龄男性仅为26%的本科教育概率。从最新数据看,1998年出生的女性获得本科教育的概率已经稳定在35%左右。5年,从12%增加到33%,五分之一的女性由于晚生了五年获得了本科教育,他们原来可能获得哪一类教育?初中。当然不是直接将初中生变成本科生,而是一个逐级递进的过程,更多初中女生能考上高中,更多初中女生能考上大学。img

从上图可以看到,1990年到1995年出生的人口,女性的初中学历占比从42%下降到20%,下降了整整22%。而男性从41%下降到26%,仅下降15%。这五年内出生的女生,在受教育程度上,开始甩开男生。除此之外,女性获得大专教育的比例略有上升,获得高中教育的比例略有下降,但都没有本科和初中的此消彼长如此明显。现在,假设其他教育情况分布情况不变,只是让其中五分之一的女性从初中学历变成本科学历,在生育上会发生什么变化?img上图是2010年人口普查时初中教育水平和本科教育水平女性的分年龄生育率。可以看到,两者差异非常大。第一个差异是两条曲线与x轴围成的面积,他代表一个代表性女性在整个育龄可能会生育的孩子数量,初中学历的女性平均一生会生育1.75个孩子,而本科学历的女性一生只会生育1.09个孩子。第二个差异是她们的生育开始时间和达到峰值的时间——从16到26岁的阶段,初中学历的女性的出生率都要高于本科学历女性,这个阶段两者生育的数量达到了0.8个孩子的差异。将这个差异放在1990到1995年出生的女性人口上(这几年的女性出生人数在900到1300万左右,为了计算方便使用1000万),我们可以算出,由于220万女性从只能上初中变成了有机会上大学,1990年和1995年出生的女性人口,在她们26岁以前,生育的数量就已经相差176万。img上图是两种不同假设下的分年度一孩出生数量,蓝线的假设是,1990年之后出生的女性的教育结构完全和1990年相同。而橙线使用真实的教育结构给1990年之后的女性赋值。可以看到,两条线的差异从2010年开始逐渐扩大,在2016年超过了200万,且在2017年和2018年达到了峰值,约为220万。为什么我们会看到一孩的出生量下降如此快?1990到1995年出生的女性截然不同的教育结构也许就是解答的钥匙。因此,若我们仅仅去观察育龄女性总体的平均生育率变化,比如用2010年的分年龄生育率固定地推算每年的出生人口,和真实出生的人口数值当然会相差越来越大,于是让很多研究者为了去解释这个现象,就开始用房价变化,用生存压力去解释这个所谓的「生育率降低」。但当我们考虑到教育结构在1990到1995年出生的女性人口之间出现突变后,真实的数据就能被完美地拟合出来。根本不需要每组人口的生育率进行任何变化,当然也更不需要房价和生存压力来进行多余的解释了。最后,还剩下最后两个问题——一,为什么1991年之后出生的人口的教育结构出现了这样大的变化?其直接原因当然是91年之后的出生率大幅度降低,在这个答案的第一张图表中就能看到。而其背后又有两个原因,第一是大饥荒结束后,62年出生的一波婴儿潮的生育逐渐结束,而70年代初的计划生育开始后逐渐减少的人口进入生育年龄,这也带来了一波育龄女性的大幅度降低。第二则是由于1990年后,严格一孩的计划生育进入当地政府一票否决的阶段,计划生育比之前抓得更紧。这几个因素一道起作用,使得91年之后的出生人口大幅度降低,并在2010年之后获得了更好的教育。二,为什么女性受到的教育改善远高于男性?这更容易理解,我们看2015年的《中国教育统计年鉴》其中的第7页,各级各类学校女学生数,他的本科生中,男生数量比女生数量是88:100。img

而根据2015年1%人口抽样调查的4-1,2016年对应的18到22岁人口中,男性获得本科的概率是女性获得本科概率的76%。为什么会有这样的差异?考虑一个简单的公式\frac{男性本科}{男性人口}/ \frac{女性本科}{女性人口}=76\%\ \frac{男性本科}{女性本科}=88\%

用下式除以上式,可得\frac{男性人口}{女性人口}=\frac{88\%}{76\%}=\frac{116}{100}\

所以你看,人口学就是这样,很没意思,又很有意思。没意思是说,人口不像经济,当你去预测未来十年的人口变化时,你用一个非常简单的模型就可以得到很好的结果,完全不需要考虑什么房价啦生存压力啦金融危机啦,只要你不漏掉重要的人口学变量,比如不同生育组别的结构,就一定能得到正确的趋势。而有意思则是说。要解释现在的人口变化,你常常可以在过去五十年的更重大的事件里找到原因。许多当年不经意种下的种子——可能是好种子,也可能是坏种子——不知道在什么时候,在什么地方就盛开了出人意料的花。

转载信息


理解 K8S 的设计精髓之 list-watch - koala bear 科幻小说UI界面