中国人口发展趋势的数学模型

 摘要:


本文针对预测中国人口的增长,关键是搜索出各年的数据,并且按中国实际的特殊国情,建立和应用国内国际上的人口变化模式进行拟合和预测。

在城镇化模型一中,我们用了简约模型,根据近二十年来的城镇化变化趋势,经过分析后可知其增长呈近似线性增长,因此为从简单入手,首先进行了线性拟合。

由此线性方程预测到的未来城镇化如下:

由于城镇化水平是不可能达到100%的,故其不可能是一直线性递增,所以我们据此进行了城镇化模型二的建立,模型二是根据网上搜索到的资料研究得出的数学模型:‘S’型增长模型,此模型对近期预测一般,但对较长期的预测较好。模型一的优点是对短期预测较好,而模型二的优点是对长期预测较好,而它们的缺点是依赖历史数据预测未来,而对其它因素考虑不多。

 人口老龄化模型是应用统计方法,根据对六十年前的人口自然增长的分析,判断未来六十年人口的老龄化会呈大致的阻滞增长,因此应用了国际上的人口阻滞增长模型,根据已有数据,求解出阻滞函数。该模型对现实也有较好的拟合作用,因此对一定时期我国的老龄化增长趋势有较好的预测作用。

 为了方便,我们对性别比变化趋势的研究是研究女性占总人口的比重的,因为求得女性人口占总人口的比重后也就可以求出整体的性别比了。我们应用的模型是离散形式的模型,以便于用计算机进行数值分析计算和模拟,同时也有很好的移植性。经过计算机的拟合后,我们得到一条二次函数曲线,由于是用计算机进行数值模拟的,并且忽略了其它影响的因素,因此它对短期的预测较好,而对长期的预测则很可能不是很理想了。


 关键词:线性拟合、最小二乘法、‘S’曲线、阻滞、阻滞曲线、数值拟合


问题重述

中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。根据已有数据,运用数学建模的方法,对中国人口做出分析和预测是一个重要问题。

近年来中国的人口发展出现了一些新的特点,例如,出生人口性别比持续升高、老龄化进程加速,以及乡村人口城镇化等因素,这些都影响着中国人口的增长。

 问题一:搜索相关文献和数据,用数学模型方法分析近年来中国人口在出生性别比、老龄化和城镇化三个方面的变化趋势;

问题二:从中国的实际情况和人口增长的特点出发,应用已有的数学模型,或自己建立数学模型,对于中国人口的性别构成、老龄化程度和城镇化水平,从2010年至2050年每隔十年的发展趋势做出预测。

问题一分析:

一、搜索到的数据:

1、城镇化的研究:

(一)、在网上搜索到如下数据: 

年份(x) 城镇化百分比(y) 年份(x) 城镇化百分比(y)
1985 23.71 1996 29.37
1986 24.52 1997 29.92
1987 25.32 1998 30.4
1988 25.81 1999 30.89
1989 26.21 2000 36.22
1990 26.41 2001 37
1991 26.37 2002 39.1
1992 27.63 2003 40.5
1993 28.14 2004 41.6
1994 28.62 2005 43
1995 29.04 2006 43.9

由上面的数据用Excel绘得下图:

中国城镇化的逐年增长率.png

(二)、数据分析:由图像可知近年来中国城镇化水平逐年增大,而且进入二十二世纪以后的增速明显比九十年代的增速要大。由图像可知城镇化百分比与年份的关系大致呈线性关系。

(三)、趋势分析:结合中国实际,由于中国经济会持续增长,农民工不断涌入城市,所以中国的城镇化在很长的一段时间内都会继续增长。

 

2、人口老龄化的研究:

一)、在网上搜索到的数据如下:

年份 老年人占总人口的百分比
1980 4.7
1985 5.2
1990 5.57
1995 6.56
2000 7.96
2003 10
2005 11.2

1、中国六十年前的自然增长率:

年份 中国自然增长率千分比 年份 中国自然增长率千分比
1950 19 1980 11.92
1953 23 1982 15.68
1957 23.23 1983 13.29
1960 6.4 1984 13.08
1963 27 1985 14.26
1965 28.38 1986 15.57
1970 25.83 1987 16.61
1974 22.2 1988 15.73
1976 19.6 1989 15.04
1978 14.61 1990 14.39

利用Excel软件绘得如下图像:

人口老龄化比例曲线.png

(二)、数据分析:由图像可知近年来我国的老龄化比例在逐年增长,而且增速在加大。并且仔细观察其图像,其图像接近一条对数型的增长曲线。考察六十年前的人口自然增长率,可知六十年前的人口增长比较大,这也意味着未来几十年来的老龄人会比较多。

(三)趋势分析:由数据分析可知我国的老龄化比例会越来越大。

 

3、中国性别比的研究:

(一)搜索到的数据:

年份 女性占总人口的百分比
1985 48.3
1989 48.4
1990 48.5
1995 49
1998 49
2000 48.4
2001 48.5
2005 48.5
2006 48.47

        我国出生人口性别比的历年变化:(男婴数比女婴数)

       我国出生人口性别比的历年变化.png

(一)数据分析:从数据可以看出长期以来我国女性占总人口的比例比男性占总人口的比例要小,从出生人口性别比的历年变化柱状图可以看出出生的男婴占总婴儿的比例越来越大,呈增长趋势。

(二)趋势分析:由数据分析可知未来几十年内女性占总人口的比重会越来越低。

基本假设

我们研究的人口是一个整体系统 ;影响人口的变化因素只有时间、婴儿的出生、人口的死亡、人口的迁移 ;期间不考虑突发事件(大规模的流行疾病、战争等)对人口变化的影响 ;系统是封闭的,不考虑出国与海归人士对我国人口的影响 ;

 

模型

城镇化水平增长的模型一

由于由图像可知城镇化水平的百分比与年份的关系大致呈线性关系,因此从简单入手,由最小二乘法原理,对它们两者进行线性拟合,建立了模型。

模型变量的符号化

x:              年份

y:             城镇化百分比

a、b:           线性方程的两个系数

函数模型的建立

由它们呈线性相关,列得方程:

 方程一.png 

    由最小二乘法原理,可得:

方程二.png

方程三.png

其中此方程的相关系数

方程四.png

Excel处理上面数据,可解得:

                 a=0.95 ;     b=-1858.04 ;     r=0.95 ;          

于是得:方程五.png   

模型的检验:

matlab绘得图形如下:

城镇化水平与年份的关系曲线拟合.png

预测:由此线性方程预测到的未来城镇化如下:

2010年的城镇化水平为45.25%

2020年的城镇化水平为54.71%

2030年的城镇化水平为64.18%

2040年的城镇化水平为73.65%

2050年的城镇化水平为83.12%

模型的分析:

由图可见,中国城镇化与年份的关系曲线拟和得较好,这样就有了较优的中短期预测效果.但由于模型本身的局限性,所以对于40,50年以上的长期预测,模型的预测仍然不够准确.所以只能做粗略的中短期的比较优化的模型.

 

优缺点:

由于此方程是由实际数据拟合而来的,具有一定的近期预测价值。但它的不足也是很明显的,因为城镇化的百分比是不可能达到1的,故城镇化水平达到一定程度后增长速率会减缓,直至停滞,不可能是一直线性递增的。

 

城镇化水平增长的模型二

由于经过分析,城镇化不可能一直线性增长的,它有一个极大值,因此考虑用‘S’型曲线模型来模拟它。

变量的符号化

      t                      年份

     u(t)                   t年的城镇化比例

     a,b                   系数

模型的建立:

1985年为初始年,则‘S’型的增长曲线函数为:

方程六.png

于是用Excel软件处理数据来模拟函数,得函数如下:

               方程七.png

模型的检验:

matlab绘出函数图形如下:

城镇化水平与年份的关系曲线拟合2.png

预测

由此线性方程预测到的未来城镇化如下:

2010年的城镇化水平为37.87%

2020年的城镇化水平为46.13%

2030年的城镇化水平为54.61%

2040年的城镇化水平为62.83%

2050年的城镇化水平为70.37%

模型的分析:

由于此方程是由网上资料的方程得来的,它可以用来预测较长一段时间内的增长率,但是它的不足是很明显的,2010年的城镇化不可能会比37.87%低的,因为2006年的城镇化已经是43.9%,因此用它来预测短期是很不理想的。


优缺点

对于较长一段时间的预测是比较准确的,所以,它可以用来预测较长一段时间内的增长率,但是由于模型本身的局限性,对于短期如十年内的预测是很不理想的.

 

结论

 综上两个模型,可以用模型一来预测较短一段时间内的城镇化,而用模型二来预测较长一段时间的城镇化。

 

老龄化的模型:

     由于现在及未来的人口老龄化很大程度上受上个世纪的人口增长的影响,所以首先分析六十年前的人口自然增长率,六十年前人口自然增长率的曲线为:

近六十年来中国人口自然增长率.png

由于所以该曲线近似于对数型的数学模型,因此用阻滞型的增长来模拟它:

        变量的符号化

         t                               年份

       x(t)                            t年份的老龄化百分比

       xm                               老龄化的最大值

       x0                               初始年的老龄比例   

模型的建立:

 

1985年为初始年,则阻滞型的增长曲线函数为:

                  方程八.png                          

根据国际上人口分析,25%为一个国家老龄化的近似最大值,于是用Excel软件处理数据来模拟函数,得函数如下:

           方程九.png

模型的检验:

matlab绘出函数图形如下:

中国老龄化比例与年份的关系曲线拟合.png

 

预测:

由此线性方程预测到的未来老龄化如下:

2010年的老龄化水平为12.91%

2020年的老龄化水平为16.28%

2030年的老龄化水平为19.15%

2040年的老龄化水平为21.28%

2050年的老龄化水平为22.73%

优缺点:

从图像可以看出模型对实际点有一定的模拟度,但是不够精确,有几个点在线较远处了。总的来说,由于六十年前人口自然增长率很大,所以经过分析,此模型能符合较长的一段时间内的老龄化趋势。

 

人口性别比的模型

首先用Excel对数据进行处理,得下图:

中国女性占总人口的百分比.png

可以看出近年来女性占总人口的百分比变化不大,但从出生婴儿的性别比来看,由于男婴占总婴儿的比例越来越大,男性的寿命虽然比女性的要略短,但现在由于社会生活水平的提高,男性的寿命也逐年增长,因此,在模型假设的前提下,未来的女性占总人口的比例将会越来越低。

下面用matlab模拟一个二次函数来拟合上面的数据,

变量符号化:

x                    年份

y                    女性占总人口的百分比

a,b ,c               二次方程的三个系数

 

则此方程为:

                  方程十.png

模型的建立:

matlab中输入如下代码:

clf

x=[1985,1989,1990,1995,1998,2000,2001,2005,2006];

y=[48.3,48.4,48.5,49,49,48.4,48.5,48.5,48.47];

p1=polyfit(x,y,2);

disp('二次拟合曲线'),poly2str(p1,'x')

x1=1985:1:2050;

y1=polyval(p1,x1);

plot(x,y,'b*',x1,y1,'r');title('中国女性占总人口的百分比与年份的关系曲线拟合');xlabel('年份');ylabel('女性百分比');

legend('描点','二次模拟')

 

其结果为:

ans =-0.0038667 x^2 + 15.4395 x - 15363.5164

所以此模型的二次方程为:

方程十一.png

模型的检验:

下面用matlab绘得的图为:

中国女性占总人口的百分比与年份的关系曲线拟合.png

预测

由此线性方程预测到的女性占总人口的比例如下:

2010年的女性占总人口的比例为48.026%

2020年的女性占总人口的比例为46.60%

2030年的女性占总人口的比例为44.39%

2040年的女性占总人口的比例为41.41%

2050年的女性占总人口的比例为37.66%

 

模型的分析:

由图可见,中国城镇化与年份的关系曲线拟和得较好,这样就有了较优的中短期预测效果.但由于模型本身的局限性,所以对于40,50年以上的长期预测,模型的预测仍然不够准确.所以只能做粗略的中短期的比较优化的模型。

优缺点:

由于此模型是根据数据用电脑模拟出来的,从图像可以看出它与原始数据的吻合程度较好,因此用它来预测短期内的女性占总人口的比例较好,而由于现实社会的不确定性,用它来预测较长一段时间的女性占总人口的变化则可能会变得很不理想了。

 

附录:

城镇化模型一的matlab代码:

>> x=1985:0.1:2050;

>>Y=[23.71,24.52,25.32,25.81,26.21,26.41,26.37,27.63,28.14,28.64,29.04,29.37,29.92,30.4,30.89,36.22,37.5,39.1,40.5,41.6,43,43.9];

>>y=0.95*x-1858.04;plot(x,y,'r',X,Y,'b');title('中国城镇化水平与年份的关系曲线拟合');xlabel('年份');ylabel('城镇化百分比');

 

城镇化模型二的matlab代码:

X=[1985,1986,1987,1988,1989,1990,1991,1992,1993,1994,1995,1996,1997,1998,1999,2000,2001,2002,2003,2004,2005,2006];Y=[23.71,24.52,25.32,25.81,26.21,26.41,26.37,27.63,28.14,28.64,29.04,29.37,29.92,30.4,30.89,36.22,37.5,39.1,40.5,41.6,43,43.9];x=1985:1:2050;y=1./(1+exp(1.345-0.034*(x-1985)));plot(x,y,'r',X,Y/100,'b*');title('中国城镇化水平与年份的关系曲线拟合二');xlabel('年份');ylabel('城镇化比例')

 

老龄化比例的matlab代码:

>>x=1985:0.1:2050;y=25./(1+3.8*exp(-0.056*(x-1985)));X=[1985,1990,1995,2000,2003,2005];Y=[5.2,5.57,6.56,7.96,10,11.2];

>> plot(x,y,'r',X,Y,'b*');title('中国老龄化比例与年份的关系曲线拟合');xlabel('年份');ylabel('老龄化百分比')

 

参考网址:

http://www.863p.com/Construction/LandNews/200705/47287.html;

http://www.chinapop.gov.cn/fzzlbg/zjtrd/t20070117_163543621.html;

http://economy.guoxue.com/article.php/1078;

http://www.lunwenwang.com/Freepaper/Economicalpaper/nationaleconomy/200608/Freepaper_2442.html;

www.sci.bupt.cn/sxjm/paper/source/cumcm2007/cumcm0735.PDF;

www.sci.bupt.cn/sxjm/paper/source/cumcm2007/cumcm0742.PDF;