四、三个国家或地区的横向对比
综合起来,我们想要将居民收入、居住情况和其比重等变量用更直观的方式表示,需要居民的收入分布,由于没有找到相关的数据,所以假设这三个国家或地区的收入都服从正态分布。
这种假设认为当地的收入分配较均衡,极低收入和极高收入的人都较少,大部分人的收入情况集中在中间,这是比较符合实际的一种假设,但是现实中可能存在一些国家或地区的收入分布不均衡,那样就不是均匀的正态分布了,峰度和偏度越大表示当地的收入差距越大。
从香港的情况来看,(个人)收入中位数(在均匀正态分布中,中位数等于平均数)是15300元港币,收入在11250港币以下的居民可以申请公屋和居屋,全港约有31%的人居住在公屋和居屋中,加上在轮候的人,意味着有差不多但高于31%的香港居民收入在11250元以下;50%的居民居住在私宅中,也就是私宅居民的收入下限是均值;还有剩下收入高于11250,又低于15300的居民居住在“夹屋”或者轮候中。
考虑到轮候中的人,收入在11250以下的居民占比高于31%,假如是34%(房委会官网上表示为三分之一的香港居民提供住所),计算出香港居民收入的标准差是10000,所以香港居民的收入服从均值是15300,标准差是10000的正态分布,表示为:
这是一个比较理想化的模型,我们只是做一个大概的描述,所以香港居民收入和居住情况的概率密度函数如图表【26】所示。
用同样的方法看新加坡的情况,假如新加坡家庭的收入同样服从正态分布,中位数(也是均值)是8666新币,家庭收入在12000新币以下的家庭有资格申请组屋,居住在组屋的家庭占总户数的80%,也就是收入在12000以下的家庭占80%,剩余的20%家庭收入高于12000,居住在公寓和有地私宅中。
估算出新加坡家庭收入的标准差是4000,所以新加坡家庭收入服从均值是8666,标准差是4000的正态分布,表示为:
需要说明的是新加坡的组屋申请一般是以家庭为单位,单身人士的申请条件非常严格(35岁以上)而且成功概率较低,所以我们对新加坡的相关计算用家庭为单位,得到新加坡居民收入和居住情况的概率密度函数如图表【27】所示。
德国的租房和自有住房的群体划分不是以收入为标准的,存在高收入家庭租房的情况,所以不能用这种方法表示。
另外,将居民收入画成分布函数,再将人口处理一下(每段人口数除以总人口数),就可以得到洛伦兹曲线,根据洛伦兹曲线就能计算出基尼系数,我们在上述数据的基础上计算了一下,香港和新加坡的基尼系数都非常小,小到可以认为居民的收入很平均。
这主要是由正态分布的假设导致的,如果一个国家或地区的收入分布符合正态分布,则说明这个国家或地区大部分人的收入都在中位数和均值附近,没有长尾的超高收入或者超低收入。