卫星数据使用方法和机器学习方法能够很好地洞悉大数据和新的分析方法今后将如何改变我们度量贫困的方式。我本人并非贫困问题专家,不过我在寻思,这些数据和方法能否帮助我们测算就业增长情况。
研究人员采用机器学习方法(即采用演算法从数据中获得启示)和卫星影像对贫困人口分布情况进行预测。 组合使用卫星影像的时间序列数据和学习辨认建筑物、道路、车辆以及经济活动痕迹的计算机,可带来更准确、成本更低以及更便于推广的方法,用于测算消费支出、资产及财富。图说收入增长情况。
要在没有卫星和计算机情况下取得相同结果,就需要大量调查人员携带挂纸板和铅笔,深入实地,对人们进行访谈,了解其财富变化情况,也要耗费大量资金。此类调查工作进程不仅缓慢,而且冗长乏味。最终,调查很容易遗漏掉诸如贫困人口等我们真正关注且远离道路和供电设施等基础设施的人群。
在测算就业增长情况过程中,我们会面临同一类问题:劳动力调查让我们了解就业市场(供给侧)状况,但其成本高昂,也很耗时。企业(需求侧)方面的情况又如何呢?企业普查或调查即便存在的话,也比阿塔卡玛沙漠的降雨更为零星稀少,因此我们也不能依靠它们来跟踪就业增长情况。人们会自然而然地思考,为测算贫困人口数量而开发出的相同方法经部分调整后可否用于测算创造的就业岗位数量。
为测算就业增长情况而需对新出现的机器学习方法作出“调整”是一种委婉说法,其含义是相关挑战巨大,但可以战胜。如目标是测算贫困人口数量,则由计算机来辨识地形特征,如城市、道路、水体以及农业区等等。例如,用茅草或锌板铺设的屋顶也是可以分辨的特征,机器可学习对其进行识别;它们可能与诸如贫困等经济发展结果存在互联关系——从茅草屋顶可看出住户较为贫困,而锌板屋顶则意味着住户可能较为富有。总之,机器可学习哪些特征有助于测算经济发展结果。
正在开发的模型在预测家庭资产和消费支出方面的表现将越来越好。从就业岗位角度看,这两个变量是生产性经济活动(正规或非正规工作)的结果。因此,我们的希望是从这些数据中也能够推算出就业岗位数量。目前,从(资产)测算结果中推算出(就业)测算结果,可能会错上加错。因此,我们希望能够直接从卫星图片上获得就业测算结果,这就像机器测算家庭资产和消费支出一样。不过,这样做的难度可能更大,因为对于建筑物、道路、交通状况和农业景观,机器必须能够分辨出正在发生的经济活动的潜在规模,然后推算出多少人在从从事这些活动。在10米X10米大的建筑中,劳动密集型或资本密集型生产活动有可能正在进行,雇用的劳动者有数百人或仅有10人。真实情况难以知晓,但请不要低估机器的学习能力。从交通角度看,对于进出建筑物车辆的大小、产品目的地以及其它更多动态特征,此类学习型机器可能很快就能够猜出产品的类型和数量。根据此类组合信息测算就业岗位数量可能更为直接。
其它难题还有很多,但前景可能会更好。如果我们能够做好这项工作,则我们就能够近乎实时地评估干预措施对冲突地区、非正规行业和偏远地区就业的影响。如把这些测算结果与贫困人口分布图或某类主流企业和行业的分布图结合起来,则我们就可以说,就业岗位创造之浪潮正在急需就业的地区和雇用很多劳动者的行业掀起。最后,在经济下行之时,我们也许能够发现一些人正感受到对其就业的影响,另一些人即将会遭受此类影响。
由于这些工具前景良好,因此我们打算同捐赠机构、其它多边机构以及发展界开展合作,请它们帮助我们开发出这些工具。举例说,可持续发展目标就要求我们这么做。