哪里能查到历史的AQI(就是空气质量指数,如PM2.5之类)数据?

论坛 期权论坛 期权     
匿名的论坛用户   2021-1-9 02:22   6155   10
我们现在需要本区国控点的历史监测数据,但只能查到本市的
分享到 :
0 人收藏

10 个回复

倒序浏览
2#
热心的小回应  16级独孤 | 2021-1-9 02:22:35
其实百度或者谷歌是可以搜索到想要的答案的,只是要花费很多时间和精力,下面是我积累了很久的一些资料:
至于爬取数据程序可以去github搜索。
3#
热心的小回应  16级独孤 | 2021-1-9 02:22:36
之前做过这方面的研究。关于这个问题,真心是比较难查到题主所说的监控点的一手数据的。至少我是没有找到公开数据,推测只能去环保局寻求具体到监控点的一手数据。

分享一下我接触过的几类可以用于空气质量研究的数据。

首先,关于AQI数据,必须明确的一点是AQI(Air Quality Index)和API(Air pollution Index)在国内是不同的数据。两者包含的污染物范围不相同(可能计算方法也有不同?这个我倒是忘记了)。2012年之前的空气污染数据是API。
对于中国,AQI与原来发布的空气污染指数(API)有着很大的区别。AQI分级计算参考的标准是GB 3095-2012《环境空气质量标准》(现行),参与评价的污染物为SO2NO2PM10PM2.5O3CO等六项,每小时发布一次;而API分级计算参考的标准是GB 3095-1996《环境空气质量标准》(已作废),评价的污染物仅为SO2、NO2和PM10等三项,每天发布一次。因此,AQI采用的标准更严、污染物指标更多、发布频次更高,其评价结果也将更加接近公众的真实感受。
所以即使AQI和API都是当日首要污染物的反应,但这两者之间做时间序列的分析显然是不能放在一起用的。所以在国内做研究的话,是没有办法在在较长的时间段上运用环保部的数据的。

然后,是几类数据:

1.环保部数据
前面很多答案说环保部数据连北京都没有,只有当日等等等。我还以为只是各位没找到正确的使用方法。去查了一下还真是吃了一惊。至少15年年初还是有的。以下是我在这个网站上抓取的部分原始数据。
不过实际上,这个数据,没有也就没有了。这么恶心的数据没有也罢。估计也是他们自己造假到自己都看不下去了,于是就只能查询当日了吧。呵呵呵呵呵。
至于说这个数据恶心到什么程度呢。负责任的告诉你,他们甚至会作出在月报里把爆表(大于500)的一些日子隐去。如果你足够机智,可以去查一下时报。时报里没有隐去。呵呵,这他妈的逗傻子呢。你星辰大海国中央政府部级机关数据中心竟然能干出这么掩耳盗铃的事来。给谁看,我就想问问你这么藏着给谁看。数据造假比起来都是高端的,他们竟然就能硬生生的把这个数藏起来。你哪怕编上个数呢??!!难道是良心发现??混入敌特了??请原谅我跑题了。只是重新回味了下当时stata里处理的时候发现少几个数时候像吃了屎一样的心情,进而久久难以平静= =
关于AQI数据在数据上的造假问题,也有很多文章讨论过。例如这篇:
Ghanem, D., & Zhang, J. (2014). ‘Effortless perfection:’ Do Chinese cities manipulate air pollution data?.Journal of Environmental Economics and Management,68(2), 203-225.加州大学两位教授直接运用统计学手段展现了中国空气污染数据的造假问题。
所以即使环保部的数据可获得,也不知道是几手的数据了。我接触的老师基本上对这个数据持否定态度,不会在文章里使用这种数据。
前些年还是有不少文章用这个数据发了不错的刊的。而且实际上的确只有环保部有多个监测站的数据。有些政策识别问题上,怎么讲呢,你相信就好。比如:曹静, 王鑫, 钟笑寒. 限行政策是否改善了北京市的空气质量?[J]. 经济学 (季刊), 2014, 3: 1091-1126.

LS很多答案提到了PM2.5查询|PM2.5历史数据查询|PM2.5全国排名|PM2.5统计分析|PM2.5全国分布图这个网站。我以前并不知道。看了一下应该是抓取的国控点的数据。感觉应该是很好的一个数据源。不过我还是比较好奇他们的数据是怎么获得的。貌似是来源于这个网站PM25.in | PM2.5(细颗粒物)及空气质量指数(AQI)实时查询!而这个网站是怎么获得的监测站数据呢。当然,其实环保部是有发布的,可能这些网站做了汇总统计和记录。

2.NASA AOD(Aerosol Optical Depth)数据
既然直接的AQI数据不好用,那AOD数据,也就是气溶胶光学厚度就是研究的一个很好的数据。
气溶胶,又称气胶烟雾质,是指固体液体微粒稳定地悬浮于气体介质中形成的分散体系。一般大小在0.01-10微米之间,可分为自然和人类产生两种。气溶胶会影响气候,包括吸收辐射散射辐射,另外,气溶胶会成为凝结核而影响的性质等。
而气溶胶光学厚度是描述气溶胶对光的衰减作用的一个数据。NASA数据的网址是LAADS Web

当然,AOD数据需要转换才能用作大气污染研究。
Gupta P, Christopher S A, Wang J, et al. Satellite remote sensing of particulate matter and air quality assessment over global cities[J]. Atmospheric Environment, 2006, 40(30): 5880-5892.

Kumar N, Chu A D, Foster A D, et al. Satellite remote sensing for developing time and space resolved estimates of ambient particulate in Cleveland, OH[J]. Aerosol Science and Technology, 2011, 45(9): 1090-1108.
这两篇文章都是比较早的运用。
AOD的使用上还是一些问题的。比如AOD数据在比起直接的AQI数据可能受到更大的自然因素的影响,做政策识别时对结果会有一定影响。
在中国的政策识别上,陈老师的这篇文章是一篇比较经典的同时运用了API和AOD数据的文章:
Chen Y, Jin G Z, Kumar N, et al. The promise of Beijing: evaluating the impact of the 2008 Olympic Games on air quality[J]. Journal of Environmental Economics and Management, 2013, 66(3): 424-443.

下图来自陈老师这篇关于奥运会环境规制政策研究的文章。从中可以看出AOD数据比起环保部发布的单个的数值,可以取更多的采样点,更加接近监测站的数据。

这幅图是 July 1, 2000的检测状况。背景网格2.5 km*2.5公里,每一个圆半径5公里,圆心为AOD观测中心点。

3.美使馆数据和很多网站发布的数据。
这些数据是自测数据。在设备可靠地情况下也存在着采集点比较单一的问题。对于北京这么大的城市,其实包括美使馆数据在内的很多单一检测点的数据,在统计意义上还是要打折扣。一般并不适合用来做数据分析。不过类似于美使馆这种连续的定点的数据其实还是可以在一定程度上反映一些问题的。尤其对于日常生活等方面还是比较好用的。
4#
热心的小回应  16级独孤 | 2021-1-9 02:22:37
@猪月邀,别人回答得都挺好的,我就来吐槽一下中国的环境数据吧。
首先我国空气质量数据大规模采集并开始每日公布始于2000年,当时开始在全国70个大中城市测量PM10,二氧化硫和氮氧化物的每日平均浓度,然后按照一定的方法把这三者的浓度换算成三个指数,指数最高的那个就是当天的API(Air pollution index),这个数据在环保部可以查到。相较于以前而言,这好多了,可还是很差,尤其跟发达国家比。第一:污染物仍然不全面,我们现在最关心的PM2.5不在其中,夏季污染很严重的臭氧也不在其中,不过这随着AQI的推出而改善了。第二:范围太小,中国不光是70个大中城市,其它地方的空气质量怎么办呢?第三:数据不够精细。比如说如果我想研究PM10的污染,对不起没有数据,只有API指数,即使我知道70%的污染天都是PM10造成的也没有意义,因为剩下的30%是二氧化硫和氮氧化物,数据不连续。而且只给我们每天的平均数据,可是早上,中午,晚上污染可能是不一样的啊,分时数据环保局是有的,可人家就是不给。第四:极其容易造假。拿上海来说,这么大的城市绝对不止一个观测点,以PM10浓度为例,怎么算呢,可能全市有20个观测点,那么环保局就把当天20个点的PM10浓度拿来平均就是今天上海的平均PM10浓度了。但这样问题就来了,市郊和市区的浓度一样吗?离马路20米和马路边的点一样吗?你布的点科不科学?当然当年环保部反击美国大使馆的PM2.5观测值的一个依据就是那只是北京一个点,没有代表性。道理没错,可把长安街和怀柔的点一平均就有代表性了?这还算好的,当年政府搞环境考核,有一项叫蓝天指数,要求一年API指数在100以下的天数要达到多少,这造成了严重的数据造假问题,并且成为了国际环境经济学界的一个研究热点问题,感兴趣的可以搜搜这篇文章"Effortless Perfection": Do Chinese Cities Manipulate Air Pollution Data?以及
Gaming in air pollution data? lessons from china
    为了搞数据,我可以说是绞尽脑汁,当年为了空气质量数据,我曾经给几个大城市的环保局发信息公开函,要求他们公开原始监测站点的分时数据,结果只有上海市一家鸟了我,我说我想研究世博会的空气质量,人家说原始数据是受保密法保护的,不能给,只能给你每天的三种污染物的日地区平均浓度数据,还说这是专门为我计算的。从2010-2012年上海每日的PM10,二氧化硫和氮氧化物平均浓度数据,我只能千恩万谢,可对我而言没啥大用,因为只有1000多个数据,还是时间序列的,搞过研究的都知道这点数据能干屁啊。
    数据质量对于研究有着非常重要的作用,2015年下半年看到一篇研究,真心牛逼,讲的是在美国洛杉矶公路上风向和下风向的疾病死亡率差异,毫无疑问,公路上风向和下风向污染物浓度是不一样的,但是我们是察觉不出来的,如果察觉出来路两边的房价就应该不一样,可我们并没有发现这种现象。那么这就可以做一个很棒的工具变量来估计大气污染对于死亡率的影响,作者的研究表明,每在下风向多暴露一个单位,死亡率就会提高5-6%。这种研究中国是注定没法做的,因为我们没有这么细的数据,路的两边都测。而且我个人臆测,即使有观测点,估计都在马路上风向几百米处。文章名叫The effects of long-term exposure to air pollution on mortality
好了,就这样吧。
5#
热心的小回应  16级独孤 | 2021-1-9 02:22:38
每次一出现空气污染,这个答案就多几个赞…

已经更新至2018-09
好几个人问Excel打开文件的时候是乱码,是因为文件是utf-8编码的,打开时注意一下就好了。
---------------分割线-----------------
最近得到反馈说数据下载慢,还是用上百度云盘分享吧……
https://pan.baidu.com/s/1mi2RjrM
早知道费那劲干嘛(手动捂脸)
---------------分割线-----------------
这是我自己花了小半年时间做的一个网站,里面包含每个监测站点(而不只是城市)的小时数据。以后会继续保持更新,觉得有用的知友请点个赞呗。
(网站链接已经失效 )

-------------------- 分隔线 ------------------------
这是之前答案里分享的两个链接:
北京市空气质量数据https://pan.baidu.com/s/1gd8GUxt
6#
热心的小回应  16级独孤 | 2021-1-9 02:22:39
几年前直接用“全国空气质量指数”APP的数据做过一个简单的图,用在了报告里。
全国空气质量指数





数据我忘记是能直接下载还是必须要手动输入的了。
不过我只选取了一个月的北京AQI的数据,工作量不大,估计我当时是手动输入的。
7#
热心的小回应  16级独孤 | 2021-1-9 02:22:40
最近发现一个网站,可以查询历史AQI数据和PM2.5的历史数据 全国空气质量指数排名(AQI)_空气污染指数查询_pm2.5查询实时数据监测
北京11月份空气质量指数(AQI)_11月北京PM2.5查询_2013年11月历史数据查询
有每月每天的数据和走势图,很强大的样子
8#
热心的小回应  16级独孤 | 2021-1-9 02:22:41
http://www.aqistudy.cn/#  中国空气质量在线监测分析平台
http://aqicn.org/city/beijing/
全部数据都有。最近在做PM2.5的预测,用的数据都是从这两个网站上爬虫来的。如有需要爬虫代码可以留言。赞我。
9#
热心的小回应  16级独孤 | 2021-1-9 02:22:42
这里有一位辛勤的童鞋,在默默更新数据。
全国空气质量历史数据 | 北京市空气质量历史数据


10#
热心的小回应  16级独孤 | 2021-1-9 02:22:43
早年间,很多AQI的APP,都有历史空气数据查询,例如墨迹、空气质量地图,数据都是从环保部和各地环保厅局的公开网站和公开数据系统抓取的,话说我国环保部门的信息公开,应该算是全国各;行政系统里做的最好的。
不过,这些历史数据在这几年,已经从APP上逐渐消失了,或者只能查到一年以内的数据,
我猜原因无他,这些历史空气数据,除了少部分环保爱好者和大气环境问题发烧友会关注使用以外,绝大多数用户都不会翻查,那么留来何用?占服务器资源,还拖垮APP使用速度,毕竟要调用大量计算资源和数据资源。
目前全国所有APP里,唯一能够查到较多历史空气数据的,可能就是“蔚蓝地图”,为啥它能保留,因为这是一家环保NGO组织开发和运营的APP,“公众环境研究中心”,现在也就是只有这部分人,才真心需要数据。这个数据系统很烧钱,每年都要从阿拉善和阿里巴巴公益基金会等慈善基金会,募集好几百万,来维持这个不赚钱的公益APP项目。
11#
热心的小回应  16级独孤 | 2021-1-9 02:22:44
@2017.12.03目前找到的空气质量相关的数据源:
这篇文章总结的比较全面。 文章中提到一个需要注意的点是这个网站我一直以为是美国大使馆的数据,本文作者说其实网站没有说明数据源,他猜测来源应该是“全国城市空气质量发布平台”,由中国环境监测总站(环境保护部直属事业单位)提供。 但其实网站是公布了数据来源的,其中两个自己比较感兴趣的来源分别是:
还有一个我之前没注意的是,美国大使馆数据其实只有PM2.5,没有其他的污染物,而且只有5个城市,比较适合数据质量的稳健性检验,难以用来做比较全面的分析。

另外各位社区er也总结了很多出处,其中,总结一下我自己看起来数据质量比较高的,或者公布了GitHub源代码的项目,以便日后参阅:
注:
  • 下文将提到的全国城市空气质量实时发布平台环保部中国环境监测总站,数据来源是其实是一个。
  • 以下提到的环保部数据中心/信息中心提供的重点城市空气质量日报历史数据有API(Air Pollution Index),有AQI,Air Quality Index不要搞混了。
整理到现在还有以下疑问:
日常用的手机APP在意空气(原名空气质量指数)里的美国标准,看下来只有这个网站的结果是最接近的。 但是很奇怪,按照网站的说法它的数据也是来自于各地的环境监测中心,那和环保部应该是一样的才对,但这个网站感觉是明显偏高。
而手机APP上的所谓美国标准,美国大使馆都没有,他们又是从哪来的呢?
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3118703
帖子:623848
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP