在正文中,我给出了一个简化版的公式。但是,如果我试着用更精确的公式来表现二者间的关系的话,用回归得出的公式应该是:
PM2.5 µg/m³ = Dylos 1微米颗粒物数量 x .023 – 5.309.
通过分别代入数据然后跟美国广州领事馆数据进行比较,我们就可以判断出复杂公式和简单公式的精确性。平均来看,简单公式跟政府数据的差距是9.04微克,复杂公式跟政府数据的差距是8.85微克。
所以复杂公式略好一些,但是它却有个理论上的缺陷。如果Dylos基本款 1微米的取值是0,公式算出的值就成了 -5.309微米。当然这是不可能的,负值是不存在的。而简单公式就没有这个问题。
当然,基于一个数据集生成一个公式,再用同样的数据集来进行检验并不是很理想。理想的状况是,我们要收集更多的数据并且用后续收集来的数据对公式进行检验。
我特别喜欢在不同季节进行测试,是因为空气湿度可能会在测试中起到一定的作用。举个极端的例子,北京在春天爆发季节性的沙尘暴时,空气中大颗粒就更多。其他城市也有季节性的不同,即使有时候这些不同并不是那么明显。
下面是原始数据:


