数据是怎样成为匹敌流行病的壮大东西的

本文来自微信民众号:乐天行为派(ID:letianxingdongpai),作者:史蒂夫·约翰逊,题图来自:视觉中国

从生命统计的角度来看,在一场盛行病时期,一个人的殒命报告的是过去,而一百只死鸡则可以预示将来,以至可以完整阻挠这些故事的发作。

新冠时期,我们险些天天都在关注种种数据统计。21世纪的我们对这类曲线图早已屡见不鲜,它出现在证券大楼的屏幕上,红线绿线交缠;它出现在我们的观察问卷中,此涨彼伏。现实上,关于疫情数据的这类统计事情,早在两个世纪前就抽芽,缭绕这些数据的收集与剖析事情构建出了全部人类在疫情眼前的庇护伞,证券指数、民意观察等在疫情数据统计眼前只能算是“晚辈”。

自19世纪以来,大众卫生专家就晓得信息可以是最好的药物,晓得哪些数据流可以协助停息将来的爆发。而这统统都要归功于一个叫威廉·法尔(William Farr)的男子。

数据是怎样成为匹敌流行病的壮大东西的

威廉·法尔(William Farr)

伦敦霍乱的终结者:法尔

1866年6月27日,位于英国伦敦利河(The River Lea)边的一个工人社区里,亨吉斯(Hedges)伉俪在这一天前后死于霍乱,该案例在当时并未马上激发注重。1832年伦敦初次爆发霍乱,几周内数千人殒命。随后,霍乱便像阴雨连绵一样搅扰着伦敦,就在亨吉斯伉俪殒命的前几周媒体另有连续在报导霍乱殒命,如许的大背景下,伉俪统一天死于霍乱好像并不是不足为奇。

没想到,这对伉俪的殒命就是疫情更大局限爆发的入手下手。数周内,利河周边的工人社区爆发了英国历史上最严峻的霍乱。报纸入手下手宣布疫情统计信息,到7月14日完毕的这一周,伦敦东区有20例霍乱殒命;再下一周总数跳到了308;到了8月,每周的殒命人数已靠近一千。这些增进的数据构成的上升轨迹,像新冠时期一样的统计数据一样搅扰着人类,失控与未知使人恐惊。

跟着殒命人数的上升,当时的伦敦又是怎样找到细菌起源地和霍乱流传途径的呢?早在1854年伦敦阅历霍乱的时刻,当时的大夫厥后被称为盛行病专家的约翰·斯诺(John Snow)就已证实,霍乱是经过水流传的。基于此,跟着殒命人数的增添,威廉·法尔马上入手下手观察东区四周的水源。

他对死于霍乱的人举行了分类,分类规范不是按居处而是按供应饮用水的公司。他收集的数据展现了,绝大多数病患都饮用过东伦敦水务公司的水。

观察职员很快就找到了污染源:东伦敦水务公司的水库没有与四周的利河隔脱离。经由过程检察夏季初的殒命报告,住在利河四周的亨吉斯伉俪的殒命进入观察职员视线。经观察,该伉俪的茅厕纵贯利河,利河又与东伦敦水务公司的水库相连,霍乱细菌流入供水体系并激发疫情。

此次事宜无疑是盛行病学史上的一个里程碑——1866年是伦敦历史上末了一次霍乱爆发。伦敦霍乱的终结者威廉·法尔几乎是以惊人的速率和效力完成了一项精彩的侦察事情,而他的利器无疑就是他发明的“生命统计”。

生命统计的“起家”

威廉·法尔于1807年诞生在一个墟落家庭,因有赞助者支撑才得以在巴黎和伦敦大学进修医学。20多岁的法尔在伦敦竖立了医疗机构,但他真正的热忱在于生命统计,他置信对殒命率宏观情势的熟悉可以像任何传统医学干涉干与一样成为一种挽救人类的有用东西。在18世纪,运用数据来相识存亡情势险些完整是贸易利益驱动,但法尔和少数同寅以为,人口动态统计是诊断社会弊病和展现社会不平等征象的刷新东西。

抱着如许的信心,法尔在《柳叶刀》上宣布了几篇医学数据剖析的论文,并于1837年就任于中心户籍总署,该署是一个新型政府机构,担任追踪英格兰和威尔士的诞生和殒命。在法尔的勉励下,该署入手下手在殒命率报告中纪录更普遍的数据,包含殒命缘由,职业和岁数等。

计数自身并不是什么新手艺:自伊丽莎白女王时期以来,伦敦就每周宣布一次“殒命单”。单个数据并没有用途,是法尔让猎取的原始数据变得有意义:发明数字中风趣的趋向,比较人群中差别亚组,发明新的可视化情势……

数据是怎样成为匹敌流行病的壮大东西的

法尔绘制了伦敦的温度和殒命率可视化图表

收集和宣布数据不仅是报告现实的问题,而且是更玄妙的探索性艺术:测试和应战假定,竖立解释性模子。正如法尔所写的那样,“现实不计其数,但并不是科学。就像海边无数的沙粒一样,单个现实显得伶仃、无用、无形。当现实以天然关联分列就可以被比较;当现实被伶俐解释,才构成了永久的科学真谛。”

法尔运用统计数据回覆的第一个问题也与我们当前的危急有关:都市密度在多大程度上促进殒命率?在报告中,他尝试了一种奇妙的要领——“生命表”来比对3个自力社区(伦敦大都市,利物浦工业区和萨里墟落)的密度与殒命率关联,即按岁数细分特定人口的殒命率。

数据是怎样成为匹敌流行病的壮大东西的

法尔“生命表”插图

在统一份报告中,法尔还注意到数据中另一个使人困惑的情势:他称之为“盛行病的作用定律”,现在盛行病学家将其称为“法尔定律”。经由过程剖析利物浦的天花爆发数据,法尔将殒命率计数分为10个自力的时期。第一个周期的殒命人数为2,513,第二个周期为3,289,第三个周期为4,242。一览无余,这些数字险些以30%的速率增进。” 殒命率统计进入到第四个周期,法尔观察到,这类增添的速率“在接下来的时候内会再上升6%,在那里坚持稳定,就像曲线极点处的弹丸一样,必定值得关注”。法尔定律是用数学要领形貌沾染性疾病生长规律的初次尝试。

再看新冠:数据的连续与刷新

在新冠病毒爆发的本日,只管我们的科学、手艺和医学专业知识比拟1866年已千差万别,但我们发明本身所处的环境与维多利亚时期的人类并没有什么差别——缺少庇护未感染者的疫苗、没有直接有用药物可以治愈新冠肺炎。

处置新冠肺炎研讨的盛行病学家收集剖析了很多中心数据:感染,殒命,所在等信息,经由过程法尔发明的生命周期表,我们可以看到新冠的致死率不成比例地集合在老年人中;华盛顿大学关于新冠的展望等都法尔最初在1840年制订的行为轨则的现代产品;当我们议论展平曲线时,所议论的曲线是由法尔起首绘制的……

再看新冠防疫,我们依靠的居然照样法尔在约莫两个世纪前入手下手构建的庇护伞:数据收集和剖析。数据使我们可以看到疾病正在流传的处所、医疗保健体系大概透支的处所……它使我们可以盘算感染率,并将热门映照到舆图上。

现实证实,法尔的生命统计数据积厚流光,这是一种平等主义。它在19世纪终结了伦敦霍乱,也在21世纪新冠中与新兴手艺连系衍生出众多有用研讨。明显,现今的主要统计学家比19世纪的法尔可以取得更多的信息,如抗体测试效果,受害者合并症,以至是差别的病毒遗传株。他们具有的软件可以使他们竖立模子以构成法尔最初发明的盛行病学曲线。

东北大学新兴盛行病试验室的塞缪尔·斯卡皮诺(Samuel V. Scarpino)、牛津研讨职员莫里茨·克雷默(Moritz Kraemer)和清华大学的博士徐波于1月下旬成立了一个特设构造,担任建立21世纪相当于法尔的殒命率报告的文件:世界上一切新冠病例的单一开源档案。到2月初,事情组已收集了10,000个案例的细致纪录。现在,由数百名志愿者构成的非正式收集已在环球142个国度/区域收集了凌驾100万个案例的纪录。

西雅图流感研讨是另一种新兴手艺的变体,该手艺“病症监测”已在此次防疫中发挥了主要作用。在患者进入病院之前,先对进入卫生保健体系的患者的官方数据举行补充,以跟踪疾病病症的出现。如经由过程连系交互温度计、搜刮数据、小程序等纪录运用者的邮政编码、早期病症等,收集的数据使新兴热门在出现于诊所或官方卫生报告中之前对其举行映照,从而有用地将数据收集时候轴向左挪动了五天,这一行动关于潜伏期较长的新冠肺炎十分必要。

置信终究有用药物、疫苗会被研发,传统医学将庇护我们免受新冠病毒的损害,但就现在而言,生命统计数据是我们人类具有的最好防备要领。本着威廉·法尔的精力,在新冠时期出现了多个新的数据收集和剖析试验,大概在危急完毕前挽救了不计其数人的生命。

向左走向右走:生命统计的将来

19世纪,法尔最早体系地研讨爆发数据是从空间和时候上的散布状况角度举行剖析,应用数据趋向来停止疫情的生长。现在,我们当前数据剖析的局限性也依旧是空间性与时候性。

在空间的局限性上,或许我们应当向右走两步。正如纽约医学院医学院人口康健系主任马克·古雷维奇(Marc Gourevitch)所指出的那样,在很多都市和都市社区中,几个街区或一英里以内大概会有很大差别。

关于跟踪疾速流传的病毒,想要明白区分感染区与未感染区是完整毛病的,一个潜伏解决方案是将爆发数据的地舆隐约化处置惩罚,古雷维奇发起不要有意在舆图上标出示意感染具体地点的图钉,而应有意下降定位的准确性:或许可以是都市街区,而不是特定地点。这类做法完整也可以监测到经由过程都市中的微型社区爆发的疫情,同时又没法在大众数据中辨认出个人身份,庇护了民众隐私。

在时候的局限性上,我们应当再向左走。正现在年2月份梅德玛(Medema)和他的同事在荷兰的污水数据收集所证实那样,污水中病毒的峰值时候比新冠肺炎病例报导时候要早7天。在法尔生活的时期,污水是形成盛行病的主要缘由,而在21世纪,污水很大概为我们供应了掌握其散布的主要数据。

关于过去几十年来出现的很多最恐怖的疾病,最初人类并不是感染主体,人类病例每每出现在时候轴中部位置。无疑,我们需要将数据收集时候轴向左挪动,最激进的体式格局,无外乎是完整将人类消除在剖析斟酌以外。

在过去的三十年里,约有50种疾病从动物转移到人类身上。非典、中东呼吸综合征、禽流感、埃博拉、艾滋病等都曾一度是动物疾病。生命统计向左走两步就是对动物疾病的监测。将生命统计数据应用于动物疾病范畴的缘由很简朴——可以阻挠正在出现的人畜共得病,可以防止专家们向来最忧郁的潜伏大盛行。

大众卫生数据最初只是简朴的计数:某天在某地殒命了多少人。数据收集与剖析协助将都市从“人类的宅兆”变成了现在地球上预期寿命最长的社区。从生命统计的角度来看,在一场盛行病时期,一个人的殒命报告的是过去,而一百只死鸡则可以预示将来,以至可以完整阻挠这些故事的发作。

*本文原标题为《数据怎样成为匹敌盛行病的最强大东西之一》(How Data Became One of the Most Powerful Tools to Fight an Epidemic)。作者史蒂文·约翰逊(Steven Johnson),2020年6月10日宣布于《纽约时报》杂志(The New York Times Magazine)。

本文来自微信民众号:乐天行为派(ID:letianxingdongpai),作者:史蒂夫·约翰逊

原创文章,作者:28qn新闻网,如若转载,请注明出处:https://www.28qn.com/archives/17237.html