【文/ 观察者网专栏作者 岑少宇】
新冠病毒到底从哪里来?这样的一个问题慢慢的变成了国内外舆论的焦点之一。要讲清楚,只能从流感到电子烟肺病,从实验室疑云到基因分析一点点剥茧抽丝,虽然文章短不了,但还是有必要的。
如果分成几篇,在关于某一事件的解读文章传播时,难免会歪楼到其他事件上。因此,不得不把热点话题尽量捏在一篇里。
文章长了,我就先把结论写在前面:目前没有可靠的证据可证明新冠病毒的来源。
可能戏剧性地把起源突然前推的做法有:
·检测美国去年的流感病例
·检测意大利或其他几个国家更早的疑似病例(单从前推来源来说,中国的疑似病例也要找)
·寻找更接近新冠病毒的野外病毒样本
可以提供传播链线索的是:
·寻找特定基因片段可能的重组来源
下面就开启我们的解谜之旅。
“新冠病毒从哪来”有几个意思?
“从哪来”其实包含几个层面,最表面的是命名问题。
“武汉肺炎”,总挂在美国国务卿蓬佩奥的嘴边;德国媒体发明了“新冠病毒:中国制造”;最近,特朗普以一国元首的身份,竟敲出“中国病毒”这样的推文,推特上既有附和的声音,也有很多人抨击他的行径(当然,本来就有一半美国人反对他)。
无可争议的是,“国名加疾病”的人类传染病命名方式已被淘汰,世卫组织等权威机构也极力反对。因为在全球化时代,这可能会引起人们歧视“被命名”的国家或地区,增加隔阂,破坏全球应对疫情的努力;也可能误认为疾病有指向性,忽视自身的防疫。中国基于此立场的反击,完全站在道德与科学的制高点上。
其次是病毒从什么动物来,最好能弄清整条传播链上的所有宿主。就认识与防控疾病而言,这远比“从哪国来”更为重要,因为可以在未来减少不必要的接触。
但中国一开始就给自己吃了个大亏,与民众科学素养不足有一定关系。
寻找SARS“元凶”历经多年,同样,科学家目前也难以确切判断新冠病毒宿主,只能说根据现有证据,蝙蝠、穿山甲都携带冠状病毒,一些样本与新型冠状病毒较为接近。
现在仍难以证明蝙蝠、穿山甲与人类之间的传播关系,直接与“吃蝙蝠”相联系是缺乏科学依据的。从SARS和MERS的历史经验看,蝙蝠到人之间,有中间宿主是大概率事件。
(有报道称“石正丽团队两年前已发现蝙蝠冠状病毒感染人现象”,其实不够准确,被一些人误以为直接感染。报道里所提的血清学证据,是指当地人没有接触SARS,也有了类似感染过SARS的血清反应。但当地人81.2%饲养家畜或宠物,并没有检测这些潜在的中间宿主。另有一些细胞学或分子学证据推测有直接感染可能,但与最终实证中间还差了一步。)
华南海鲜市场有野味,确实有存在中间宿主的可能,但在没有充分检测前,从科学意义上讲,仍是连不起来的。
连电影《传染病》里都给出过其他可能:一只蝙蝠嘴里叼着的果实落入猪圈,猪吃了之后可能染病,又通过厨子开始在人群中传播。
电影《传染病》中的蝙蝠与猪(图片来自:电影截图)
即使部分人有意传播“吃蝙蝠染病”的观点,如果民众具备很高的科学素养,可以很容易地发现证据链的断裂,便有可能阻断谣言的传播。然而,中国的现实是,很多人直接就怪罪到“吃蝙蝠”上。
那为什么还要修订《野生动物保护法》,并呼吁严格执法呢?难道没必要吗?
这是为了降低未来其他病毒感染人类的几率,所以要尽可能杜绝对蝙蝠、穿山甲等野生动物的捕捉与利用。因为野生动物身上有很多潜在的病原,有些病原如冠状病毒的一些近亲已经能够传染人类,这在科学上是已知的。
看上去殊途同归,但背后的两种思维方式截然不同,从主动背锅的悲剧里,也能看出科学素养的重要性。
第三层是病毒从哪个国家来,似乎最为聚讼纷纭,热度高恐怕也与前述的命名问题有关。有些人期望,确定来源国,就能起到“恶意命名”同等的效果。
是要实事求是、坚守“病毒无国界”的道德高地,还是要口水战,这显然不是科学问题。让谁打口水战为好?是政府机构?是以个人身份出手的外交人员?还是国际关系学者?选了某种策略、某类人,也很难再验证选另一条策略、另一类人是否更有利,对相关人士的各种评价,不过是情绪宣泄罢了。下面还是回到科学的角度。
这次疫情期间有不少明星学者,先看看他们对发源地的观点。
2月底,钟南山说“疫情不一定来源在中国”引发了轰动效应,但据广州日报报道,他在会后补充说,“从科研角度看,‘首先发现’和‘发源’不能划上等号,但我们也不能就此判断疫情是来自国外。只有对新冠病毒进行溯源,有了结果,才可能回答这样的一个问题。”
3月18日,他再次表示了类似的意思:“新冠肺炎疫情是发生在武汉,但没有证据表明源头也在武汉,这是个科学问题……没有搞清楚之前就随便下结论,是不负责任的。”
张文宏2月底则认为:“中国只有武汉最先出现了这个新传染病,如果是外面传到中国来,应该是几个中国城市同时发病,而不是有时间先后。”同一篇报道在关于流感的问题上还引用了他的话:“新冠在CT上有非常特征性的表现,所以我认为很容易可以区分。”
有必要注意一下的是,3月11日美国疾控中心主任雷德菲尔德(Robert Redfield)在听证会上,就检测试剂不足的问题被质询。对当时的检测工作不满的议员问道:“在美国,人们可能表面上是死于流感,实际上却可能死于新冠病毒或COVID-19,对吧?”他的回答是:“迄今为止,一些病例的诊断情况就是如此。”
那么如何从科学上理解这一“矛盾”呢?
流感与新冠
大家应该还记得,之前有过是否靠CT来确诊的讨论。根据临床医生的意见,很多新冠患者会有外侧带的间质性肺炎,流感就没那么明显的特征,所以说“容易区分”并没有错。
但是新冠并不能完全靠CT诊断,武汉的诊断应用只是在应急情况下,帮助防控与收治。因为当时靠核酸检测一是来不及,二是在如此紧张、疲劳的情况下,可能有不少采样失误的情况。
因此流感与新冠的CT容易区分,不等于完全不会混淆。更何况还有大量轻症病例,他们中间是很可能混淆的,甚至还可能共同感染。
而且,中国的诊断经验也是逐步积累起来的,如果其他几个国家轻视疫情、不及时吸取中国经验,还可能增加误判的几率。
还有一个情况是患者未经检测就已病故,事后也未核查,当然难以确定病因。就像武汉疫情前半期,网上曾流传一些帖子,自述家人在等待就医过程中死亡,怀疑并不在统计数字内。在医疗系统崩溃的情况下,各国都可能存在类似现象。
3月20日,Nicholas Reich在GitHub上传了一篇与流感相关的文章《Looking for evidence of a high burden of COVID-19 in the United States from inflfluenza-like illness data》,虽然没有经过同行评议,但还是被人发掘出来,介绍到了中文平台上。
思路是这样的:美国有个流感监测系统,划分的十个大区既统计疑似流感而求诊的患者总数,还统计了各机构检测下来其中流感阳性的比例,数据基本能精确到每一周。
阳性比例知道了,那阴性比例一减就出来了,如果阴性比例高,就说明可能有某种并非流感的呼吸系统疾病导致人们求诊。但直接比较不大妥当,需要降低不同年份流感疫情不同的影响。所以作者把阴性比例乘以疑似总数,再除以每年的基线(baseline),得出“相对阴性”。
结论是今年的比例(黑线)确实在以往的22年中(灰色)偏高,红线则是2009年H1N1大爆发的情况。不过,直到2月中旬,今年的“相对阴性”大部分时段都并非最高,不同大区依稀可辨分别有2-5年更高的情况,当然要具体看更高的是哪些年份、有什么特殊情况才可以进一步讨论,但作者并没有给出。
真正的“死亡交叉”出现在2月中下旬,好几个大区的黑线迅速抬头。这很可能提示新冠病例在美国大增,当然,作者也提了下,还不是排他性证据,因为这些抬头的部分,到底是什么病原体不知道。
作者还指出了新闻媒体报道可能的影响,在恐慌中,人们更容易因为一些微小的呼吸道症状而去医院,这在解读数据时,也是不能忽略的问题。
阴性比较是一个有趣的思路,但我在这里还想补充两点:一是22年的历史数据比较,可能还需要仔细考虑检测水平带来的影响,以及人们对流感重视程度的影响,有时选择最长的时间跨度比对,未必是最好的;二是新媒体时代,人们更有可能恐慌,流行病学研究不只是统计学和医学,还要考虑到社会层面。
总之,从这部分研究结果看,美国新冠疫情严峻的概率确实可能很大,但要证明在之前就广泛流传,证据不足。
作者还计算了这次流感季某一周的“相对阴性”的Z分值,把22季以来某周及前后各一周的数据求平均数,再用该周数据减去平均数,除以标准差,也就是看看你离这个平均值偏得有多远。
大区的Z分数所显示的,基本和曲线图一样,2月底开始,发生了全面暴增。黑框表示的是“相对阴性”达到历史最高的情况。
然而,有一张图却可能引发对美国早已爆发新冠的强烈疑问。
从图上看,美国有几个州的Z分数和“相对阴性”,早在10月就开始“爆棚”。似乎是新冠爆发的信号。然而,我不建议以此为论据,因为作者的方法有一个重大缺陷。
大家还记得刚才提到的基线吗?作者的大区基线取自CDC,而CDC的全国基线和大区基线有一套明确、细致的算法。
但是作者的各州基线却仅仅是头两周流感样病例的平均数……作者的解释是减少系统误差。
从前面大区“相对阴性”曲线变化幅度之大也能够准确的看出,每季的情况是非常复杂的,仅凭头两周的数据,不能说明任何问题。如此简化各州基线的算法,漏洞太大了,甚至对数据受影响方向的估计都可能是笔糊涂账。
流感的问题还有待更多的研究。美国疾控中心主任在听证会上也没有明确,他所掌握的混淆病例有多少,特别是发生的时间。
从疫情研究的角度看,世界卫生组织和其他几个国家有理由敦促美国公开这些混淆病例的具体信息,并尝试对12月及更早的流感患者样本进行新冠检测。但目前以流感与新冠混淆来推断疫情来源,仍缺乏足够的证据。
同时,还有另一种关于混淆疾病的假说在网上流传,那就是电子烟肺病。
电子烟肺病是什么?
有些人认为电子烟肺病很神秘,其实早已大致找到了元凶。
电子烟肺病的全称是E- Cigarette or Vaping Product Use Assocaited Lung Injury,缩写evalI,直译的话是“与电子烟或电子烟产品使用相关的肺部损伤”,够累赘的。
为什么全球电子烟使用者都没事,就美国出事了呢?因为他们雾化了四氢大麻酚(THC),肺泡里都能检测出来,关键是THC里还被黑心商家掺了便宜的维生素E醋酸酯(Vitamin E acetate),后者被认为是导致肺部损伤的根本原因。
有些朋友看过早期关于THC没能致病的动物实验,就认定美国归因错误。但现在已经有动物模型初步验证了维生素E醋酸酯对肺部的损伤。
这也提醒我们,无论是媒体还是个人,如果关心某个问题,要尽量跟踪研究进展,不能刻舟求剑。
以下是维生素E醋酸酯动物实验的部分结果,作者用了空白对照,还用了丙二醇和植物甘油(PG-VG)作对照。
从病例看,美国的患者在2019年9月到顶峰后,就大幅下降了,与美国加强了对不良商家的打击,也能对得上。
而且,电子烟肺病的病例分布极为特殊,你们可以自行判断是个传染病,特别是类似新冠的传染病,还是与电子烟相关:男性患者占66%,老年患者占2%,非西班牙裔白人占73%,算上西班牙裔占88%,病例几乎都与电子烟有关,自称没有接触的只有2%。
这两天还有人炒作电子烟肺病CT影像的问题。现在大家都知道“磨玻璃”啊,“大白肺”啊。其实,影像学也是门大学问,不是靠两个名词,自己再瞥一眼就懂了,请对放射科医生们有起码的尊重。
举一个广东省人民医院放射科主任医师赵振军介绍的实战例子。72岁老人,临床表现有发烧、咳嗽症状,血常规正常,核酸第一次检查为阴性,病人否认接触史。
CT检查后看到磨玻璃样病变,呈外周分布,而且沿着肺泡孔播散,这三点都符合新冠肺炎特征。
赵振军说:“我们正真看到有很多磨玻璃改变,但把这些磨玻璃改变放大后,又看到很多小的磨玻璃影,它们是分开的、分隔的,而不像我们新冠病毒影像学表现——所有的磨玻璃影连成一片。在这个病人的片子上,磨玻璃影表现为一个个结节。”
赵振军拿出来讲的例子,可能本身就有点难度。但至少可以说明,影像学分析不是你在社会化媒体上看见几张模模糊糊的图片,就可以拍脑袋的。
而且,“磨玻璃”或“毛玻璃”只是在媒体的宣传下变得耳熟能详而已,不是只有新冠病毒会造成“磨玻璃”,这可以搜到大量文献证实。如前所述,CT的诊断权重提升只是在疫情危急下的特殊情况。
从电子烟肺病现有的数据看,不像个传染病;而对于热衷谈论生物武器的人来说,它岂不更像是个对付美国白人的大杀器?
谈到生物武器,且不说电子烟肺病,就算新冠病毒,全球学术圈的意见也基本一致:不支持是生物武器的说法。不管是指控武汉的还是美国的实验室制造新冠病毒武器,都遭到了学术圈的反对。
世界上几乎不可能有国家拿传播力这么强、且稳定性不足的RNA病毒当生物武器,无法保证不祸及自身。
只有邪教或满心想减少人口的环境恐怖主义分子才有可能。他们什么都无所谓,自己死了就当是“烈士”。可病毒制备比奥姆真理教那些化学攻击难度高多了,目前还没什么“黑衣人”组织有这个能力,让柯南再去找找吧。
实验室泄漏疑云
不过,即使实验室不造武器,研究病毒时泄漏也不是不可能。德特里克堡(Fort Detrick)的美国陆军传染病研究中心(United States Army Medical Research Institute of Infectious Diseases)被CDC处理,已经引发了无限遐想。
我们当然不必采信美方的说法,但“知己知彼”,先看一看还是有必要的。据说有些链接无法访问,被认为是大规模删稿,其实还是有多篇报道没有“404”,通过cache缓存还可以找到更多,比如military.com11月24日的文章。原作者用词比较“丰富”,为了尽最大可能避免翻译带来的歧义,重要词汇尽量直译,并注上英文。
根据这篇报道,研究中心发现了两起“控制违规”(breaches of containment),但没有提及具体时间。按照程序,研究中心只要确定发现“坏了规矩”(breakdown of requirements),就要上报。
在上报后,研究中心指挥官主动下令中止所有正在研究的项目,进行“安全暂停”(safety pause)。6月,美国疾控中心(CDC)检查了研究中心,既有预定的也有不预定的,检查持续了多久没有具体说明。
一直到7月12日,CDC才发出了关注函,15日发出中止函( a cease and desist letter),停止了与“特定病原与毒物”(select agents and toxins)相关的研究 。
所谓“特定病原与毒物”是美国自己列出的对人、动物或植物威胁比较大的病原或毒物,总共有67种,我查了下“SARS相关冠状病毒”也是其中之一。但报道仅指出当时研究中心的在研内容与埃博拉(4级实验室)、兔热病、鼠疫、马脑炎(3级实验室)相关,没有提及德特里克堡是否有冠状病毒。
CDC的报告中说发现了六项“违背联邦规定”(departures from the federal regulations)的行为,而前述两起“违规”只是其中的一项。按照研究中心的说法,“违规”这个词承载了很多分量(is a loaded word),但用这个词就表明没有人员暴露(exposure)在威胁下。
这篇报道中提到的另一项是“贯彻生物安全和控制程序时,出现系统性失职”(systematically failed to implement biosafety and containment procedures),举的例子是“当雇员移除生物危险废弃物时,故意撑开通往高压釜室的门”(personnel deliberately propped open the door to the autoclave room while the employee removed biohazard waste)。为了处理问题,研究中心重新审视培训流程,再次培训员工。
研究中心的污水净化系统也有问题,在之前的系统损坏后,转换为化学处理,之后仍将改回热去污系统(thermal decontamination system)。
CDC还发现研究中心的病原清单不准确,报道说问题已经解决。
当地的fredericknewspost.com是最早报道的媒体,8月2日的报道不需要借由缓存,可顺利阅读。文中除了违反程序与污水处理问题,也提到了缺乏对员工再认证的周期性培训( a lack of periodic recertification training for workers)。
《纽约时报》8月5日的报道也没有被删,在废水处理问题上讲得更具体些。2018年5月的暴雨淹没、破坏了老旧的污水处理系统,使用新的化学系统需要修改一些研究流程。但CDC检查发现,研究人员没有严格遵循新流程,而且化学处理系统本身也有问题。发言人则强调,泄漏的污水没有进入外部环境。
《纽约时报》还给出了一个可与前述报道印证的信息,研究中心并未完全关闭,除了与“特定病原与毒物”相关的研究,其他研究仍在进行。
虽然这么看事情并不严重,但《纽约时报》在结尾还是狠狠捅了几刀:政府的实验室以前也出问题,包括CDC的和国家健康中心(National Institutes of Health)的;2009年德特里克堡的研究就被暂停过,因为储藏了没有列在数据库里的病原;而且,前雇员Bruce Ivins就是2001年炭疽邮件事件的主要嫌疑人,有5人因炭疽身亡,Ivins自己则在2008年自杀。
大致梳理完上述信息,首先令我想起的,倒不是什么疫情,而是此前观察者网报道过的、美国核武装的乱象,这些都能够说是一个老大帝国衰落的侧写。
我们都不必猜测美国隐瞒什么,不必假设什么,单就已经暴露出的问题,中方便可以理直气壮地质问美国,要求给个交代:如此重要的实验室,居然管理运作漏洞百出,这会增加人类遭受威胁的风险,请问美方作何解释?
作为负责任的大国、安理会五常之一,这样问并不过分吧。
EVENT201演习是怎么回事?
还有一件事情被人们与实验室问题相联系,被视为“逻辑链”或“证据链”上的一环,就是2019年10月18日的EVENT201演习。
如果光听名字,你可能会以为是美国疾控中心甚至是美军的大动员,其实只是美国约翰霍普金斯卫生安全中心与盖茨基金及世界经济论坛合作举办的一次专家会议。会议邀请了15名政府、商界及公共卫生领袖参与,包括中国疾控中心主任高福院士。
可能让普通人感到惊奇、一些自媒体也在拼命渲染的是,会上设定的正是冠状病毒,与SARS类似,但传播力更强些,像流感那样。这与新型冠状病毒看似很接近,如此巧合,岂不是“实锤”有什么样的问题了?
然而从专业角度看,选择SARS并不意外,以此猜测主办者或参会者预知新冠疫情,并非合理的理由。
因为演习的目的,就是看人类应对大流行的能力,要假设难以控制的大流行,首选呼吸系统病毒。而要挑个近几年比较“热门”的病毒作为候选,大概率不是流感,就是冠状病毒。本科选过病毒学的生科学生,基本都会这样判断吧。
在相关议论中,我倒是看到了比较“高段位”的阴谋论。有的人先说,高明的阴谋不是什么都不说,而是半真半假——这话本身当然没错——但随后,论者就玩弄话术,认为有缺陷的阴谋论也可能是阴谋的一部分,用以反复辟谣来掩护“真相”,辟谣多了之后,人们就麻木了,对与阴谋论相符的“真相”就不在乎了。许多人看后竟纷纷跟风叫好。
然而,只要稍加思考就能发现,这种类似“两头堵”的话术,与其说思想深刻,不如说是取祸之道,更纯粹与科学没什么关系了。任何被辟谣的信息,都可以是你所认定的“真相”的掩护,那还有谣言吗?
而且,任何国家,乃至个人都可以被这样攻击。咬定你做了某件坏事,然后编个阴谋论“佐证”,被击破了就说这本来便是“有缺陷的阴谋论”,是“掩护”。如果放任这种思维方式流传,甚至被追捧,实在看不出对中国、对人类有什么好处。
从美国怎么到武汉?
我们固然应该追究美国实验室管理混乱的问题,但要将这一事件与新冠疫情相联系,却还没什么科学依据。所谓流感与新冠混淆的问题,前面已经分析过。
如果现在流行的这波新冠病毒从实验室泄漏,被误认为是流感,按照相关疾病的传播和致病规律去思考,会有诸多疑点。
比如,6月调查、7月处理研究中心,与9月底开始的流感季之间有明显的断裂。即使以气候不合适为理由,那么当流感季真的到来,也无法解释为何基地所处的马里兰州并看不出与疫情爆发有什么特别的联系。
2019年9月29日起,当季流感第一周各州内部的地域分布广泛程度,箭头所指的马里兰州内是零星出现
2019年9月29日起,当季流感第一周,各州疑似流感占门诊人数比的分类级别。马里兰州同样没有一点特殊之处,边上的弗吉尼亚是最小级的二档,但在2018-2019与2014-2015两季,弗吉尼亚也是这样,甚至马里兰州在2011-2012自己还是最小级的一档。
再如,以新冠的传播力以及美国与世界的联通程度,两三个月后很可能有了广泛的传播,就像张文宏所讲的那样,中国也更可能在多地“同时发病”,而不是集中在武汉。
为了解释武汉的爆发,很多人将目光放在了军运会,但军运会期间从美国到武汉的人数,真的多到能够将武汉与美国的联系,提升到明显高于欧洲、加拿大或北上广的程度吗?
军运会人群聚集,密切接触的是各国运动员、裁判、媒体、志愿者等等。你可以假设运动员身体素质好,没发病或轻症自愈了,中国志愿者身体素质差,带到社区染病了,看着很合理,那么外籍记者、工作人员呢?为何没有在这些人里传染?是不是都要假设一番身体素质特棒?
有的人说,可能来源国的人口密度和武汉不同,武汉人群密集所以爆发了,但上述这些人在武汉同样面临人群密集环境,如果染病回到自己国家,也不是个个都人口密度低吧?传播时间并不比武汉晚多少,也就大约差个军运会的会期,但全都没有爆发迹象,那么又要作何假设来理顺推论呢?
更何况军运会会期本身与新冠病毒的早期病例之间,还是有明显的时间断档,总而言之,需要脑补的东西实在太多了。
当然,我们对新冠的流行病学特征还不能说完全掌握,疫情的爆发也有一定的偶然性,因此上面这些质疑不是板上钉钉的推论,只是举例说明,这些概率比较高的可能性,目前在流行病学上是绕不过去的。
也有人对伊朗、意大利的疫情迅猛感到惊奇,揣测是否更早就有传播等等。这些故事版本五花八门,难以一一列举。但在目前人类对新冠了解还不充分的水平上,基于各国纷乱的疫情与疾控,要反推更早的传播时间或地点,是非常不靠谱的,要刻意连上实验室泄漏的难度就更大了。
此外还需要提醒下,科学训练很重要的一点是对前提条件、对假设等等的敏感性。当人们讨论实验室泄露、新冠与流感混淆时,其实有一个前提是全球(按阴谋论的剧本,至多排除美国少数知情人物)都不知道有新疾病,从与世界高度联通的美国出来,自由传播了至少两个月。
而现在各国的疫情防控,有策略的差异,有重视程度的差异,有现实条件的推动或制约等等,已经是一个高度脱离假设的情形,变数也太多了。
顺便提一下意大利的两则“大新闻”。Giuseppe Remuzzi接受美国NPR采访时,被问到意大利为什么那么惨,便回答说自己听到一些信息,医生们回忆12月甚至11月有奇怪的肺炎,推测在“意识到中国疫情爆发前”就有流传,结论是“对抗你不知道的东西是不可能的嘛”。
而他在《柳叶刀》上发表文章,讲的是按照中国疫情的规律,意大利可能发展到什么程度,医疗系统会有多大压力,压根不是在追溯。
然而,有些自媒体或社交群在传播时,把《柳叶刀》文章和采访混为一谈,似乎是《柳叶刀》确认了“奇怪肺炎”。其实,后面的“道听途说”根本不是实锤。把两条真消息捏成谣言,真假莫辨,倒是很有前面提到的“高级阴谋论”的风范。在最新的采访中,他直接澄清自己并不是在谈论“新冠病毒的源头在何处”。
SARS以来,中国的监测系统接到过不少不明肺炎的上报,几乎全部都排除了。各国情况也是类似的,毕竟新疾病是小概率事件。因此,意大利医生的回忆只能作为一个线索。
现在中国帮助意大利抗疫,关系走近,如果这些病例样本还在,我们该推动与意方合作检测。但目前引为证据,为时尚早。
而另一条“大新闻”声称,1月1日新冠就在意大利开始“流行”,其实是个标题党。这个病例后面还有断档,还有长时期的零星出现阶段。“开始流行”让很多人误以为,既然1月1日流行,那么零星病例还可以再往前推,甚至可能早于武汉。
但从图上也能看出,意大利早期的曲线几乎“躺平”,病例恐怕已经很难再往前推了。检测更早的“奇怪肺炎”也许真能得到重大发现,但这一研究反而有些降低了对此的期待。
当然,早期病例的流行病学调查是值得进行的。除了直接感染新冠,也不排除1月1日先有其他原因导致的症状,后来才感染新冠并得到检测。但因为科学家的重点是讨论模型,所以文章里压根没有提及个别病例的情况,无从判断。
至于最近流传的所谓Maatje Benassi是0号病人,且与军运会、实验室有关的说法,除了她是运动员来过军运会外,其他信息都没有一点证据。“调查记者”自己连Maatje和Mattew Benassi的夫妻关系都一度搞错,说是兄妹。
荷兰的0号病人是Benny Benassi?对不起,哪个国家公布病例是连姓名都给出的?谁都可以自称是“调查记者”,然后指定某个姓名就是0号病人,拍个视频言之凿凿。
更“劲爆”的是,所谓的Benny Benassi根本是个意大利DJ,人家的公开信息只是因为意大利封城,不能去北美演出了,压根都不知道有没有确诊新冠呢。这美国“调查记者”连英文都不好了么?
如果你看过视频并自己稍加检索,而不是看某些中文自媒体或社交平台上的转述,应该也会对这群人天马行空的逻辑感到惊奇。
中文自媒体和平台有多不靠谱呢?这群所谓的“调查记者”,他们自己压根就没把任何Benassi真正与德特里克堡联系起来,而在中文舆论场里,却言之凿凿说Mattew Benassi在德特里克堡工作。
变异与测序
从上述梳理能够正常的看到,目前没有一点证据,可以把某些人正在热议的几件事,联系到新冠疫情上。
但有人说,不管“实验室泄漏”情况下传播路径大概率会是什么样子,也不管美国目前的失控状态很像是首次面对疫情的状况,病毒会变异啊。确实,变异这事真是个“法宝”。你只要随便指定病毒如何变异,那它就可以克服重重阻碍,想去哪里就去哪里,想怎么传播就怎么传播。
你可以假设美国泄漏了病毒,而且是低致病性的,所以CDC的检查、处理不紧不慢,几个月后搞的演习还是个纸面的,但恰好突变提高致病性,引发了美国超强流感季。
你也可以假设它是低传播性、低致病性,在美国没传开,没发现,在军运会也没传给其他几个国家的人,到了武汉社区,突变同时提高了传播性和致病性。
用这种思路,其实可完全跳脱什么军运会和实验室,一切路径都能实现。《瘟疫公司》玩玩可以,千万别带到现实世界啊。目前没有证据证明,新冠病毒曾发生过那些变化。
测序能够在一定程度上帮助我们了解到底有什么变异,可以了解不同样本间的关系远近。
很多人一直盯着Nextstrain.org,这家网站在持续更新全球新冠病毒基因的分析结果,到3月25日为止,已经有1200多个样本。而短短几天前,3月19日还只有700个样本。
打开网站,默认的树状图是这样的,图中数量较多的紫色点是中国内地样本,数量较多的红色点是美国,蓝色与其他紫色主要是亚洲国家与地区,橙色主要是美洲国家,黄绿色主要是欧洲、大洋洲国家。
具体归为什么地点按发现地算,如果有人从某地出发到了其他几个国家,才被发现并检测,那么就算落地国的。
你可以改变图的参数、图的“坐标”或说“分支长度”(Branch Length,比如上图的横坐标就是显示日期的矩形图,下图是“极坐标”显示突变数的辐射图),选择颜色表示国家或地区还是其他参数,也可以点在某个样本上,了解突变、来源、研究作者等相关信息。
如何理解树状图呢?Nextstrain网站上举了个简单的例子,如下图:
假定你有A-E的5个样本,不同颜色的点,表示基因差异。蓝色点是都有的,而根据黄色与青色,可以分成两组。为何不用绿色与青色分组?因为黄色的范围大于绿色。
必须要格外注意的是D与E,D是平头的,E的线长出来一截,表示它还有个独特的基因,是其他样本没有的,拖出来的线越长,基因组也就越独特,C就是这样的例子。
看上去很简单,但如何解读“树”也不能想当然。有人看了下面这张图,就声称病毒在欧美的传播时间长,理由是美国、欧洲的突变数量比中国的高得多。
先澄清一点,突变是一个概率事件,偶然性很大,病毒基因组小、复制周期短、错误率高、选择压力大,甚至有时还不得不考虑回复突变的概率,变数很多。传播的时间久,累积的突变数量多,本来也只是一个笼统的说法,不能单凭个别数据推算可能的起源时间,只能整体估计。
更关键的是,突变数量和起源地真有关系吗?假设A国和B国的疾控条件相同,病毒从A国到B国,在3个月里总共传了3000人,与本身在B国3个月传3000人,有本质区别吗?病毒又不认识国境线。
中国样本的突变数量少,最主要的原因是疫情彻底控制住了,目前只有前期的样本,等于后半部分传播的时间被砍掉了。
真正和辨别起源相关的是突变的多样性,而不是数量。一般而言,突变五花八门,也就是在树上分支多,那么很可能更古老一些。
但对于致病微生物,绝对不可以独立看待突变多样性,同样要考虑疾控的影响。打个比方,病毒在A地传播,但传播的人数有限,传到B地后,疫情失控,B地的病毒虽然晚,复制的机会却比留在A地的病毒多得多,那么复制出错的机会也就更多,基因多样性也就上去了。只有看与A地基因树相连的地方,才能反映B地病毒的真正来源。
有人还指出,图上一个高达26个突变的美国样本后来被篡改了。这也是“隔行如隔山”导致的问题。科学工作者遇到一个奇特的数据,也许很兴奋,但首先应该质疑数据是否有问题。如果确实出现了重大失误,理应撤回数据。
不了解基因测序的人,会以为测序必定100%正确,其实根本不是,把基因打断检测,再一点点拼起来,真的不容易。中国较早提交的Wuhan-Hu-1样本,在GenBank里的编号是MN908947,版本号是MN908947.3,更新了三次。
当样本多了之后,还常有两个国家的样本基因相同的情况。我们大家可以假设下,如果一个庞大的分支,几乎都来自甲国,在基部有A、B两个相同样本,A的样本取自乙国飞到甲国的病例,而且比当地的B发病略早,那么正常的推论是:这是一个乙国来的病例,甲国疫情失控后,导致分支大扩展。
当然,我们不能完全排除一些小概率事件。比如甲国首发病人C,恰好刚感染就出差去乙国传给A,而且没有突变,A恰好也是刚感染立即出差去甲国传给了B。现在A、B、C序列是一样的,而时间也没拉开,因此它们在各自国内的传播,可能和上一段假设的情况差别不大,那么如果C没有被测序,而A、B测序了,我们就可能得到差不多的树,以及相同的从乙国输入甲国的推论。
唯一的问题是,这样的小概率假设,科学家不会采信——当然也无法完全排除。科学家的谨慎是有道理的。
另外,好几个国家在树的多个分支上都有出现,不能简单解读为这些国家是发源地,都需要结合流行病学调查,看看是否多次输入导致的多样性。目前的证据没有颠覆多次输入的推论。
这么说,光看“大树”其实对推测“终极来源”没什么用?事实正是如此。“大树”固然是靠基因之间的比较建起来的,可在正常的情况下,后面采集的样本其实主要是在把“树”做大,对挖“深”根部没什么帮助。也可以拟合曲线,看看可能的最早分化时间,但这是比较粗糙的估计。
最多也就是整体判断下,“大树”有没什么“异常”。有些人假定病毒在其他几个国家先开始传播,被当成其他疾病,那么可以推论,即使早期样本没有发现,基于它们演化出的新版本,现在还是有很大的可能性被测序,而且与从中国传播出去的版本有很大不同。但目前还没有发现此类“疑点”。
在样本大增的情况下,Nextstrain还是强调:“重要的是,需要强调我们的结论受数据可获性的限制。在所有病例中,只有一部分得到了检测。在检测的病例中,只有一部分样本得到了测序。在不同地区、不同时段,哪些样本被检测、测序可能变化很大。而且,疫情系统树的建构总是有一定的不确定性。”
因此,我们虽然可以解读样本之间的亲疏关系,判断他们之间的传播路径。但即使是这些用途,也需要小心对待。至于直接推到源头,就太不靠谱了。
对判断起源真正有用的,还是要靠早期样本基因的比对。可由于这个病潜伏期长、有大量可自愈的轻症,早期样本的进一步发掘很困难。
“零号病人”对新冠病毒来说,意义不大。如果是潜伏期短、病症猛烈的疾病,或许还有一丝可能找到,但对于新冠这样潜伏期相对较长、轻症多且可自愈的疾病,不大可能找到“零号病人”,或者说找到的很可能不是真正的“零号病人”。
中国一开始对疾病的判断限定与海鲜市场有关,美国等一开始限定与中国有关,从避免恐慌、避免挤兑医疗资源的角度来说,是能够理解的,但给溯源带来了更多困难。
现有的早期样本的比对研究,都无法摆脱这个困扰。而且样本少的情况下,稍有缺失,就会有很大影响。Nextstrain也举例,劝告人们在解读科研数据时要谨慎。
例子是这样的:假定黄国的病原有三支传入蓝国,如果所有图上这些点全部测到,相当于开启“上帝视角”,就能像第一幅图那样准确还原全貌。但如果少测了第一幅图中右侧的黄点,那么就会像第二幅图那样,误认为是单次传入,而且时间也提前了。更极端的例子是,假如只测到一个黄点,甚至会得出完全相反的结论。
有些先前发表的研究,虽然学者已经给出了很多评价,但这些讨论似乎并未充分进入大众视野。很多人依然在引用“五毒说”和“S型与L型”。这里也简单提一下。
被概括为“五毒说”的研究,首先是样本局限性比较大。因为前面提到的早期样本被限定在一定范围,所以武汉样本基本都与华南海鲜市场有关;而广东首例、美国的两个特殊类型都有武汉旅行史。
因此科学家在解读时,始终是说,华南海鲜市场可能并不是最早的病毒传播地点,但基本没有把圈划出武汉之外。“五毒说”的基础就不存在。
其次,所用的蝙蝠冠状病毒序列RaTG13与新冠病毒虽然接近,但要用来确定“祖先”还差得太远。RaTG13与新冠病毒大约有4%的差异,即1000个以上的核苷酸,而新冠病毒的差异也就十几个,根本不能确定RaTG13哪些地方与真正的“祖先型”接近。
类似地,还有日本BioData公司的研究。作者也用了RaTG13,但知道溯源肯定不靠谱,因此文章只是探讨了病毒多次传入的现象。
没想到中文世界里把它作为溯源证据,惊动了正主,直接用中文辟谣,官方“打脸”。
你也许会怀疑这是不是正主,不是叫“日本川崎生物数据公司”吗?其实人家原名就叫“日本BioData”,川崎只是所在地而已。你会管中石油叫“中国北京石油”吗?当然,这和3个月来中文媒体犯的其他错误相比,能够说是微不足道了。
至于“S型与L型”的论文,不仅同样用了RaTG13,导致盲目判断样本分化的先后顺序,而且犯了低级错误,把美国样本中测序不准、可能是C可能是T的位点,当作既有C又有T,认为同时感染S型和L型。
如果是L型更早,那么最早爆发的武汉L型多,时间上早期L型多,就都可以解释了。但原作者坚持认为是S型早,而不审视自己方法学上的问题,不得不拼凑一套传播力和毒力差异的故事,却没有其他证据支持。这套故事引发了各种遐想,可惜一切都建立于错误与过多的假设之上。
如果一项研究本身不包括测序工作,而只是基于其他人公开的序列进行测序,其实全世界的科研人员都可以做。抢发一篇漏洞很大的文章,恐怕不是因为手速快、脑子好,而是同行更为严谨。这类抢发并不是什么好风气。
后来,有报道称发现了与新冠病毒相似度达99%的穿山甲冠状病毒,是否就能够用来比较准确地溯源呢?结果是空欢喜一场。它们仅在编码E蛋白的基因上99%相似,整体上还不如蝙蝠冠状病毒。还有研究发现,某些穿山甲冠状病毒S蛋白(刺突蛋白)的受体结合区域与新冠很接近,蛋白质相似度高达97%。但这些只能说提供了野外重组可能的线索,离真正的源头还有距离。
我接触下来,网友热衷讨论的问题,生物学家们基本都“毫无波澜,甚至有点想笑(也有想哭的吧)”。唯一让少数人感到有趣的是,冠状病毒的S蛋白中有个剪切位点,插入了4个氨基酸,被认为可能与致病性有关。
不过,这种“意外”没有维持太久。3月初发表的研究发现,在狂测了200多个蝙蝠病毒样本后,取自云南的蝙蝠冠状病毒RmYN02有3个氨基酸插入,虽然有一个不同,但新冠的4个插入一下子就没那么“不可思议”了。
即使生物学家中间,之前对此事的看法也不一样。搞分子生物学和遗传学的会比较“重视”这样的一个问题,搞生态的就比较淡定:我们对自然界种群的认识还差得远呢,在野外种群里一时没找到插入很正常,接着找呗。
据我所知,有学者试图从美国的物种里寻找与这4个氨基酸完全一致的样本。因为文章还没有写出来,具体的摸索方向,先暂时保密。但这确实是个溯源的思路之一,祝愿他们成功。
不过4个氨基酸数量太少,光凭这个不能完全确定来源,还需要看蛋白质整体的吻合度。王立铭教授也曾提醒,要注意避免“选择性注意”的错误:“只要它们(基因)彼此间的差异不是完全平均分布的,你总能找到一些地方的相似程度超过其他地方,你也总能找到少数几个地方是完全一样的。但是这种现象可能仅仅就是随机的产物”。如果只看4个氨基酸,犯这类错误的可能性就会升高。
单单比较蛋白质的氨基酸序列也不够,同时要比较基因序列。因为有些突变不改变氨基酸序列,基因的差异会比蛋白质显示的要大。无论如何,如果这个方向能得到确切的结果,确实是一条有趣的线索。
总而言之,真要往前推来源,或证明来源在其他地方,现在有效的方法是:
·检测美国去年的流感病例
·检测意大利或其他几个国家更早的疑似病例(单从前推来源来说,中国的疑似病例也要找)
·寻找更接近新冠病毒的野外样本
可以提供传播链线索的是:
·寻找部分特定片段可能的重组来源
奥卡姆剃刀原则
回顾整个梳理过程,我们大家可以发现媒体、自媒体、社交平台用户犯了许多错误,比如标题党、误解基本原理、不看文献、不思考方法漏洞等。
而且,很多轻易对病毒来源做出的判断或怀疑,都是基于对现有信息的误读或假设,甚至串联几个假设,看似“铁证如山”“环环相扣”,最后无非推出一个小概率甚至极小概率事件。
科学上一般都会采用从简的原则,基于多件小概率事件的推理很难被认为是“合理质疑”。科学家们在工作中也经常需要探讨假说,但堆积多重假设的往往不是有价值的假说。
奥卡姆剃刀当然不是万能的,不必然就正确,但科学上一般要依靠直接证据才能把小概率事件“扶正”。否则整个世界就乱套了,谁都可以举出符合自己需要的可能性,然后咬定这个答案不可忽略,决策、判断都无从谈起了。
科学无法一劳永逸地击碎“阴谋论”,因为小概率事件总有存在的空间。举个例子,绝大部分UFO现象都能得到合理的解释,科学家既不会也无法断言UFO肯定不存在。
人们或许会认为,既然世界上热衷阴谋论或小概率假设的人那么多,我们为何需要提高科学素养,拒绝这样的方式呢?回到开头,其实已经给出了答案,因为缺乏科学素养可能会伤害自身,比如莫名论定“吃蝙蝠”。
而且卫健事业跨越众多学科,涉及社会经济问题,还事关每个个体,极为复杂,要建设人类的“卫生健康共同体”,没有民众的科学素养打底将事倍功半。
全球贫困人口大幅下降,主要靠的是中国;全球森林面积增加,主要靠的还是中国;那么,全球科学素养的提高,为什么不能靠中国呢?这算是一个中国科普工作者小小的雄心壮志吧。
【研究新冠病毒,需要生物学家、流行病学家、临床医生等的通力合作,同样地,科普工作也需要各方配合。有时,甚至医生也会误信媒体上对生物学研究的错误解读,反之亦然。本文只是抛砖引玉,欢迎相关学科的专业技术人员批评指正,共同探讨。】
本文系观察者网独家稿件,文章的主要内容纯属作者本人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。