病原宏基因組高通量測序臨床本地化檢測規范專家共識
中國藥師協會, 中華醫學會細菌感染與耐藥防治分會, 國家衛生健康委臨床抗微生物藥物敏感性折點研究和標準制定專家委員會.
DOI:10.3760/cma.j.cn112150-20230720-00019
基于 PCR-free 建庫的 mNGS 實驗可在同一個空間內設置試劑準備區、標本處理區(配備生物安全柜)和建庫測序區(PCR-free 建庫、文庫純化、等量混合、上機測序)。PCR-free 文庫濃度可能低于 Qubit 熒光定量儀的檢測限,建議使用熒光定量 PCR(quantitative polymerase chain reaction,qPCR)方法進行文庫濃度測定。雖然基于 PCR-free 建庫的 mNGS 實驗在文庫定量前實驗操作不存在 PCR 擴增建庫所帶來的氣溶膠風險,但仍然需要警惕人員操作等帶來的氣溶膠污染可能性,并在一個相對獨立的空間進行 qPCR 法文庫濃度測定。
(1)濕實驗應由具備分子生物學檢驗專業技能的人員,如分子生物學檢驗專業檢驗技師操作;
(2)干實驗需要配備生物信息研發及管理人員,以保證分析流程、持續更新、性能確認、維護及管理 [12];
(3)結果審核應配備具有臨床感染病學相關知識的微生物檢驗醫師。針對疑難報告,建議成立 mNGS 報告解讀團隊,由具備臨床感染病學、臨床微生物檢驗學、臨床分子生物學、生物信息學等相關專業知識的人員組成。所有人員均須通過崗位相關的培訓和考核,并進行定期能力評估方能上崗。
核酸提取和純化若使用手工操作,應考慮不同標本類型的差異、不同核酸提取試劑盒的提取效率、純度以及片段大小等因素;若使用自動化核酸提取儀系統,需要綜合考慮檢測通量、自動化程度、成本、核酸質量等因素。
實驗室應確定原始測序數據及 FASTQ 文件在服務器上存儲的位置,并明確具備唯一標識的統一命名,便于數據調用與快速分類查找。文件命名建議包含數據檢測/分析日期、檢測實驗室名稱、標本類型、測序批次、唯一的標本編碼等。命名規則一旦確定不得隨意改動。
實驗室可通過 FASTQC[19] 和 MultiQC[20] 等軟件查看測序數據質量、總數據量、堿基質量值(Q20 和 Q30)等,結合測序芯片泳道上生成的簇密度設置質控點(如簇密度是否偏離有效范圍,堿基識別質量值≥Q30 的數據比例是否偏低)判斷本批次數據能否用于后續分析。數據過濾規則可根據實驗室對 mNGS 檢測的敏感性和特異性需求進行調整,建議設置 Q30 堿基數量占比>75%、有效序列長度不小于 50bp、含 N 堿基比例小于 10% 等參數閾值。
為了提高微生物數據的分析時效性,需要去除測序數據中的宿主序列,通常方法是把比對到人類基因組的序列進行過濾。真菌和寄生蟲與人類的基因組序列有一定的同源性,在過濾宿主序列的過程中需要評估運行時間、去除效率與非特異性去除(非人源序列而被錯誤過濾)的序列比例。
物種注釋是病原宏基因組檢測最核心的內容之一,主要是將通過質量控制的非宿主序列與微生物參考數據庫比對,或者經過從頭組裝成 contigs/scaffolds 后再比對到微生物參考數據庫,確定在特定序列相似性閾值(如≥97%)下的物種分類級別。物種注釋的準確性取決于所選注釋工具的敏感性和特異性、算法閾值的合理性、參考數據庫的完整性及其納入微生物基因組的準確性 [12]。目前可用的注釋工具分為三類:
(1)DNA-to-DNA 比對工具;
(2)DNA-to-Protein 比對工具;
(3)基于特征標記基因的比對工具。有研究表明,利用相同的模擬數據集測試不同的宏基因組學分類工具,發現不同的分類工具識別的物種數量可能相差 3 個數量級以上 [21]。在 mNGS 中,DNA-to-DNA 工具往往比 DNA-to-Protein 工具能夠更好地進行物種分類 [22],但 DNA-to-Protein 工具在識別新發和高度可變的基因序列時敏感性更高 [23]。而在以注重物種豐度的微生物組學分析中,則推薦使用基于特征標記基因的比對工具 [24]。
總之,實驗室在選擇物種注釋工具時,應基于檢測的預期用途,從運行速度、準確率、精確率、召回率等維度評估性能 [17]。實驗室可使用近緣物種的基因序列對分析軟件的物種注釋功能進行評估,另外在數據庫或分析算法有變更時,以及定期對本實驗室的 mNGS 物種/基因注釋功能進行評估。
微生物參考數據庫的選擇顯著影響物種注釋分類的結果 [25,26]。《宏基因組測序病原微生物檢測生物信息學分析規范化管理專家共識》[17] 中對 mNGS 常用微生物數據庫的特征有較為詳細的描述。目前沒有任何一個公共數據庫能夠包含所有的潛在人類病原體的基因組信息(假陰性風險),且數據庫中不可避免地存在一些注釋錯誤或污染的序列(假陽性風險)[27]。因此在構建、使用和管理這類數據庫時需要重點關注以下問題:
(1)充分評估數據庫的全面性以及納入物種在分類學上的代表性。同一微生物,往往具有遺傳差異的不同亞型或株,在選擇基因組時,應該考慮到微生物的遺傳多樣性,盡可能多地納入不同亞型或株的高質量基因組;
(2)無論所選參考基因組的來源如何,實驗室都需要通過重測序或其他技術手段確認其注釋的準確性,序列的完整性,避免納入錯誤注釋、命名錯誤或代表性不足的微生物序列;
(3)病原體(尤其是 RNA 病毒)在自然狀態下是不斷發生變異的,所以需要及時(或定期)對參考數據庫中的基因組信息進行更新及驗證 [28,29],更新的頻率取決于實驗室或臨床的需求,以及序列在公共數據庫中的上傳或更新時間 [28];發生可能影響結果的數據庫修改、替換及更新等活動均需要重新進行評估;建議實驗室每年對微生物數據庫進行審核,必要時隨時進行更新。但是對于使用本地化服務器的實驗室,構建的數據庫大小需要權衡服務器的計算能力以及報告的時效性要求。
mNGS 檢測到的微生物常以讀長數作為結果,但它受測序量、標本質量等因素的影響,并且同張芯片不同文庫分配的下機數據量會有波動,所以有必要對讀長進行歸一化處理 [30]。建議將每百萬測序讀長中匹配到某一微生物基因組的特異讀長(reads per million,RPM)作為歸一化指標 [30]。如果希望比較不同微生物在同一文庫中的讀長,則還需考慮微生物基因組大小不同帶來的差異(理論上,在相同條件下,基因組越長,測得的讀長越多),建議通過計算每百萬測序量下每一千個堿基的基因組長度的歸一化讀長來消除這種影響 [28]。需要注意,由于 mNGS 檢測原理不同于 qPCR,RPM 不能作為微生物核酸的定量指標。
由于缺乏標準的 mNGS 生物信息學分析方案,各實驗室自建分析流程內部使用的分析軟件與數據庫處在不斷更新、確認及完善的動態過程中。為了保證每批次臨床標本結果的可溯源性及可重復性,實驗室需要明確每一次測試所使用的軟件及數據庫的版本,建議在報告單中體現,至少應包括分析日期、軟件名稱和版本號、對每個組成工具及算法的用戶自定義參數和系統默認值等 [28],可使用版本管理工具如 Conda 完成 [31]。此外,可使用流程管理工具如 Snakemake 和 Nextflow 等對整個工具集進行版本控制。
(1)臨床標本測序數據集:注釋充分、特征明確的臨床標本測序數據(FASTQ 或其他格式)[32];
(2)計算機模擬測序數據:利用序列模擬軟件模擬生成測序數據集 [16,33],要求既要具有與真實測序數據質量相同/相似的技術參數(文庫片段長度分布、測序模式、測序錯誤類型及頻率、測序質量值、測序深度等)[16,34],也要盡可能對臨床標本的背景成分信息如宿主核酸、微生物和試劑背景核酸等進行模擬;
(3)組合數據集:利用序列模擬軟件定量模擬一種或多種目標病原體的測序數據,然后將模擬序列添加到目標病原體陰性標本的真實測序數據中,形成接近臨床標本的模擬數據集 [16]。
利用上述數據開展性能確認,確定干實驗流程的主要性能指標,包括準確率、精確率、召回率和 F1-Score(即精確度和召回率的調和平均值)等 [28,35]。如果在比對過程中出現寄生蟲的假陽性結果(寄生蟲為真核生物,與宿主序列相似度較高,且部分寄生蟲基因組數據中存在人源序列的污染),需要考慮設置更高的陽性匯報閾值或者對相應寄生蟲的基因組數據進行清洗。常見的寄生蟲匯報閾值為與陰性對照相比 RPM 達到 10 倍以上,基因組數據清洗常采用把目標寄生蟲基因組單獨與人基因組比對并去除高度同源的序列 [36]。
表 1 模擬參考品示例
注:人源細胞濃度 1×10 5 cells/ml
- 批內精密度:將上述參考品在同一時間內用相同批次試劑完成 3 個全流程重復,分析批次內結果重復性。
- 批間精密度:用不同批次的試劑分別將上述參考品在 3 個工作日內完成各 3 個全流程重復,分析批次間重復性。
- 可接受標準:對陽性標本,分析結果是指通過生信流程得到的檢出病原中包括該參考品中的病原體,則記為正確結果,否則為錯誤結果。結果一致的實驗數占全部實驗數比例高于 95%,判斷為可接受。
- 樣本選擇:全流程檢測不少于 20 例標本,包括 6 例陽性參考品(每例模擬混合參考品包含不少于 4 種微生物),14 例臨床標本(不少于 10 例培養陽性)。分析檢測結果與已知參考品的內含微生物以及臨床綜合判斷結果是否一致,對于結果不一致的使用 qPCR 或者送至另一穩定運行的 mNGS 實驗室進行差異檢驗。
- 可接受標準:20 例標本中物種準確性≥90%,則驗證通過。對于臨床標本,金標準方法和結合臨床信息綜合判定的病原體在 mNGS 檢測結果列表之中可判定為符合。
- 濃度選擇:使用陽性參考品梯度稀釋至擬定的檢出限濃度,可重復測定 5 次或在不同批內對該濃度標本進行 20 次重復測定(如測定 5d,每天測定 4 份標本)。可根據情況選用稀釋液或陰性標本,該稀釋液不得含有被驗證的目標病原體。
- 判斷標準:如果是 5 次重復檢測,必須全部檢出靶核酸;如果是 20 次檢測,必須檢出至少 19 次(95% 檢出率)靶核酸。
- 實驗過程:將投入 5~10 倍 LoD 病原體的臨床模擬標本,在 4℃、-20℃冰箱分別保存 1、4、7d,在-80℃冰箱分別凍融 1 和 2 次,評估對檢測結果的影響。
- 可接受標準:所有重復均檢出目標病原體。
臨床檢測性能評價主要采用觀察性研究。觀察性研究中通過評價 mNGS 檢測結果與臨床其他參考方法結果的一致性,確認敏感性和特異性。研究應遵循《世界醫學大會赫爾辛基宣言》的倫理準則和國家涉及人的生物醫學研究倫理的相關要求,應當經倫理委員會審查并同意。標本量與預期用途、評價指標等多種因素相關。標本量估算通常是基于統計學要求的最低標本量估計 [41]。值得注意的是,在評價某些罕見的病原體,陽性病例的數量有限,可以引用文獻報道的臨床敏感性和特異性作為理論支撐 [42]。實驗室可采用 “代表性病原體” 進行臨床診斷性能評價 [43,44,45],比如根據臨床預期用途選擇不同類型的常見的病原體 [43],以期為同類病原體提供參考和借鑒。近年來已發表數篇基于腦脊液、呼吸道標本、血漿等標本類型的 mNGS 檢測流程和臨床性能確認的研究可供實驗方案參考 [16,25,36,46,47]。
- 盡早使用:危急重癥感染或局部感染不及時處理則后果嚴重,恐危及生命時,應在常規病原檢測基礎上,盡早使用 mNGS 檢測輔助明確病原體 [43,59];特殊病原體感染,存在群體性感染事件風險,應在開展常規快速檢測的同時,盡早使用 mNGS 檢測輔助明確病原體。
- 在治療過程中使用:高度疑似感染性疾病,但傳統微生物檢測反復陰性且治療效果不佳時,考慮在完善常規病原學檢測的同時或在其基礎上開展 mNGS 檢測;傳統病原學檢測的結果不能解釋臨床表現的全貌或/和抗感染治療的反應,懷疑同時存在其他病原感染時,考慮在進一步完善更多病原學檢測的同時或在其基礎上開展 mNGS 檢測;特殊患者如免疫抑制、器官移植術后、反復住院、合并基礎疾病,疑似繼發感染、新發感染時,考慮常規病原學檢測的同時或在其基礎上開展 mNGS 檢測 [60,61]。
- 擇期使用:表現為慢性或局部感染,或慢性疾病不除外感染,在嘗試常規病原學檢查未能明確致病源或/和規范性經驗抗感染治療無效時,建議在進一步完善常規病原學檢測的基礎上,與患者充分溝通后擇期使用 mNGS 檢測輔助明確病原體 [51]。
mNGS 檢測技術幾乎適用于所有類型的臨床標本,標本的選擇須結合患者情況、流行病學、病原體特性、受累器官及感染部位等狀況綜合考慮。懷疑高致病性、新發或突發傳染病原微生物時,標本運送須經相關部門批準,嚴格按照《人間傳染的病原微生物目錄》[63] 的危害程度分類及國際民用航空組織《危險品航空安全運輸技術細則》[64] 的分類包裝及轉運要求運輸標本,如通過其他交通工具運輸也應參照以上述標準 [65]。臨床常見標本的選擇見表 2。
表 2 mNGS 檢測的臨床標本類型
從無菌部位采集標本,應嚴格執行無菌操作,避免污染。從有菌部位采集標本,應采取相應防污染措施,避免定植或污染菌對結果的干擾。標本采集后應使用無菌、無核酸污染、帶蓋的專用容器,采集后封口膜密封,識別碼標記,及時(建議 2h 內)送檢。臨床在送檢時盡可能提供詳細的臨床信息(如患者流行病學史、感染癥狀體征、疑似感染灶、疑似病原體、影像學/病理學證據等)供實驗室人員綜合參考以便于測序數據的正確解讀。標本運輸過程中須防污染、防震蕩,使用冷鏈系統轉運。
法定傳染病病原體:包括《傳染病防治法》規定的各類傳染病病原體。病原體種類應根據國家相關法律法規的修正進行及時調整。其他烈性傳染病病原體:建議參考《人間傳染的病原微生物目錄》中對高致病性病原體的相關定義。
建議根據國家規定和驗證需求將標本在有資質的實驗室內進行分離培養、特異基因片段檢測、特異性抗原抗體檢測等方法復核。如沒有剩余標本,應在做好生物安全防護的情況下進行臨床重新采樣,應用傳染病診斷標準中規定的實驗室診斷技術進行病原檢測,基于病原檢測結果,結合臨床癥狀、流行病學史,依據現行傳染病診斷標準進行診斷。
如患者被診斷為傳染病的,按照《傳染病防治法》等法律法規規定的流程上報疾控部門,并且對患者、標本等進行規范的處置。應按要求將剩余標本或重新采集標本送上級部門進行確認,并上報患者情況,同時做好必要的患者隔離措施和相關治療工作。
若檢出疑似新發病原體,應立即組織專家開展研判,尤其當疑似新病原體的序列與已知的烈性或者高傳染性病原體序列相似,或者短時間內從≥2 例流行病學相關患者中檢出疑似新病原體時,應立即上報有關部門。
檢出法定傳染病及烈性傳染病病原,尤其是當檢出甲類傳染病(鼠疫、霍亂)以及部分傳染性較強、危害較大的乙類傳染病(如傳染性非典型肺炎、脊髓灰質炎、人類高致病性禽流感、炭疽等)病原體,應立即對下機數據的質量,特別是比對到烈性傳染病的特異性序列的準確性、讀長數、基因組覆蓋度等數據進行嚴格核實,確認可排除背景核酸污染以及特異性序列比對無誤的前提下,同時啟動標本復核程序。當從標本中檢出明確可導致感染且能排除污染、定植微生物和背景核酸時,應報告高度懷疑該病原菌為引起感染的病原菌。患者無菌部位標本如血液和腦脊液標本中檢出可疑病原菌,在無其他感染病原證據且能排除污染、定植微生物和背景核酸時,應報告為可疑致病微生物。從開放性腔道如呼吸道或可能存在皮膚定植菌污染部位的標本中檢出條件致病微生物時應結合序列數、文庫濃度、患者臨床病史信息、感染相關指標,會同多學科專家進行討論明確是否為責任病原體。報告單中應至少包含檢出的病原微生物種屬名稱、唯一比對的讀長數、相對豐度和室內質控數據,以及對術語、技術參數和病原微生物的注釋。mNGS 報告中的病原體物種名稱應標注標準的中英文名稱,部分可參考的網站包括細菌網站 https://lpsn.dsmz.de/和真菌網站 https://www.mycobank.org 等。
通過耐藥/毒力基因預測病原菌對抗菌藥物的敏感性以及病原體的致病力,可為臨床的抗感染治療提供參考依據。但需要注意的是,不是所有的耐藥/毒力基因存在即表達,可能存在基因型和表型不一致的情況;部分導致耐藥/致病的機制尚無法通過檢測基因來明確;目前對于耐藥/毒力基因的物種歸屬分析技術尚未完善。因此,應謹慎開展以耐藥/毒力基因來預測病原微生物耐藥性和致病力。對于實驗室可開展常規藥敏試驗檢測病原菌對抗菌藥物敏感性結果的藥物,不宜以耐藥基因結果進行預測,應以表型法藥敏試驗結果為準。
執筆人:
楊啟文(中國醫學科學院北京協和醫院檢驗科);馬筱玲(中國科學技術大學附屬第一醫院檢驗科);張建中(中國疾病預防控制中心傳染病預防控制所);李軼(河南省人民醫院檢驗科);吳文娟(上海市東方醫院檢驗科);楊繼勇(解放軍總醫院檢驗科);韓東升(浙江大學醫學院附屬第一醫院檢驗科);李家斌(安徽醫科大第一附屬醫院感染科);羅燕萍(解放軍總醫院檢驗科);周華(浙江大學醫學院附屬第一醫院呼吸科);谷麗(首都醫科大學附屬北京朝陽醫院感染科);張西京(空軍軍醫大學西京醫院重癥醫學科);李敏(上海交通大學醫學院附屬仁濟醫院檢驗科);單斌(昆明醫科大學附屬第一醫院檢驗科);胡付品(復旦大學附屬華山醫院抗生素研究所);劉正印(中國醫學科學院北京協和醫院感染科);周海健(中國疾病預防控制中心傳染病預防控制所)
主要審稿專家(按姓氏首字母順序排列):
陳德昌(上海交通大學醫學院附屬瑞金醫院重癥醫學科);馮四洲(中國醫學科學院血液病醫院血液科);顧兵(廣東省人民醫院檢驗科);胡繼紅(國家衛生健康委員會臨床檢驗中心);劉曉琳(國家衛生健康委員會合理用藥專家委員會);孫自鏞(華中科技大學附屬同濟醫院檢驗科);施毅(南京大學醫學院附屬金陵醫院呼吸科);王明貴(復旦大學附屬華山醫院抗生素研究所);王佳偉(首都醫科大學附屬北京同仁醫院神經內科);徐英春(中國醫學科學院北京協和醫院檢驗科);肖永紅(浙江大學醫學院附屬第一醫院感染科);俞云松(浙江省人民醫院感染科);張耀華(中國藥師協會);鄭磊(南方醫科大學南方醫院檢驗科);鄭波(北京大學第一醫院感染科);卓超(廣州醫科大學附屬第一醫院感染科);周鐵麗(溫州醫科大學附屬第一醫院檢驗科)
參考文獻:略