邏輯規律有所了解,才能避免在一些不切實際的幻想支配下做出不恰當的沖動決定。并且First in class 的創新產品很可能在人、財、物(特別是臨床樣本)、社會關系 …… 各方面存在著企業尚不具備的資源需求。只有對行業的內在邏輯規律有所了解,企業的最高負責人才能在紛繁復雜的資源投入需求面前做出正確有效的判斷、決策。
體外診斷試劑企業的中層研發技術人員,即研發經理、研發主管們可從此文中講述的技術策略、技術原則受益。
醫生和學術科研工作者,如果有意愿將自己的科研成果向臨床診斷產品轉化。讀讀此文也會很有益處。只有對體外診斷產品的研發、建立、監管審批的邏輯過程有所了解,才能對自己的科研成果處于這個過程鏈中的什么位置做到心中有數。才能對自己的成果轉化需要經歷怎樣的后續工作和現實困難有一個客觀評估?;旧?,本文合適的讀者人群也就如此了。
老敗并非體外診斷行業的專業研究者。本文內容是近幾年來在幾個創新診斷試劑研發工作中的觀察與思考。個人視角所限,感悟難免偏頗 ,諸君以批判的態度去讀就好。
體外診斷試劑產品研究、開發、注冊
審批的邏輯過程
老敗認為,普遍意義中的“產品研發”是一個廣義概念。它實際包含了“研究”與“開發”兩個含義?!把邪l”的英文,“Research And Development”,經常簡稱為“R&D“,更確切地表述了“研究”與“開發”的關系:“R”與“D”是用“&”相連接的,前后并列的兩項工作。
產品研究與開發的區別
“研究”與“開發”工作需要相區分、并列,是因為它們關注的要點與思維方式有相當大的差異。
產品研究
產品研究階段的主要工作是實驗方法學原理可行性的實現與驗證。它與學術科研有比較高的相似性。天馬行空、腦洞大開的想象力和創造力,廣博的知識面與好奇心、探索精神都是非常需要的。
產品開發
產品開發工作,是把一項原理可行的檢測實驗,轉化為可以應用于臨床診斷的,高度可靠的工業產品的工作過程。 這個工作過程必須遵循一定之規,整個過程對法規符合性,科學合理性、邏輯嚴謹性的要求非常之高。并且產品技術人員要對監管評審的思維理念有充分的理解才能做到因勢利導、投其所好、事半功倍。否者,以自己的獨到見解,一己之力去挑戰當前行業與審評員的固有觀念是雞蛋碰石頭!
鑒于“研究”與“開發”兩種工作性質對人的思維方式與基礎能力要求有顯著的傾向性差異,建議稍有規模的企業最好把這兩樣工作根據技術人員的專業素質特長布置給不同人員、小組去做。企業規模再大一點,可以分別到兩個部門去做。這樣可以更好地實現術業各有專攻,專業的人做專業的事,提高產品研發效率。
一個檢測產品的建立,首先是產品研究階段,進入這個階段之前我們需要盡量搞清楚這樣10項信息(后4項也可能在研發過程中修改、確定):
1. 檢測的靶標物質是什么?目標生物標志物是什么?
2. 檢測的臨床生物樣本是什么?
3. 檢測是否需要定量?定量精度需求是什么?
4. 靶標物質在樣本中的豐度如何,即所需的最低檢測限大約是什么?
5. 臨床生物樣本中主要的干擾物質是什么?
6. 樣本的采集、儲存、運輸的條件、時限要求是什么?
7. 檢測從開始到完成的時限要求是什么?
8. 檢測產品的成本要求是什么?
9. 檢測操作對使用者的技能,設備要求是否存在限制?
10. 知識產權要求、限制是什么?
有了這些信息輸入,構成了所需產品在檢測性能、技術性能、檢測成本 、應用場景各維度的限制邊界,研發人員就可以基于自己對當前檢測技術的了解和企業的技術特長,去選擇、改進相關的技術方法,嘗試實現這個檢測。
這個嘗試過程可以從理想條件下的模擬樣本、最昂貴的儀器設備、最優質的原料、耗材開始,以試錯實驗一步步地向邊界目標逼近。直至能夠做到在少量(幾十個)臨床生物樣本中 ,在上述10條所規定的邊界條件下實現檢測目標產品研究階段即可宣告勝利結束,轉入產品開發階段。產品研究工作是整個體外診斷試劑產品實現過程中從思維方式到實施過程都與學術科研相似度最高的一個階段。
從學術機構初出茅廬的年輕人,只要受過良好的科學思維訓練,具備扎實的實驗研究功底,具有好學肯干的工作態度,認真理解、仔細體會診斷試劑的產品需求與學術科研的差異(比如:高度的穩定、重復、抗干擾性能是前者最基本、最重要的要求,而后者可能更重視技術性能峰值),就可以很快上手。
而下一個階段,產品開發,盡管其工作內容在形式上主要也是試錯實驗,但工作目標,思維方式都與學術科研有很大不同。很多學術科研中基本可以忽略的問題,在產品開發中都是事關成敗的關鍵問題。別說學術科研機構,剛畢業的學生,即使 大學教授,沒有相當時間的熟悉與適應過程,也是無法獨立勝任產品開發工作的。
產品開發的工作內容與目的
體外診斷試劑是在世界各國都受到政府嚴厲監管的商業產品,必須通過注冊審批,產品方可上市。而體外診斷試劑產品注冊審批所關注的內容有兩塊:臨床前研究與臨床研究。
其中的“臨床前研究”,主要就是指產品開發階段的工作內容。其內容主要包括:
主要原材料研究
生產工藝研究
陽性閾值的設定
陽性閾值的驗證
干擾物研究(其實是驗證)
質檢方法與質檢標準的研究
產品的生產轉化與試生產
產品的全性能驗證
產品穩定性研究 (其實是驗證)
最后,還要通過產品技術性能的終極考核:注冊檢驗(簡稱“注冊檢”或“注檢” )
可能行外人士會感覺有點意外,監管者(藥監局評審員)對產品研究的過程并不十分關注。諸如歷經艱難困苦、百折不回,一步步改進配方,優化技術參數,提升檢測性能之類的精彩故事他完全不在乎。你講給他聽,也不會對產品獲批有任何幫助。
對產品研究工作,只需(且必須)在注冊申報資料中向評審員提供概要、總結性的研究數據,以展現研究達成的產品技術性能可以滿足該產品應用效能的需求就可以。監管者所真正關注的,是你如何把產品研究成果轉化成為臨床有效的產品,并確保穩定可靠地持續生產出來。
所以,他會依據質量管理體系( GMP )的要求,仔細審視產品開發過程中每一個步驟的邏輯合理性與研究數據的有效性,以確保產品開發的全過程是合理、嚴謹、有效的,并且良好生產是持續可控的。只有過程中的每一步都是合理、有效的,最終的優良結果才是真實可靠的,其監管邏輯非常明確合理。
注冊檢的意義與變化
體外診斷產品完成產品開發,生產轉換,三批試生產,注冊檢之后,產品的臨床前研究階段即告完成,可以進入臨床研究階段。
這里有必要對產品開發階段的最后一項工作,注冊檢多講幾句。在舊的法規要求里,注冊檢是產品臨床試驗、注冊申報之前的強制性要求,是必須通過的技術性能測試。并且要由具有資質和技術能力的官方機構,即國家或省級的檢驗鑒定研究院所來實施。產品創新度太高,以致各地方檢驗鑒定研究所都不具備評估技術能力的產品,由國家級機構即中國檢驗檢定研究院(簡稱中檢院)實施。
注冊檢是對產品技術指標的考核。通過了這個考核,則確認企業按照質量體系生產出來的產品確實能夠達到企業自己對該產品預設的技術指標。這個考核不涉及對產品臨床效能的評估。
但是,對一個前所未有的創新產品,只有當中檢院的專家確信企業為產品所設定的技術指標確實能夠滿足,甚至超出達成該產品預期臨床效能所需要的技術水平時,他才會答應給你做注冊檢。顯而易見,說服中檢院的專家并不容易,他答應給你做注冊檢并最終考試通過,其實是對你產品技術指標設置合理性的一種認可與背書。所以,在生物醫藥行業里,產品通過注冊檢被認為是通向產品注冊獲批道路上的一個重大里程碑事件。
最近,幾個月前,體外診斷試劑管理法規發生了重大調整。官方機構的注冊檢不再作為強制性要求,而成為一個由 “第三方” 實施的可選項。第三方注冊檢報告作為注冊申報中的支持性參考資料而存在。所以,在新規下,理論上企業對試生產產品自己做了全性能評估檢驗就可以繼續進行臨床試驗,然后向藥監局進行產品注冊申報。
對這一改變,業內人士的普遍看法是:法規條文的改變確實重大,但在現實操作層面,以前該怎么做,以后最好還是怎么做。因為,從藥監局評審員的角度,中檢院的作用是幫他把好技術關。有中檢院注冊檢的背書,評審員的責任壓力可以減輕不少。如果缺失了這個背書,壓力全集中到評審員頭上,他在巨大壓力之下,就不得不對你的產品拿著放大鏡橫挑鼻子豎挑眼,甚至雞蛋里面挑骨頭。而評審員這一關,是整個產品注冊申報過程中的最后一關。前期產品開發、臨床試驗以千萬計的資金已經投進去了,一旦此時在產品技術層面發現重大缺陷,整個大廈瞬間垮塌,這個風險實在沒必要去冒。
通過注冊檢是體外診斷試劑產品開發完成的標志。產品就此定型,產品技術要求,關鍵原材料,關鍵工藝不許再有更改。后續臨床試驗所使用的產品,必須按照這些既定的技術方法與技術條件,在GMP 規范下生產出來,才能有效支持產品的注冊申報。這些一旦有所變更,則注冊檢作廢,動輒百、八十萬的成本投入與至少半年的時間作廢。
在中國,體外診斷試劑劃分為三類:
其中的一類產品(比如剪子、棉簽之類)無需進行臨床試驗。
二、三類產品一般都須進行臨床試驗(少數成熟產品可以豁免)。
在醫療器械質量管理體系的術語中, 臨床試驗被稱為對產品的“確認” 。只有在臨床試驗中表現良好,才能確認產品是臨床有效的,才能夠獲得注冊審批。
產品注冊臨床試驗
體外診斷試劑產品的注冊臨床試驗,在研究設計上可以有“觀察性”與“干預性”兩類。
“觀察性”研究
在 “觀察性”研究中,并不按照待考評產品的檢測結果對患者施加任何治療措施。只用待考評產品和“金標準”方法對同一批臨床樣本進行檢測,然后按樣本配對考察兩種方法的檢測結果一致率來評判待考評試劑是否可以滿足臨床性能要求 。
“干預性”臨床試驗
對尚不存在“金標準檢測方法的創新型檢測產品,則需要設計干預性臨床試驗,依據待考評產品的檢測結果對患者進行治療,并根據療效判定待考評產品的臨床效能。
干預性臨床試驗顯然在倫理委員會這一關要難過許多。首先,你得拿出前期的臨床科研證據,至少是單中心、中等樣本量的干預性研究,表明你的創新產品有足夠高的安全性,并且是大概率可以使患者獲益的。并且,在注冊臨床試驗的研究設計上還得保證對照組患者至少可以獲得當前臨床常規水平的治療,不可以遭受額外的風險與損害。
需要注意的是,按照法規原則,即使當前尚不存在可以全面評價創新檢測產品的“金標準”方法,因而設計了干預性臨床試驗來證明產品的臨床有效性。同時,還是要找一個當前與之最近似的檢測方法來做技術性能的對比觀察。
注冊臨床試驗,經常是體外診斷試劑產品開發過程中耗時最長,資金花費最大的一個階段。經典、常規 、樣本來源容易的二類產品或許可以幾個月搞定,創新型三類產品,如果需要追蹤患者的臨床結局, 多中心臨床試驗做上兩、三年是經常的。其中各種失誤、事故、合規性風險、醫患糾紛風險 …… 時常會出現一招不慎,滿盤皆輸 ,前功盡棄的危機,亞歷山大!
產品的藥監審批
完成了臨床試驗,各研究中心出好了研究報告。與臨床前研究資料整理在一起,就可以向藥監局遞交注冊申報資料了。
一類產品無需注冊檢和臨床試驗,把資料在(地級)市局備案就可以
二類產品由省局審批
三類產品由國家局審批
一年多前的新規,增加了預審流程。企業可能被告知需要對資料做些補充、完善才能通過預審,給予“立卷”。立卷后進入正式審查。新規是:臨床前研究與臨床研究由藥監局評審中心兩個部門(審評六部與臨床二部)各出一個評審員小組分別審查。
不要幻想審查可以一次通過,這種情況歷史上從沒出現過,將來也不會出現。審查后會通知企業對申報資料進行解釋和補充。這個步驟稱作“發補”,“發回以補充資料”的意思。臨床前研究與臨床研究數據的有效性、充分性都可能被質疑,都可能被要求補充研究、補充數據。一年之內,企業必須將評審員所要求的資料補齊。他們再審,滿意了給你批證。仍不滿意,則駁回注冊申請,產品開發失敗。
從遞交申請資料到產品獲批發證的過程耗時,國家藥監局每月都有統計。最近的統計(2022年3月)是365個工作日,大約相當于1.5個自然年。大家在做產品時間規劃的時候對此需要有客觀的預期。
上面就是體外診斷試劑產品從產品研究 到注冊獲批的邏輯過程的概述。對三類產品,即使是個沒啥創新性的me too產品,這個過程走上三年也不算多。創新強、臨床試驗難做的三類產品,這個過程搞上五年很正常??傆嫽ㄙM,最常規的三類產品也得幾百萬。創新、復雜的三類產品沒幾千萬下不來。
體外診斷試劑的產品研究
這里的產品研究專指體外診斷試劑產品建立過程中的第一個工作階段。首先重復一下體外診斷試劑產品的研究目標需要明確 的10項限制條件:
1
檢測的靶標物質是什么?目標生物標志物是什么?
2
檢測的臨床生物樣本是什么?
3
檢測是否需要定量?定量精度需求是什么?
4
靶標物質在樣本中的豐度如何,即所需的最低檢測限大約是什么?
5
臨床生物樣本中主要的干擾物質是什么?
6
樣本的采集、儲存、運輸的條件、時限要求是什么?
7
檢測從開始到完成的時限要求是什么?
8
檢測產品的成本要求是什么?
9
檢測操作對使用者的技能,設備要求是否存在限制?
10
知識產權要求、限制是什么?
這10條中的前6條可以說是科學性的要求,后4條是市場與應用要求。產品研究階段的工作雖然以產品建立為目標,必須考慮很多學術科研中無需顧忌的市場與應用方面的各種需求。但在工作早期可以先把這些限制條件擱置一邊,用最優資源條件去努力實現檢測的科學性要求,即檢測所需的核心性能,達成前述產品邊界條件的第4和第5項,即滿足最低檢測限和抗干擾性能。
產品最低檢測限的概念與設置
最低檢測限的概念可以有兩個層面。
技術最低檢測限
它首先是個純檢測技術層面的概念,是某產品所使用的檢測技術對靶標物質可以進行“良好檢測”時,靶標物質在預期樣本中 的豐度摩爾分數低限(本文稱之為“技術最低檢測限”)。就是說,當靶標物質豐度 少于這個低限時,該檢測就會技術失效,無法可靠檢出了。
產品最低檢測限
第二個層面是由產品應用的具體技術參數與生物學客觀現實共同界定的, 即在檢測的生物樣本使用量下,靶標物質在絕大多數樣本95%以上)中的最低豐度,也就是95%分位值,即是這個產品最低檢測限 的合理數值(本文稱之為“產品最低檢測限”)。
所以,從產品研發角度,研發的優化目標,就是使技術最低檢測限低于,或至少等于產品最低檢測限。只有達成這個目標,才能使95%以上的樣本得到“良好檢測”,滿足產品的臨床檢測應用要求(法規規定檢測失敗率不許高于5%),才是一個合格的產品。
在此需要強調的是,產品最低檢測限是受檢測所使用的生物樣本量限制的,在特定的生物樣本使用量下有著特定的物理極限(見后面討論),不應把技術最低檢測限與產品最低檢測限簡單等同。
良好檢測
這里的“良好檢測”又該如何定義呢?“良好檢測”的定義應該是:通過對檢測數據的分析,可以對目標生物標志物獲得定量或定性的有效測量。而這個測量結果所蘊含的生物學意義,可以幫助臨床醫生針對性地為患者選擇干預措施。為達成這個目的,需要設置一個判斷閾值去解釋生物標志物的測量結果,也就是陽性閾值(后面在產品開發章節再具體討論如何確定這個閾值)。這個閾值就用來指導、建議臨床醫生,高過它對患者采取什么治療方案,低于它又該選擇什么治療方案,進而使患者受益。
所以,總結一下:
一個體外診斷產品的最低檢測限,談的是檢測的靶標物質的摩爾分數。
產品最低檢測限應該設定為在預期檢測樣本中靶標物質豐度的95%分位數,這才能保證在95%以上的預期樣本中都能實現“良好檢測”。
而“良好檢測”,談的是生物標志物,指的是通過檢測靶標物質所獲得的數據可以使目標生物標志物得到有效測量,且測量結果可以與一個預設的陽性閾值進行比較,高于或低于這個閾值,醫生就可以對患者采取不同的干預手段。
當靶標物質的摩爾分數用作目標生物標志物時,對目標生物標志物的測量,就是對靶標物質摩爾分數的測量,二者之間是可以相互比較大小的數值。此時,一個合格的檢測產品應該做到,技術最低檢測限≤產品最低檢測<檢測陽性閾值。
微生物感染的體外診斷產品是靶標物質的摩爾分數用作目標生物標志物的典型代表。這類產品的最低檢測限與陽性閾值所測量的都是目標病原體在生物樣本中的載量。
背景閱讀
病原體感染與致病的劑量效應
傳統上,致病微生物有“專性病原體”(obligate pathogen)與“兼性病原體” (opportunistic pathogen)之分。對專性病原體,長久以來的認知是,它們就不該在人體內出現。一旦出現就說明人遭到了感染,就是患病。而兼性病原體,意思是它們在正常人體內是存在的,只有當某些特殊情況下,比如免疫力低下狀態,才會使人致病。
現代病原生物學越來越多的研究數據表明,即使是所謂的專性病原體,對宿主的感染、致病也是劑量依賴性的(本文稱作“侵入劑量”)。其中的道理在于,病原體侵入人體之后要經歷一個增殖過程,在體內數量增大到一定程度(本文稱之為“致病閾值”)才會對人體造成危害,出現癥狀。這個增殖過程就是所謂的潛伏期。
需要注意的是,病原體在人體內的增殖與被免疫系統殺滅是同時發生的。也就是說,在任意給定瞬間,都會有 N 個病原體繁殖出來,同時又另有 M 個病原體被殺死。只有 N 大于 M 時,病原體總量才會逐漸增多,直至達到致病閾值而出現癥狀、發病。如果 N 小于 M,則病原體會被逐漸清除。也就是說,還沒有出現癥狀,人就康復了。
病原體在人體內的繁殖是以指數增長的,所以 N 這個數值與起始量,也就是侵入劑量,關系很大。侵入劑量增大一點,N 就以指數增大,大很多。而另一方面,在病原體侵入初期,免疫系統還沒有被充分調動起來的情況下,人體殺滅病原體能力基本是恒定有限的,并不因侵入劑量的增大而增強。所以 M 值并不因侵入劑量的增大而增加很多。其綜合效果就是,感染之后,人最終是否會發病,除了個體 “抵抗力”以外,侵入劑量是個重要因素。侵入劑量越大,N 大于 M 可能性就越大,最終發病的可能性就越大。侵入劑量越小, M 大于 N的可能性就越大,最終發病的可能性就越小。
對特定的病原體而言,其感染建立,導致人體發病,所需的最小侵入劑量(本文稱之為“感染閾值”)是由其內在生物學特性決定的,可以用來作為表征病原體毒力強弱的指標之一。比如,痢疾桿菌是致病最強的細菌之一,吃下去 7 個即有可能致病。而炭疽菌感染所需的侵入劑量要大許多,至少要幾萬個細菌(孢子)才行。
病原體感染、致病的劑量效應決定了病原體侵入人體之后可能出現兩種發展轉歸的簡化模型。
第一種情況(本文稱為“一類感染者”),如果人的抵抗力弱,侵入劑量大,超過了“感染閾值”,病原體在人體內的繁殖速度就會大于殺滅速度,在經歷了一段潛伏期,病原體數目增加到一定量(致病閾值)時就會對人體顯著造成損害而出現癥狀。
第二種情況(本文稱為“二類感染者”),如果人的抵抗力強,侵入計量小,沒有超過“感染閾值”,病原體的繁殖速度就小于殺滅速度,病原體在人體內的數目就會出現以侵入劑量為峰值,逐漸減少(可能會有波動),直至徹底清除的過程。
那么,現在問題來了,病原體感染檢測產品的最低檢測限與陽性閾值應該如何設置才最有臨床價值?
從指導臨床干預角度,檢測指標應該能夠準確反映上述感染轉歸過程中的幾個關鍵數值才最有幫助。具體而言,檢測的產品最低檢測限應該設置為感染閾值。而檢測的陽性閾值應該設置為與致病閾值相同,這樣才是一種理想的體外診斷產品。遺憾的是,當前幾乎還沒有任何病原體體外診斷產品達成這個理想。
傳統的微生物檢測手段十分低效,比如涂片染色-顯微鏡觀察,只有當病原體在生物樣本中的載量遠超致病閾值的情況下才能被觀察到。也就是說,傳統方法的技術最低檢測限高于病原體的致病閾值。這種情況下,技術最低檢測限、產品最低檢測限只好與檢測陽性閾值合為一體了。于是,定量也失去了意義,檢測以定性的方式進行就可以,只要觀察到目標病原體,就報告“陽性”。
局限于傳統微生物檢測技術手段的低效性、低靈敏度而形成了“專性病原體”這個概念。檢測中一旦發現這些病原體的存在,就判斷為“患病”,這在技術最低檢測限高于病原體致病閾值的無奈情況下是沒毛病的。但是,在檢測技術高度發展的今天,PCR技術已經把微生物檢測的靈敏度提升了很多個數量級,理論上已經可以檢出單個微生物的存在。現在如果仍然不做具體問題具體分析,固守“專性病原體不該從健康人體內檢出”的傳統觀念,對專性病原體一律把技術最低檢測限當作陽性閾值來用,就難免出現刻舟求劍的尷尬了。
背景閱讀
當前新冠核酸檢測存在的尷尬
當前的新冠核酸檢測就存在著陽性閾值設置不合理的問題。你如果去查看一下各廠家的產品說明書,或藥監發布的注冊審批報告就可以發現:當前新冠核酸檢測的技術最低檢測限基本都是在Ct 40之下,每毫升幾百個病毒這一量級(以每毫升200個最為常見)。
熟悉qPCR檢測的讀者都知道,一個 qPCR反應的總體積,也就是診斷試劑與樣本體積之和,一般在10到50微升之間。其中可以留給樣本的體積一般在10微升以下,最多20微升。以每毫升200個的病毒載量,即使以樣本體積 20 微升計算,每反應的平均病毒數目只有 4 個。這是一個非常、非常敏感的檢測!
新冠病毒是個新發、致命病原體,顯然立刻就被當作專性病原體對待了。核酸檢測的技術最低檢測限就被當作了陽性閾值來應用,初期還問題不大,但隨著病毒演化,傳播力更強、毒力更弱的變異毒株成為了主流,再加上大范圍接種了疫苗,就出現了“無癥狀陽性”大幅增加的現象。
近期上海查出的幾十萬核酸檢測陽性案例中 95%以上都是無癥狀感染者。而這些“無癥狀陽性”中絕大多數人會保持無癥狀直到轉陰。這提示著,當前的疫苗雖然無法阻止病毒的侵入,但增加了感染初期人體對病毒的殺滅能力,與病毒毒力的減弱形成疊加效應,使得感染閾值升高。其后果是,更多的人在暴露于病毒時,所遭受的侵入劑量低于感染閾值,于是,最終病毒清除而沒有發病,成為了前述病原體在人體內發展轉歸簡化模型中的“二類感染者”。
以PCR的高靈敏度,新冠核酸檢測的技術最低檢測限顯然已經低于了感染閾值,當把這個最低檢測限用作陽性閾值時。大量的“二類感染者”就會被“陽性”檢出。這些 “二類感染者”無需任何治療。對他們而言,這樣“陽”上一次,不僅無害,反而有益。因為這就相當于接受了一次減毒活疫苗的加強免疫,是喜不是憂。所以,檢出“無癥狀陽性“對臨床治療并無實際意義。按照對待專性病原體的傳統觀念,把新冠核酸檢測產品技術最低檢測限直接當作陽性閾值的做法已經失去了合理性。
顯然,臨床醫生們已經察覺到了這個不合理。所以新版診療指南里(第九版)把陽性閾值從Ct 40改成了Ct 35。按照 qPCR定量原理,Ct值減少5個,理論上相當于病毒量上升至32倍(2的5次方)?,F在把陽性閾值上調為高于技術最低檢測限是合理的。但這個上調幅度是否充分合理,仍然缺乏數據支持。新冠病毒感染、轉歸過程中的幾個關鍵數值,即,感染閾值和致病閾值都需要以臨床研究去確定,老敗還沒見到過相關研究數據。
在各種臨床檢測中,目標生物標志物不一定是靶標物質的摩爾分數,而可以是靶標物質所承載的其它屬性。比如,在很多分子檢測中,靶標物質是核酸(DNA或RNA),但目標生物標志物卻不是核酸的摩爾分數,而可能是某個染色體、染色體片段或基因的拷貝數,也可能是某種基因型,還可能是mRNA表達譜。
在這類檢測產品的研發中也要為產品設置最低檢測限。如前所述,此時的產品最低檢測限應該設置為核酸(DNA或RNA)在預期檢測樣本中摩爾分數的95%分位值。產品必須要對最低檢測限樣本實現良好檢測才算是個合格產品。所以,此時的最低檢測限只具有檢測技術層面的意義,不具有任何臨床意義。
而此時目標生物標志物的測量結果并非核酸的摩爾分數,而是其它的生物信息數據。我們需要為這些生物信息數據的測量結果設置陽性閾值以指導臨床干預。此時,陽性閾值需要從另外研究中獲得,其數值也與產品最低檢測限沒有直接關聯,不能直接比較。
前面講過,產品研究的工作目標,首先就是優化檢測反應,使檢測的技術最低檢測限低于,至少等于產品最低檢測限。這個工作先要用模擬樣本來進行。首先獲得檢測靶標物質的純品,做梯度稀釋,以選定技術方法進行檢測,觀察在產品最低檢測限下是否可以對目標生物標志物實現良好測量。如果不能,則改進方法再試,直至達成目標。
檢測干擾物的研究
實現預期的產品最低檢測限后,即可向模擬樣本中梯度添加干擾物質,重復前面的試錯優化工作,直到在預期干擾水平下仍可重復、穩定地達成最低檢測限要求。
干擾物質的種類和所需的抗干擾能力的強弱需要從生物樣本采集、樣本預處理方法、檢測方法學特性等方面綜合考慮。比如:
檢測靶標物質是DNA時,RNA經常不是很需要擔心的干擾物質。但反過來,檢測靶標物質是RNA時,DNA的干擾經常必須重視。
微生物宏基因組檢測時,人DNA是干擾物質。反過來,微生物DNA也可能成為人DNA檢測的干擾物質。
對血清中某一種抗體進行檢測,血清中的其它抗體都會成為干擾物質。
血紅蛋白可能是一切以血液為生物樣本的檢測都需要考慮的干擾物質(除了血紅蛋白檢測本身)。
而對一個PCR檢測來說,是使用從血液提取的DNA作為檢測樣本,還是直接用全血為作檢測樣本,對血紅蛋白的抗干擾能力需求完全不是一個數量級的。
當前,臨床檢測的一個重要發展方向是POCT(Point of Care Testing)化。檢測儀器設備的自動化,操作過程的“傻瓜化”,是實現POCT的關鍵。而提高檢測試劑的抗干擾能力,以簡化樣本預處理過程,進而更加易于自動化操作的實現,降低檢測成本,縮短檢測時間,則是POCT檢測系統研發的重要技術途徑。
用模擬樣本達成滿意的最低檢測限與抗干擾性能后,要用少量(幾個到十幾個)新鮮臨床樣本進行驗證,如果成功,就要開始考慮市場與應用方面的研發目標了,即,在保證檢測核心性能的條件下實現邊界條件 6-10。
需要額外說明的是,“干擾物研究”是產品注冊申報中,臨床前研究資料的重要內容之一。只不過,申報提交的數據需要以三批試生產產品做出來才有效。所以,從性質上說,那是在產品開發階段對產品抗干擾能力的驗證。
檢測應用層面的相關研究
前述第10條,知識產權要求,規避別人的專利,通常是硬性要求。要認真研究目標專利的權力要求。其權力要求中只要有一條在咱們的技術方法中沒有采用,咱們就不構成侵權。研究清楚以后就可以相應調整技術方法,繞開他的專利。
前述第7-9條,對檢測的時限、人員、設備、成本要求都是檢測的應用與商業要求。可能要求很嚴,也可能不那么嚴格。須知各項指標都做高標準、嚴要求是高難度的挑戰!甚至經常是不可能完成的任務。有舍才能有得才是這個世界的一般規律。這種要求一般來自于市場與產品部門,所以,在研發優化過程中要與他們保持密切溝通,了解各項指標之間相互妥協、退讓、相互遷就的可行性,采取相應對策。很有可能,它們中的某項要求是必須達成硬指標,其它性能可以妥協。研發人員要是理解錯了,干得再好都是無用功。
接下來需要通過研究工作確定限制條件6,即,“樣本的采集、儲存、運輸的條件、時限要求” 。除非研發目標本身就是對這些內容的改進,多數時候市場、產品部門對這些技術指標沒有硬性要求,研發部門通過實測把邊界條件摸清就好。
研發實驗策略的幾個注意點
在研發工作中,在實驗策略方面有幾點值得說一下。一個是,在梯度設置中,比如干擾物濃度梯度,儲存運輸的溫度梯度、時間梯度等等,一定要把范圍擴大到“做不出來” 為止。搞清各技術參數的極限邊界,一旦各種技術需求相沖突時,才好綜合平衡,有的放矢地做出調整、妥協。另外,在將來現實應用中,發生錯誤、事故在所難免,對檢測的失效邊界做到心里有數,對將來挽救事故樣本極有幫助。
再一個是,在做Me too或Me better產品研發時,友商的競品試劑經??梢云鸬綆椭饔?。尤其是在做性能追趕時,把競品試劑與自家產品做單組份交互替換實驗,經常立刻可以找到問題的關鍵所在。
當產品最低檢測限的要求非常高,也就是靶標物質的摩爾分數非常低時,必須要考慮檢測的物理極限問題。新的技術手段, 特別是核酸擴增技術,二代測序,ddPCR技術越來越廣泛的應用,檢測靈敏度越來越高。對目標生物標志物良好測量的瓶頸經常從檢測方法學的限制轉變為靶標物質在生物樣本中豐度的限制。如果這個豐度非常低,即使檢測的技術最低檢測限可以做到這么低,但把產品最低檢測限做到這么低卻受著物理極限的限制。前面提到的新冠病毒檢測就存在這個問題。
當前新冠核酸檢測多數的產品最低檢測限為每毫升200個病毒,如果每反應只加入5微升樣本,平均每反應的病毒數目只有1個。這樣,從概率上講,會有 1/3檢測反應中1個病毒都沒有,1/3檢測反應中有1個以上病毒,只有 1/3檢測反應中剛好1個病毒。即使qRT-PCR的靈敏度可以達到單模板水平,仍然不可避免地會出現 1/3的檢測的假陰性。所以該產品要想達到每毫升200個病毒的產品最低檢測限,檢測樣本使用量就絕不能是 5微升,而至少是15-20微升才能滿足這個最低檢測限要求。
再比如,cfDNA檢測以千分之一,甚至萬分之一的腫瘤稀有體細胞突變為目標生物標志物,那么,每個檢測反應靶標物質的投入量,受物理極限的限制就必須不能低。假設每拷貝人類基因組5皮克,以千分之一稀有體細胞突變為檢測目標,cfDNA 的使用量的物理極限就是5納克。而根據概率分布原理,即使使用5納克,也會有1/3的概率出現取樣錯誤而發生漏檢。所以,一般至少要把cfDNA的使用量提升到20納克才對千分之一水平的稀有突變達成比較可靠的檢測。同理,對那些聲稱可以檢出萬分之一的腫瘤稀有體細胞突技術,cfDNA的使用量就不得不提升到200納克!那可能需要從上百毫升的血漿中才能獲得。如果不前置在體(in vivo)富集手段,這樣的檢測臨床實用性很低。
體外診斷試劑的產品開發
體外診斷產品的開發的工作內容,從形式上主要還是實驗數據的產生與分析,但從工作的目的、性質上來看,解決的都是學術科研中基本不必操心,而對檢測產品有效性至關重要的問題。
產品開發工作,對藥監局評審中心已經發布過“審評指導原則”的成熟產品,逐條照著“指導原則”去做就是,無需在此討論。
對創新度高,前所未有的產品,則只能按照監管法規、質量體系里面的原則性要求去實施產品開發工作。但那些條文寫得高度概括,而且經常很感性,不時出現“適當的”、“足夠的”這類高深莫測的形容詞,如何把這些感性原則落地為自己產品的開發流程、研究證據、驗證數據,是艱難的挑戰。關鍵難點在于,產品的開發過程、數據是否確實達成了這些感性原則的要求,最終評判者不是你自己,而是藥監局評審員。是否“適當”、是否“足夠”,的判定,取決于各種“一定之規”、“約定俗成”、與評審員的個人自由裁量權。所以產品開發人員必須對行業慣例與評審員的思維心理很熟悉,才能不給自己挖坑,避免到了產品注冊申報的最后階段曝出無可挽回的過程缺陷,導致產品重大失敗。
說到這里,可能會讓讀者感覺評審員吹毛求疵,很可怕。事實上,他們的評審邏輯確實是吹毛求疵,很可怕。簡而言之,一切技術法規、指南、共識里沒有做“死規定”,而是規定了一個范圍的,你都按最高標準要求自己就平安無事。
而一切都達到最高標準,顯然各種資源耗費,人力、物力、時間都是最大化的,經常是難以承受的。你不是不可以節省點,降低點標準要求,但任何標準降低,評審員都會要求你拿出充分的研究證據和數據來證明,在這個較低的標準之下,你的產品仍然可以保證技術要求的良好實現、產品穩定生產、臨床效能達成。而這個證明過程又必須是在最嚴格的論證邏輯之下,以最嚴謹的研究設計,最充分的樣本數據量去實現的。所以,這些額外的驗證、證明工作的難度之高,工作量之大,很可能讓你在心里掂量、掂量:“算了咱就按業內慣常最高標準去做還省事點”。如果,客觀現實使你確實無法按業內慣常最高標準去做,那你就別無選擇,必須以嚴格的論證邏輯,嚴謹的研究設計,充分的樣本數據量向評審員證明,在這個較低的標準之下,你的產品仍然可以保證技術要求的良好實現、產品穩定生產、臨床效能達成。
以監管審批倒逼企業做最高質量的工作,邏輯就在這里。這是對產品開發總監的巨大挑戰,也是企業最高負責人在籌劃、審批產品開發的資源的投入時需要理解的行業背景。
產品的主要原材料研究與原材料困境
原材料研究是體外診斷試劑產品開發中至關重要的一個環節。歷史經驗表明,產品品質出現波動、不穩定,八成跟原材料品質的不穩定有關。
產品的主要原材料研究要放在產品開發的第一步來進行,是因為它是一件牽一發而動全身的事情。產品的一切技術、性能參數都是基于某種,或某幾種特定的主要原材料而言的。從邏輯上說,后期在主要原材料上發生的任何變更,都導致前期的研究、驗證數據失效。如果堅持變更,就要把前期已經做過的工作重來一遍。這個邏輯原則評審員會嚴格要求,所以咱們也必須遵守。
如果不想浪費時間與各種資源顛來倒去地做羅圈事情,最好在產品開發的第一步就把主要原材料的研究做好,找到性能合格,供應持續可靠的產品原材料,把主要原材料的供應商、關鍵技術參數定下來,后續的一切工作都以確定原料所配制的研發批產品進行。
體外診斷試劑的關鍵原材料多種多樣。老敗在此以自己比較熟悉的酶和抗體為例來說說其中的糾結。
這兩樣作為體外診斷試劑原料,目前都不能令人滿意,主要表現在:持續生產、供應中的批次穩定性差,基本還停留在初級工業品、甚至科研實驗室的水平,遠達不到現代工業的高標準。而體外診斷試劑,事關人群健康,對產品品質穩定有著非常高的要求。如何用不那么穩定的原料去生產非常穩定的產品,這是體外診斷試劑行業在技術工藝方面面臨的艱巨挑戰。
酶
酶,是少數幾種用“活性單位”,而不用重量(質量)來定量的單質之一。不要以為這種特立獨行是一種“高大上”,這是個“沒有辦法的辦法”而已。
單質的純度通常用百分比來表示。比如,金子的純度輕松可以做到小數點后面若干個“9”。酶是一種蛋白質單質,蛋白質的純化,純度能達到 95%經常就算優秀水平了,90%有時也不得不接受。
體外診斷試劑所用的酶原料通常是以微生物發酵的方式生產出來的,發酵結束后把微生物收集、破碎,用復雜的工藝,把所需要的酶純化出來。而當前的純化水平,在合理、可接受的成本限制之下,達到 95%就算不錯了。并且,這95%里有多少是三級結構正確,有生物活性的酶還很難說,那5%的雜質是些什么東西?不知道!其中是否會存在著某些成份可能會對酶活產生抑制或干擾?不知道!不知道這些,很難確切控制產品酶的活性。
所以,不同批次之間的酶,從蛋白定量看純度雖然都是 95%,但活性卻經常有顯著差異。以至于用重量去表征不同批次的酶已經失去了實際意義,只好直接用活性來定義酶有多少。
這樣做,有一個麻煩在于,一種酶經常是有不同生物活性的,比如一個完全體的DNA聚合酶,除了DNA聚合酶活性外,還可以有 3-5外切酶活性、5-3外切酶活性、鏈置換活性,其processivity決定了鏈延伸可以跑多長,也就是擴增產物可以有多長。而DNA聚合酶的出廠質檢,通常只以DNA聚合酶活性當作唯一的質檢標準。但是,很可能,除了 DNA聚合酶活性以外,上述其它某種生物活性在一個診斷產品中也發揮著關鍵作用。
如果這個原料酶廠家“改進”了生產工藝,從他自身的角度看,確保了DNA聚合酶活性,產品通過出廠質檢完全沒毛病。但這個“改進”很可能同時悄悄改變了酶的其它生物學活性,用于這個診斷產品時就產生不了預期的效能,引發大麻煩!
針對這類風險,質量管理體系做出了預防要求。那就是,體外診斷試劑的合格供應商必須也具備良好的質量管理體系,確保生產工藝不會在不知不覺之下被擅自改變。同時,在質量體系控制下的工藝改變必須提前知會客戶,以確保在新工藝下生產的產品仍然可以良好滿足客戶需求。這樣,體外診斷試劑的產品開發工作,就延伸到了供應商管理的層面。在做關鍵原材料研究時,還需要考察供應商的質量體系是否可以滿足要求,這通常是與采購、質量部門聯合實施的。
保證酶原料的品質穩定,理想方式是采用“定制化”的方法去做。就是說服供應商同意,按照咱們用戶的質檢方法、質檢標準收貨。甚至,咱們可以把質檢方法、質檢標準提供給供應商,作為向咱們供貨的專用出廠質檢標準。這樣做的唯一困難在于可行性問題,只有當咱們的訂貨量足夠大,咱們才處于強勢的市場地位,供應商才會答應咱們的這類要求。
抗體
作為體外診斷試劑關鍵原料,抗體也有其獨特難點。你如果做過抗體的研發、制備工作就會知道,那是一門藝術,并且有著太多的運氣成分。
如果是多抗,在相同的免疫原和免疫方案下,并沒有技術可以保證每只兔子產出的抗體都能滿足特定的產品性能需求。你不知道能有幾只兔子,哪幾只兔子血漿中出來的抗體對你的產品可以有滿意效果。極端情況下或許只有一只!那這只兔子就成了這種產品的“金兔子”,必須好生伺候著,持續收它的血清,以維持這個產品的生產。在這只兔子老死前,趕緊去免疫更多的兔子,尋找下一只“金兔子”,如果找不到,產品斷檔死掉,這種事情不是沒有發生過。
單抗不用兔子,用免疫小鼠后獲得的B淋巴細胞與瘤細胞融合,而形成既可以產生抗體,又無限繁殖的永生化雜交瘤細胞。篩選出單細胞克隆保留下來,即可生產具有極高特異性的單克隆抗體。但有時候,單克隆抗體的生產也會有類似“絕種金兔子”的尷尬。
用特定抗原(即使是只有一個預測表位的多肽)免疫小鼠,從小鼠體內篩選出的幾個單抗細胞克隆,都能產生針對該抗原的單抗。但這些單抗(即使來源于同一只小鼠)做出的產品,對該抗原的檢測性能可能會很不一樣。所以你看各家單抗產品那名字,多是一串意義不明,看上去相當隨機的字母與數字組合,那是在單克隆篩選工作中產生的流水號唯一碼。其意義在于每一個單抗細胞株都有一個唯一代碼,避免互相混淆。
對某個產品而言性能最好的單抗,可能僅來自于某個特定的細胞克隆,其它的都不理想,這時候,這個細胞克隆的維持培養就成了關鍵問題。雜交瘤細胞理論上是永生化的,可以無限傳代繁殖、培養下去。但腫瘤細胞內在本質的不穩定性可能會造成麻煩。一個珍貴的雜交瘤細胞,越養越弱,最終養絕種了,或者養著、養著,產出的抗體性能變差了,這種事情經常發生。如果真出了這種事情,合格的替代抗體原料又還沒找到,那可真是欲哭無淚!
第一個被美國 FDA批準上市的循環腫瘤細胞捕獲產品,強生公司的CellSearch,幾乎是誰用誰抱怨它不準,謠傳就是因為最初的單抗細胞株養死了,再也找不到那么好的單抗了。
應對這類風險,質量管理體系也有建議,那就是,在產品開發過程中,要為關鍵原材料找到至少兩家合格供應商,可萬事都是知易行難,談何容易!
試劑管
酶和抗體作為體外診斷試劑的關鍵原材料很容易理解,但有些在學術科研中毫不起眼的小東西,在產品實現中也可能存在陷阱,需要在產品開發中識別并解決,比如,裝試劑的管子。
管子是否堪用,能否滿足產品的清潔度要求具有一票否決權。不同產品所需關注的污染物質種類、程度各不相同,備選管子原料是否合格需要設計相應的實驗來鑒定、驗證。
必須注意的是,這時候所面對的污染很可能是1%量級的低概率事件。也就是100個管子中才有一個存在不能接受的特定污染。而體外診斷產品需要把產品的可靠性提到99.9%甚至更高。所以,少量抽樣檢查幾個、十幾個樣本是無法滿足要求的,只有幾十、上百個地做上多批、多次才能獲得比較可靠的評估結果。
清潔度要求以外,體外診斷試劑所用的管子,經常要面臨低溫(液氮、干冰)、高溫(水浴、PCR儀、烤箱),有機溶劑(乙醇、甲醇),各種酸、堿、紫外線、放射線,反復捏擠的虐待。要求在這些挑戰之下不裂、不破、不變形、不變色,沒有物質溶出,持久不老化,還需要考慮:
塑料添加劑、注塑脫模劑的滲出是否會干擾產品性能?
管子材質對核酸、蛋白或其它物質的吸附是否會干擾產品性能?
管子對標簽紙、記號筆需要有良好的親和性,還需要考察:
蓋子的密封性是否良好?
螺旋蓋是否容易反松?壓蓋是否會自己彈開?
蓋子的開、關手感是否舒適?
糟糕的管子,開關幾次就可以把人手磨出水泡來!蓋子緊得讓小姑娘恨不得用牙啃才打得開!產品用了這樣的管子絕對會遭罵的!
如此眾多的評估維度,打起擂臺來,各廠家、各型號的管子難得有哪個可以面面俱到,做到完美。即使有完美的管子,那價格也必然十分感人!最終的選擇只能是多維度的相互妥協,尋找滿足產品需求的最高性價比。這個過程又是必須與市場、產品人員密切協同才能做好的,他們可能會有研發人員想不到的看法。
所以,對體外診斷試劑而言,哪怕是管子耗材這類小東西的選擇,驗證,在產品開發階段都有很多工作要做。后期如果想要變更、替換,也需要付出很大的研發代價。從產品原料中替換一只管子,如果只便宜幾分錢,這個管子的需求量得高到多大程度才能平衡研發變更所付出的人力、物力、時間代價?這需要算一下才能決定這個事情是否值得去做,做這個計算時還要考慮到資源被擠占,沒有去做其它產品項目的機會成本。
檢測參考區間與陽性閾值的建立-樣本屬性、研究方法
產品研究階段實現了檢測的原理可行性,確定了最低檢測限,并用少量臨床樣本初步驗證了技術方法對臨床樣本的適用性。在產品開發階段,需要建立、確定檢測的 參考區間、陽性閾值,檢測技術才能實現其應用價值,轉化為可以指導臨床干預的檢測產品。
在前面關于產品研究的章節中,討論過產品最低檢測限與陽性閾值的關系。所以陽性閾值實際上是在產品研究階段就需要關注的一項關鍵技術指標。但從體外診斷試劑研發,特別是產品注冊申報所要求的嚴格過程邏輯而言,這項關鍵指標必須在主要原材料研究完成之后,原材料不再發生變動的情況下進行研究、驗證,確定下來才有意義。否則,主要原材料一變,前期研究獲得的陽性閾值就會作廢,所有工作白廢。因此,這項工作放在產品開發的第二個階段來進行比較合理。
建立產品的參考區間、陽性閾值,其工作內容是以檢測產品對已知的陽性和陰性樣本進行檢測后,觀察、尋找目標生物標志物的測量結果在陰、陽性樣本之間的分界閾值。那么,我們首先就需要獲得確實是“陽性”和“陰性”的樣本,才能實施這個觀察研究。
產品研究是從模擬樣本開始的,并且整個產品研究階段的工作主要都以模擬樣本來進行。模擬樣本中的檢測靶標物質是人工定量摻入的,其“陰”與“陽”的定義是人為控制的。而產品開發中參考區間、陽性閾值的建立與驗證,必須要使用足夠多的 臨床樣本才會得到審評員的認可。而臨床樣本中的檢測靶標物質是生理/病理性存在的,其“陰”或“陽”不由人為決定。此時,在收集這些臨床樣本時,就必須想出一個可以搞清這些臨床樣本“陰”、“陽”性的辦法。
“陰性”樣本
首先,“陰性”樣本可以從“正常人”中收集。此時,“正?!钡亩x需要根據檢測的應用目的而定。比如,檢測以腫瘤診斷為目的,那么全體沒有腫瘤的人就可以算作“正?!?,高血壓、糖尿病等等普遍健康意義上的 “異?!痹诖丝梢院雎?。
而且,需要強調的是,此時還應該有意識地納入特定的,需要與檢測的應用目的作鑒別診斷的患者樣本作為 “正?!钡摹瓣幮浴睒颖?。比如,對膀胱癌診斷檢測而言,膀胱炎、腎盂腎炎、尿路結石、等等泌尿系統非腫瘤疾病都是需要進行鑒別診斷的,所以,這些患者的樣本也應該作為“正常人”的樣本納入檢測參考區間的研究之中。
“陽性”樣本
用于陽性閾值研究的“陽性”臨床樣本的獲取,一個比較簡單的辦法,是用當前的 “金標準”方法先對這些樣本做一遍檢測,以確定他們的“陰”、“陽”屬性。
這里的所謂 “金標準”方法,與在研產品所檢測的生物樣本、靶標物質、目標生物標志物可以相同,也可以不同。它應該是當前公認具有較高的檢測性能,而且其檢測結果必須與在研產品的目標生物標志物存在著嚴格的關聯關系(不一定是因果關系)。從而,在研產品對目標生物標志物的測量結果可以與“金標準”方法的結果進行符合性比對。
需要注意的是,這樣的研究方法所開發出的檢測產品,其檢測性能注定不會高于所選定的“金標準”方法。這樣研發出的檢測方法可能在檢測成本、檢測速度、檢測操作便利性、檢測樣本易獲性、檢測無創性等方面超過“金標準”方法,但在檢測正確性方面則無法超過,最多等同。如果檢測產品的患者獲益單純取決于檢測正確性,則患者從新產品中的獲益不能高于這個“金標準”方法。
道理很簡單,以第一把尺子為標準造出來的第二把尺子,其精度不會超過第一把尺子。產品要想獲得超過“金標準”方法的檢測性能,就不能依賴“金標準”方法,必須另辟蹊徑。
體外診斷試劑產品的創新,可以以降低檢測成本、提高檢測速度、提升檢測操作便利性、提升檢測樣本易獲性、實現檢測無創性……為目的,都有很好的現實意義,但提升檢測性能,經常是更根本性的要求。
一個創新產品,如果想要超越當前所有同類產品,甚至從生物標志物到臨床應用概念都是嶄新的,又應該如何去獲得已知“陰”、“陽”性的臨床樣本,以建立產品的陽性閾值呢?這時候可以從檢測產品指導臨床干預的獲益終點方面去想辦法。
產品設置陽性閾值的目的是為了指導臨床醫生對患者實施醫療干預,醫療干預的目的是獲得好的臨床轉歸。只要目標生物標志物與臨床轉歸的好壞存在確實的關聯關系,患者的臨床轉歸結局就可以作為目標生物標志物是“陰”還是“陽”的“金標準”。
這樣建立的陽性閾值所實現的檢測,其限性能制就只取決于檢測技術方法學本身,及目標生物標志物的生物學有效性,而不會受已有其它技術方法的性能限制。
具體操作方法可以是
從產品的預期應用人群中,在患者接受某項醫療干預前(干預的決策依據按當前臨床常規執行,不存在倫理風險)收取他們的生物樣本,用在研產品進行檢測。數據保存好,暫不分析,然后觀察這些患者的臨床轉歸結局,其中達成良好效果與未達成良好效果的兩類患者,就代表著應該接受干預,與不該接受干預的兩組人群。
如果檢測的目標生物表標志物與干預效果的好與壞存在著內在關聯,這兩組人群的樣本就可以當作“陰”與“陽”樣本的代表,其檢測數據就可以用作參考區間、陽性閾值的研究、確定。
應用這個方法時需要非常小心,只有當目標生物標志物的測量結果是臨床干預效果的充分而又必要條件時,這樣做才是邏輯嚴謹的。
如果僅是充分而不必要條件,因其它(非目標生物標志物相關)原因而導致臨床轉歸結局的那部分患者數據就會成為干擾,需要把這些樣本數據剔除出去,或采取適當、有效的矯正措施才能得到好的結果。
如果僅是必要而不充分條件,就需要知道其它的必要條件是什么,只有能夠確認已經發生了其它必要條件的樣本數據才可以納入研究。
所以,對“臨床轉歸結局”的觀察應該盡可能是多種監測手段,多種觀察指標的綜合,才便于良好辨析目標生物表標志物與臨床轉歸的關系,為產品參考區間、陽性閾值的建立獲得有效的陰、陽性樣本。
有了有效、足夠的已知“陰性”臨床樣本,用在研產品檢測后,就可以用統計分布計算的方法確定檢測“正常值”的參考區間范圍。2021年9月份,國家藥監局發布了《參考區間確定注冊審查指導原則(征求意見稿)》。雖然正式稿還沒發布,但從既往經驗看應該大差不差,具體工作中按這個“指導原則”去做就可以。
有了有效、足夠的已知“陽性”臨床樣本,同樣按照就可以“指導原則”,用統計分布計算的方法確定檢測“陽性”的參考區間范圍。
“陰”、“陽”性樣本的參考區間范圍可以截然分開,那是美好的理想。在現實中,即使按“指導原則”中的方法剔除了離群值,對多數檢測而言,兩個參考區間還是會多少有些重疊。并且,我們從統計分布計算中得到的是一個“陽性區間范圍”。如何確定一個最優的陽性閾值,使檢測達到最優效能呢?
ROC曲線
ROC曲線可以是解決這個問題的辦法。因為樣本的“陰”、“陽”屬性是已知的。在用統計分布方法計算出陽性參考區間后,就可以把把陽性參考區間內所有取值所對應的靈敏度與特異性計算出來。畫出ROC曲線,從ROC曲線上就可以選取最適合于該產品預期用途的陽性閾值。
此時需要注意:
前面在產品研究階段中討論的產品的最低檢測限也是一個“靈敏度” 的概念,那談的是靶標物質豐度很低時,檢測能否良好實施的意思。
此時在產品開發階段討論的“靈敏度”是指檢測可以準確識別多少陽性樣本,也就是“假陰性率”有多少的意思。
兩個“靈敏度”概念完全不同,不可混淆。
另一個需要注意的是,ROC曲線是一種統計學方法,其有效性是存在局限性的。當陽性樣本與陰性樣本的占比各為 50%時其有效性最高?!瓣帯?、“陽”構成比越偏離 50%,其效度越低。
預期檢測樣本中陽性樣本的占比,用統計學術語來說,是檢測陽性的“先驗概率”,是一個在檢測產品開發中需要重視的命題。在產品的陽性閾值研究中,在計算靈敏度、特異性時,所采用的陰、陽性樣本數目不應盲目設定為一比一,而應該按照檢測的“先驗概率”來確定樣本數目。這樣所得出的靈敏度、特異性才符合臨床實際的情況,在實際應用中不致發生大的偏差。
這里有必要提示一下篩查產品與診斷產品的區別:
診斷產品的應用目人群是臨床醫生已經產生高度懷疑的患者,其檢測陽性的先驗概率較高,達到50%也不罕見,上述產品建立的邏輯方法基本是適用的。
但篩查產品需要應用于更廣泛的人群,其檢測陽性的先驗概率非常低,遠遠低于 50%,甚至可以低到千分之一(比如遺傳病與腫瘤的人群篩查)。
這時候,ROC曲線或許就不再是建立產品陽性閾值的最佳方法,檢測產品對敏感度與特異性的要求就會有更多因素需要考慮。總的來說,篩查產品需要盡力提高特異性,而在敏感度方面可以有所讓步。這可能與多數人的直覺認識相反。認真計較起來,需要以貝葉斯公式做很多試算才能清晰展示這個問題,對此,老敗已有另文專門討論,在此不多贅言。
即使診斷產品,對陽性閾值的選擇也不一定都是ROC曲線的拐點,也就是 ROC曲線上對靈敏度與特異性“綜合性能”最好的那一點。而是要具體分析檢測陽性與陰性對后續臨床干預的影響,檢測假陰性與假陽性各自的危害方式與危害程度,綜合取舍,選擇產品的陽性閾值,使得臨床應用效益最大化。
對于療效監測,復發監測產品,比如器官移植排異的隨訪監測、腫瘤的復發監測,檢測陽性的先驗概率是動態變化的。比如復發監測產品,臨床治療完成短期內患者復發的概率是比較小的,但隨著時間的推延,復發概率會逐漸上升,也就是說檢測陽性的先驗概率會逐漸上升。一個理想的復發監測產品,在設置時產品陽性閾值時這方面應該有所考慮。
以ROC曲線確定了最優的陽性閾值可以使檢測獲得相對最優效能。但仍然解決不了前述陰、陽性參考區間之間存在一定重疊的問題。這個重疊的區間,是檢測對樣本的“陰”、 “陽”屬性做出任何判斷都會存在顯著錯誤風險的區間。此時合理的做法,是應該把這個區間設定為“ 灰區”,以提示檢測的局限性。
檢測參考區間與陽性閾值的建立-樣本數量
前面討論了確定參考區間、陽性閾值所需要的樣本與研究方法,下面再談談所需樣本數量。
臨床樣本存在著顯著的異質性,檢測技術方法存在著波動性,這些都使得一兩個樣本的研究遠無法得到最優的普適性結果,必須以大量樣本,統計學方法,來獲得相對最優的產品技術參數設定。既然是統計學方法,當然樣本數據量越大越好。不幸的是,大量高質量臨床樣本的來源,正是多數產品研發中的瓶頸問題。那么最少需要多少臨床樣本,參考區間的建立才算合理可靠呢?
《參考區間確定注冊審查指導原則(征求意見稿)》中明確規定了各種情況下確定參考區間時所需的最低樣本量,從120-198個不等。但需要注意的是,這個樣本數量是根據既往的統計學研究成果得到的概率性數值。具體到你所研發的產品,研究所需的最小樣本數量是因檢測結果的波動性大小而定的,即,因檢測技術特性和樣本特性而定的。因此,進行參考區間研究時不應以使用了“指導原則”中規定的最低樣本數目而盲目滿足。參考區間建立所用樣本量是否足夠、充分,需要拿出驗算數據才能放心。
對創新性很強,目標生物標志物首次出現的產品,評審員更是肯定會追問樣本使用量充分有效的證據。
拿出這個證據并不困難。把“陰”、“陽”性樣本檢測值的變異系數(CV)隨樣本數量的增加而降低的變化趨勢分別作圖。當曲線趨于水平時即意味著,用增加樣本數量的辦法以減少檢測值的波動變異,增加統計值可靠性的獲益已經趨于飽和。再增加更多樣本數量的意義已經不大。以這個樣本數量建立檢測的參考區間、陽性閾值即是充分、合理的。
參考區間、陽性閾值研究確定之后,還要用一批已知陰、陽屬性的樣本對這些產品關鍵參數的合理有效性進行驗證。即,用在研產品對這批樣本檢測后,以前期研究確定的參考區間、陽性閾值對檢測結果進行判斷,所獲得的檢測靈敏度與特異性需符合預期。
質檢方法與質檢標準的設置
產品開發工作還有一項重要的工作是質檢方法與質檢標準的設置。對產成品而言,出廠質檢標準是用企業參考品做性能檢驗,這個很容易理解。而成品質檢以外,還要為原材料,半成品設置質檢方法與質檢標準才能做到產品生產全過程的可控。
原材料與半成品的質檢,最容易想到的辦法是取小樣,一直做到成品,看能不能達成預期檢測性能。應該說不是不可以這么做,但這是比較笨的辦法,工作量、時間、試劑消耗大,成本高。比如,基于二代測序的分子檢測產品,從酶、引物原料開始,從配制,到建庫、測序、數據分析要幾天時間,這樣做原料檢成本高昂。
比較聰明的辦法,是根據各種原材料與半成品的物理、化學、生物學活性設計簡單有效的技術驗證實驗。實驗所觀測的技術指標只要有助于實現對生產過程各步驟的良好控制就可以,力求簡便、快速、便宜,與檢測的最終目的可以相關,也可以無關。比如,pH值、離子強度、特定的 PCR反應等等都可以成為生產過程各階段的質檢方法與質檢標準。
分子檢測產品,特別是當前基于二代測序的分子檢測產品,產品原料種類多,生產步驟多,產品使用步驟也多,質檢成本、質檢周期占了整個產品生產成本、生產周期顯著的一塊,如果在產品開發過程中充分發揮聰明才智,把質檢方法設置得簡單、快捷、便宜,對降低成本非常有利。
國家參考品和企業參考品
產品開發過程中三批試生產產品的全性能驗證,注冊檢,產品持續生產的出廠質檢都需要用到國家參考品或企業參考品。
國家參考品是由中檢院發布的,具有法定權威性的,用于對特定體外診斷試劑技術性能進行考評的,標準化的生物樣本。每套國家參考品的樣本數目少則一、兩個,多的可以有八、九十個。國家參考品不白送,得向中檢院購買,價錢便宜的幾千一套,貴的可達八、九萬。
建立、制備各種國家參考品的是中檢院科研人員的工作職責。他們持續追蹤著臨床檢驗各種技術、產品的發展趨勢?;旧?,每當有三、四家企業在進行同類的,創新性的技術產品研發時,中檢院就會適時地推出相應的國家參考品。
一個體外診斷產品,如果已經有了可以完善評估其產品性能的國家參考品,則產品的注冊檢必須用國家參考品進行。如果產品的創新度太高,還不存在適用的國家參考品,則可以使用企業參考品進行注冊檢。
產品持續生產的出廠質檢使用國家參考品或企業參考品都可以。一般而言,如果國家參考品足夠便宜,則企業沒必要去費事建立企業標準品,每次產品出廠檢就用國家參考品算了,如果感覺國家參考品太貴,用不起,或國家參考品還不存在,則需要建立企業參考品。
如果已經有國家標準品,則企業參考的技術性能指標不可以低于國家參考品。在國家參考品還不存在時,企業參考品設置的原則是:
1. 全面完善覆蓋產品的各項預期檢測性能。
2. 應盡量與預期生物樣本同質。
3. 具備高度特異性和穩定性,以滿足長期存儲后仍能夠滿足檢測的需要。
4. 滿足生物安全性要求。
產品生產的工藝放大與轉產
在產品研究階段和開發階段的前期,各種研究、驗證實驗所使用的試劑可以由研發人員在實驗室里配制。
在產品開發階段的后期,產品開發人員要進行至少一批的“研發批試生產”,由產品開發人員與生產人員共同在GMP生產車間里做試生產,并與生產部門共同編制生產SOP。然后,由生產人員在GMP體系下按 SOP獨立進行三批試生產,產品用于全性能驗證、注冊檢、各種穩定性驗證等產品開發的后期工作。
體外診斷試劑的生產過程應該說比較簡單,基本只有配制、分裝、組裝三個大的步驟。生產工藝放大一般而言難度不高。即使如此,從人、機、料、法、環,各方面嚴格遵守質量體系的各種要求實屬必須。質量管理體系是人類工業化三百多年摸索出來的經驗、教訓的珍貴結晶。
幾年來,老敗的深切體會就是,無論因為知識、技術水平不夠,思想認識不到位,還是嫌麻煩偷懶,任何環節沒有良好執行質量管理體系的要求,那是一定“要還的”。所有的經驗、教訓,分析下來,都會歸結為質量管理體系的實施偏差。所以,老敗在此感覺沒啥可說的,諸君認真接受質量管理體系培訓,認真實施就好。
產品的各種穩定性(儲存、運輸、凍融、開瓶)
前面在產品研究中講到過檢測樣本的存儲、運輸條件要求與穩定性的研究。產品開發階段需要搞清產品的儲存、運輸、凍融、開瓶穩定性。
這里需要注意的是,對注冊體外診斷試劑而言,這些穩定性研究都要以GMP體系內生產出的產品去做,作為注冊申報數據才有說服力。對GMP生產過程有效性的考察是產品注冊評審重要關注點之一,所以研發過程中實驗室里配出來的試劑所得出的產品穩定性數據對注冊申報是不足為據的。
以GMP體系內生產出的產品去做各種產品穩定性實驗,就意味著這項工作無法在產品研究、開發階段的早期開展。最早也要等到產品轉產后,拿到頭三批試生產產品后才能進行。而儲存穩定性的驗證研究至少是要與產品有效期等長的,且現在的注冊審評已經不接受“加速實驗”的說法。所以,產品開發、生產、臨床試驗的時間周期必須要有個良好的統籌安排才能獲得最快速的產品注冊申報時間進度。
特別需要強調的是,用于注冊申報的各種穩定性實驗數據需要用三批試生產產品做出來,這個工作性質是產品性能的驗證。如果此時驗證的結果表明沒有達到預期的要求可就麻煩大了!因為產品已經無可更改了!所以,驗證雖然只能在最后進行,可前期充分的研究工作可萬萬不能少。穩定性問題從產品開發工作的第一步,主要原材研究時就需要時時考慮,反復研究、測試、驗證。
前面在產品研究階段提到過的,檢測的抗干擾能力,也需要在這個階段驗證。
產品注冊臨床試驗中的一些現實考慮
產品的注冊臨床試驗是注冊體外診斷產品的終極大考,通常是整個產品開發過程中耗時最多,耗費資金最多的環節。與產品的臨床前研究存在著同樣的風險是,注冊臨床試驗的有效性需要在事后由藥監局審評員評判,但其研究設計,在一般情況下卻沒有一個機制獲得事前的官方認可、確認。
對比較成熟的Me too 產品,藥監局可能已經發布了針對性的“審評指導原則”,給出了明確的要求,這個矛盾并不嚴重。但對創新性比較強的 First in class產品,這個問題就令人焦慮了。僅僅按照自身對《體外診斷試劑臨床試驗技術指導原則》的理解設計臨床試驗,一旦與未來審評員,或審評專家組中任何成員的認知相左,麻煩可就大了。在事前與監管機構的咨詢、溝通,在官方層面與私下層面都可以有,但咨詢結論的性質屬于咨詢專家的個人見解,無法保證與將來評審員或審評專家組的觀點、態度一致,這是個潛在重大危機。
上面說“一般情況下……”。確實,一個創新度很高的產品屬于不一般情況?,F在有《創新醫療器械特別審查程序》這條路可以走。產品獲得創新資質有三個條件:
1.申請人需在中國依法擁有產品核心技術發明專利權,或者依法通過受讓取得在中國發明專利權或其使用權;或者核心技術發明專利的申請已由國務院專利行政部門公開。
2.產品主要工作原理或作用機理為國內首創,技術上處于國際領先水平且性能或者安全性與同類產品比較有根本性改進,并且具有顯著的臨床應用價值。
3. 申請人應該已完成產品的前期研究并具有基本定型產品,研究過程真實和受控,研究數據完整和可溯源。
產品獲得了創新資質之后,藥監局會組織專家委員會來為產品討論、確定出一個具有官方效力的注冊臨床試驗方案,最終的產品審批就以這個方案的執行情況為準。
產品的注冊臨床試驗,那是專門的一項學問、一個專業,是各種法規要求、約定俗成一大堆的事情,必須由專門部門的專業選手來操作。這里僅僅淺談老敗個人感觸較深,需要盡早籌劃,小心應對的幾點。
倫理問題
隨著社會的文明進步,臨床研究的倫理要求越來越高。參與臨床試驗的患者,不論試驗組還是對照組,在臨床療效方面最少要達到當前臨床常規水平,不可承受沒有臨床收益的風險或損害,這是硬性的倫理要求。
在經濟利益方面,則所有參與患者必須比臨床常規獲益,這些倒是不難理解與實施。需要注意的是,醫院倫理審查的流程當前各不相同。
臨床試驗方案多數都需要過“大倫理”,由醫院級別,成員構成廣泛(律師,附近居民代表)的倫理委員會上會審查。這個審批會一般最多每個月開一回,兩個月才開一回的也不是沒有。所以,一旦資料準備不及時,錯過會期,或被駁回修改,時間耽誤都會以月計,很是令人捉急。
患者與樣本易獲性
患者與樣本易獲性與產品的預期應用人群相關,在產品籌劃的初期就需要考慮。三類體外診斷試劑臨床試驗常規需要的患者數目是至少1000,一般而言,其中陰、陽性樣本應該各占 500。
但如果目標人群中陽性患者的先驗概率很低,陽性樣本到底要收到多少才算合格?這是個影響臨床試驗資金投入多少、產品獲批時間拖延多久的關鍵問題。這個問題必須與監管方溝通、得到監管的認可才能決定。
如果陽性樣本比較罕見、收取非常困難。審評員可能會降低要求,給你規定一個較小的數字,達標即可。也可能給你附帶條件審批,也就是達成一個較小的數字就可以給你批證,但同時留下“作業”,在注冊證的重審周期(5年)之內,在產品的臨床應用中補充收集足夠的樣本數量,再去審查。
體外診斷試劑的注冊臨床試驗,可以是觀察性研究,即,待評估產品的檢測結果并不影響臨床干預,而只是將結果與金標準對比試劑的檢測結果作比較。
也可以是干預性研究,即按照待評估產品的檢測結果對患者施加治療干預,以療效評估檢測產品的臨床效能。
不過,按照《體外診斷試劑臨床試驗技術指導原則》中的規定,即使是創新產品,當前沒有完全對應的成熟檢測可以與之作“頭對頭”的對比,注冊臨床試驗以干預性研究展示新產品的臨床有效性以外,還是要找一個從原理、機制到臨床應用與新產品相對最近似的一個當前成熟產品進行對比。所以,在體外診斷試劑的注冊臨床試驗中,對比試劑的采購、檢測花費是少不了的。
注冊臨床試驗過程中還會有大量的,與產品、技術相關或無關的利益分配、利益沖突問題會影響工作進度。整個研究過程涉及的科室越多,利益分配問題就越復雜,其中只要有一個科室對利益分配不滿意,工作進度就會受到不良影響。這是企業的注冊臨床部門不得不去努力協調解決的問題。