期刊VIP學術指導 符合學術規范和道德
保障品質 保證專業,沒有后顧之憂
摘要:基因測序是一種新型基因檢測技術,能夠從血液或唾液中分析測定基因全序列,預測罹患多種疾病的可能性,如癌癥或白血病。基因測序相關產品和技術已由實驗室研究演變到臨床使用,目前在眾多保健及醫療機構和體檢中心,都打出基因測序的廣告,但其使用的基因測序儀及相關診斷試劑和軟件,很多沒有經過醫療器械的注冊審批。對此,國務院有關部門高度重視。2014年2月,中國國家食藥監管總局、國家衛計委聯合發出通知,要求在相關準入標準、管理規范出臺以前,任何醫療機構不得開展基因測序臨床應用;已經開展的,要立即停止。
關鍵詞:基因測序,生物實驗,臨床診斷
近年間,基因測序從實驗室走入臨床,甚至逐漸成為全球醫學界熱門的話題。其中一個很重要的原因,是“名人效應”,蘋果公司創始人喬布斯和影星安吉麗娜·朱莉都曾采用基因測序方法希望抵御癌癥的侵襲,朱莉還為此預防性地切除自己的乳房。喬布斯雖然仍因癌癥去世,但他生前接受的全基因測序,已成為很多國家富人追捧的高端體檢服務。
基因測序,本是一種實驗室研究技術手段,因“名人效應”應用于高端體檢、產前診斷等領域,價格不菲。基因測序最廣為人知的,是影星安吉麗娜·朱莉通過基因檢測,選擇手術切除乳腺以降低患乳腺癌風險。2011年去世的蘋果公司創始人史蒂夫·喬布斯患癌時,也曾接受過全基因測序。
隨著人類基因組計劃的完成,人類對自身遺傳信息的了解和掌握有了前所未有的進步。與此同時,分子水平的基因檢測技術平臺不斷發展和完善,使得基因檢測技術得到了迅猛發展,基因檢測效率不斷提高。從最初第一代以 Sanger 測序為代表的直接檢測技術和以連鎖分析為代表的間接測序技術,到 2005 年,以 Illumina 公司的 Solexa技術和 ABI 公司的 SOLiD 技術為標志的新一代測 序 (next-generation sequencing,NGS) 的 相 繼 出現,測序效率明顯提升,時間明顯縮短,費用明顯降低,基因檢測手段有了革命性的變化。其技術正向著大規模、工業化的方向發展,極大地提高了基因檢測的檢出率,并擴展了疾病在基因水平的研究范圍。2009 年 3 月,約翰霍普金斯大學的研究人員在《Science》雜志上發表了通過 NGS外顯子測序技術,發現了一個新的遺傳性胰腺癌的致病基因 PALB2,標志著 NGS 測序技術成功應用于致病基因的鑒定研究。同年,《Nature》發表了采用 NGS 技術發現罕見弗里曼謝爾登綜合征MYH3 致病基因突變和《Nat Genet》發表了遺傳疾病米勒綜合征致病基因。此后,通過 NGS 技術,與遺傳相關的致病基因不斷被發現,NGS 技術已成為里程碑式的進步。2010 年,《Science》雜志將這一技術評選為當年“十大科學進展”。
近兩年,基因檢測成為臨床診斷和科學研究的熱點,得到了突飛猛進和日新月異的發展,越來越多的臨床和科研成果不斷涌現出來。同時,基因檢測已經從單一的遺傳疾病專業范疇擴展到復雜疾病和個體化應用更加廣闊的領域,其臨床檢測范圍包括高危疾病的新生兒篩查、遺傳疾病的診斷和基因攜帶的檢測以及基因藥物檢測用于指導個體化用藥劑量、選擇和藥物反應等諸多方面的研究。目前,基因檢測在臨床診斷和醫學研究的應用正越來越受到醫生的普遍重視和引起研究人員的極大的興趣。
本文介紹了幾種 DNA 水平基因檢測常見的方法,比較其優缺點和在臨床診斷和科學研究中的應用,對指導研究生和臨床醫生課外學習,推進臨床科研工作和提升科研教學水平有著指導意義。
1、第一代測序
1.1 Sanger 測序 采用的是直接測序法。1977年,Frederick Sanger 等發明了雙脫氧鏈末端終止法,這一技術隨后成為最為常用的基因測序技術。2001 年,Allan Maxam 和 Walter Gibert 發 明了 Sanger 測序法,并在此后的 10 年里成為基因檢測的金標準。其基本原理即雙脫氧核苷三磷酸 (dideoxyribonucleoside triphosphate,ddNTP) 缺乏PCR 延伸所需的 3'-OH,因此每當 DNA 鏈加入分子 ddNTP,延伸便終止。每一次 DNA 測序是由 4個獨立的反應組成,將模板、引物和 4 種含有不同的放射性同位素標記的核苷酸的 ddNTP 分別與DNA 聚合酶混合形成長短不一的片段,大量起始點相同、終止點不同的 DNA 片段存在于反應體系中,具有單個堿基差別的 DNA 序列可以被聚丙烯酰胺變性凝膠電泳分離出來,得到放射性同位素自顯影條帶。依據電泳條帶讀取 DNA 雙鏈的堿基序列。
人類基因組的測序正是基于該技術完成的。Sanger 測序這種直接測序方法具有高度的準確性和簡單、快捷等特點。目前,依然對于一些臨床上小樣本遺傳疾病基因的鑒定具有很高的實用價值。例如,臨床上采用 Sanger 直接測序 FGFR 2 基因證實單基因 Apert 綜合征和直接測序 TCOF1 基因可以檢出多達 90% 的與 Treacher Collins 綜合征相關的突變。值得注意的是,Sanger 測序是針對已知致病基因的突變位點設計引物,進行 PCR 直接擴增測序。單個突變點的擴增包括該位點在內的外顯子片段即可,不必將該點所在基因的全部外顯子都擴增。
因此,應明確定位要擴增的位點所在的基因外顯子和該點的具體位置,設計包括該點在內的上下游 150 ~ 200 bp 的外顯子片段引物。此外,盡管有NGS 的出現,但 Sanger 測序對于有致病基因位點明確并且數量有限的單基因遺傳疾病的致病基因的檢測是非常經濟和高效的。到目前為止,Sanger 測序仍然是作為基因檢測的金標準,也是 NGS 基因檢測后進行家系內和正常對照組驗證的主要手段。
值得注意的是,Sanger 測序目的是尋找與疾病有關的特定的基因突變。對于沒有明確候選基因或候選基因數量較多的大樣本病例篩查是難以完成的,此類測序研究還要依靠具有高通量測序能力的 NGS。雖然 Sanger 測序具有高度的分析準確性,但其準確性還取決于測序儀器以及測序條件的設定。另外,Sanger 測序不能檢測出大片段缺失或拷貝數變異等基因突變的類型,因此對于一些與此相關的遺傳性疾病還不能做出基因學診斷。
1.2 連鎖分析 采用的是間接測序法。在 NGS 出現之前,國際通用的疾病基因定位克隆策略是建立在大規模全基因掃描和連鎖分析基礎上的位置候選基因克隆。人類的染色體成對出現,一條來自父親,一條來自母親,每一對染色體在同樣的位置上擁有相同的基因,但是其序列并不完全相同,被稱為父系和母系等位基因。遺傳標記是指在人群中表現出多態現象的 DNA 序列,可追蹤染色體、染色體某一節段或某個基因座在家系中傳遞的任何一種遺傳特性。它存在于每一個人,但大小和序列有差別,具有可遺傳性和可識別性。目前采用第二代遺傳標記,即重復序列多態性,特別是短串聯重復序列,又稱微衛星標記。連鎖分析是以連鎖這種遺傳現象為基礎,研究致病基因與遺傳性標記之間關系的方法。如果控制某一表型性狀的基因附近存在遺傳標記,那么利用某個遺傳標記與某個擬定位的基因之間是否存在連鎖關系,以及連鎖的緊密程度就能將該基因定位到染色體某一位置上。1986 年 Morton 等提出優勢對數記分法 (log odds score method,LOD),主要檢測兩基因以某一重組率連鎖時的似然性。LOD 值為正,支持連鎖 ;LOD 值為負,則否定連鎖。通過計算家系中的微衛星標記與致病位點之間的 LOD 值,可以初步估算二者間的遺傳距離及連鎖程度,從而確定該基因在染色體上的粗略位置。然后利用該區域的染色體基因圖譜,分析定位區域內所有基因的功能與表達,選擇合適的候選基因進行突變檢測,最終將致病基因定位或克隆。
然而,采用連鎖分析進行基因檢測存在很大的局限性。不但所需遺傳樣本量較大,一般要求提供三代及以上遺傳家系患者血樣,而且數據量大、處理復雜、產出速度較慢、定位不夠精確 ( 一般只能定位在染色體某一區間 ),這就使得研究工作繁重和定位基因的時間周期特別長。目前,連鎖分析采用的單核苷酸多肽性和短串聯重復序列還在使用,但經典的間接測序方法,如單鏈構象多肽性、變性梯度凝膠電泳和異源雙鏈分析在美國已被淘汰,而在發展中國家作為研究手段還在有限使用。
2、新一代測序 (NGS)
主 要 包 括 全 基 因 組 重 測 序 (whole-genomesequencing,WGS)、全外顯子組測序 (whole-exomesequencing,WES) 和目標區域測序 (Targeted regionssequencing,TRS),它們同屬于新一代測序技術。總體而言,NGS 技術具有通量大、時間短、精確度高和信息量豐富等優點,使得遺傳學者可以在短時間內對感興趣的基因進行精確定位。但這些不同的測序技術在測序范圍、數據分析量以及測序費用和時間等方面又有很大差別,如果選擇適合的方法,對于臨床診斷和科學研究將起到事半功倍的作用。
2.1 目標區域測序 目前常用的是基因芯片技術。其測序原理是基于 DNA 雜交原理,利用目標基因組區域定制的探針與基因組 DNA 進行芯片雜交或溶液雜交,將目標基因區域 DNA 富集,再通過NGS 技術進行測序。其測序過程是通過把數以萬計的 cDNA 或寡聚核苷酸置于芯片上制成列陣,將芯片上固定好的已知序列的核苷酸探針與溶液中含有熒光標記的相應核酸序列進行互補配對,根據測序儀所顯示強熒光的位置和強度,獲取每組點陣列信息,再利用生物信息學算法確定目的靶核苷酸的序列組成。測序所選定的目標區域可以是連續的 DNA 序列,也可以是分布在同一個染色體不同區域或不同染色體上的片段。目標區域測序技術,對于以往通過連鎖分析將基因突變鎖定在染色體某一片段區域內,但無法找出突變是一個非常好的進一步檢測手段。2010 年,Nicholas等使用基因分型芯片聯合連鎖分析技術,成功發現頭小畸形的新基因 WDR62,文章發表在《NatGenet》雜志。類似的研究在家族性胰腺癌中確定 8 個候選變異位點和在家族性滲出性玻璃體視網膜病變發現易感基因 TSPAN12。
基因芯片測序技術可以將經過連鎖分析鎖定了目標范圍或經過全基因組篩選的特定基因或區域進行更深一層的研究,是解決連鎖分析無法發現致病基因的有效手段。基因芯片技術對于已知基因突變的篩查具有明顯優勢,可以快速、全面地檢測出目標基因突變。同時,由于目標區域受到了限制,測序范圍大幅度減少,測序時間和費用相應降低。但基因芯片檢測所需要的 DNA 的量要大,由于已提取的 DNA 存在降解的風險,用于基因芯片研究的血標本最好是冰凍的全血,這樣可以使用于檢測 DNA 的量有充分保證。
全外顯子組測序 (WES) 外顯子組是單個個體的基因組 DNA 上所有蛋白質編碼序列的總合。人類外顯子組序列約占人類全部基因組序列的 1%,但大約包含 85% 的致病突變。WES 是利用序列捕獲技術將全外顯子區域 DNA 捕捉并富集后進行高通量測序的基因分析方法。采用的技術平臺主要是羅氏公司的 SeqCap EZ 全外顯子捕獲系統,Illumina 公司的 Solexa 技術和 Agilent 公司的 SureSelect 外顯子靶向序列富集系統。其捕獲的目標區在 34 ~ 62 M 之間,不僅包括編碼區同時也加入了部分非編碼區。NGS 的測序過程主要包括DNA 測序文庫的制備、錨定橋接、PCR 擴增、單堿基延伸測序和數據分析。研究者根據測序儀捕獲到在測序過程中摻入有不同熒光標記堿基片段,經計算機將熒光信號轉化成不同顏色的測序峰圖和堿基序列。基因測序結果與NCBI的SNP數據庫、千人基因組數據庫等國際權威數據庫比對,最終確定是否為突變基因。
自NGS 技術問世以來,利用 WES 在臨床疾病致病基因的鑒定研究中取得前所未有的成果。這些成果不僅集中在單基因遺傳疾病,還在多基因影響的復雜疾病中獲得大量相關基因的發現。在單基因遺傳性疾病中,如視網膜色素變性、終端骨發育不良等發現新基因或已知基因新突變。在一些罕見的疾病中,如 Kabuki 綜合征、家族性混合型低脂血癥和脊髓小腦共濟失調癥等疾病中發現新的致病基因。同時,在小細胞肺癌、慢性淋巴細胞性白血病等腫瘤研究和諸如肥胖癥、腦皮質發育不良等復雜疾病的研究中也取得豐碩成果