首頁 >快訊 >

突破瓶頸!NC:華大基因高通量高精度單細胞全長isoform最新技術(shù)發(fā)表

長讀長單細胞RNA異構(gòu)體測序(scISO-Seq)可以揭示單個細胞中的轉(zhuǎn)錄本剪接等結(jié)構(gòu)變異研究,但仍存在測序通量低、研究成本高等瓶頸,且轉(zhuǎn)錄本測序深度覆蓋度低,分析結(jié)果相對不準確。

5月6日,華大基因(300676)唐沖博士團隊和中山大學(xué)眼科中心眼科國家重點實驗室劉奕志院長團隊共同在Nature Communications(影響因子:17.694)發(fā)表名為“High-throughput and high-accuracy single-cell RNA isoform analysis using PacBio circular consensus sequencing”的文章(點擊文末“閱讀原文”查看文獻)。

該研究突破關(guān)鍵技術(shù)瓶頸,開發(fā)了HIT-scISOseq技術(shù),將單細胞多個cDNA串聯(lián)建庫,結(jié)合PacBio平臺(CCS)測序,以實現(xiàn)高通量和高精度的單細胞RNA亞型測序研究。


(資料圖片僅供參考)

HIT-scISOseq可以助力單個PacBio Sequel II SMRT Cell產(chǎn)出8M數(shù)據(jù)量,獲得大于1,000萬條的高精度全長轉(zhuǎn)錄組有效reads,同時利用新開發(fā)scISA-Tools分析工具,將HIT-scISOseq多倍通量串聯(lián)測序片段用為單細胞cDNA分析,準確度和特異性大于99.99%。

此項研究中應(yīng)用HIT-scISOseq技術(shù)解析表征3,375個角膜緣細胞的轉(zhuǎn)錄組,揭示其中的細胞類型特異性異構(gòu)體表達。

關(guān)鍵技術(shù)路線

采用高通量單細胞分選技術(shù),獲得單細胞全長cDNA序列,利用生物素化的PCR引物對全長cDNA進行擴增,然后使用鏈霉親和素珠捕獲擴增的生物素化的cDNA(圖1),并使用USER酶在cDNA的兩個末端產(chǎn)生粘性末端,進一步使用DNA連接酶連接多個cDNA構(gòu)建CCS文庫后進行長讀長測序。

圖1 HIT-scISOseq單細胞全長轉(zhuǎn)錄組數(shù)據(jù)的技術(shù)流程

重要研究成果

●有效數(shù)據(jù)獲得率高

采用相同的樣本進行不同技術(shù)測評顯示結(jié)果如下:

1. HIT-scISOseq cDNA特有捕獲技術(shù),可將無效TSO artifact reads從50%降低到8%(圖2b);

2. HIT-scISOseq有效比對reads數(shù)是常規(guī)單細胞全長轉(zhuǎn)錄組技術(shù)的平均8.3倍(圖2c);

3. HITscISOseq得到的單個細胞基因數(shù)(或單個細胞UMI數(shù))要明顯高于常規(guī)單細胞全長轉(zhuǎn)錄組數(shù)據(jù)(圖2g)。

圖2 HIT-scISOseq單細胞全長轉(zhuǎn)錄組數(shù)據(jù)性能概述

●細胞類群分析結(jié)果與短讀長一致

1. 為了驗證HIT-scISOseq區(qū)分不同細胞類型的能力,研究者比較了HIT-scISOseq和RNA短讀長測序在相同的高通量單細胞平臺獲得的角膜緣上皮細胞cDNA樣本上,HIT-scISOseq和短讀長測序平臺之間的cell標簽的UMI計數(shù)(Pearson系數(shù)r=0.992)和基因的UMI計數(shù)(Pearson系數(shù)r=0.956)之間存在很強的相關(guān)性(圖3a,b);

2.生物學(xué)重復(fù)樣本間采用HIT-scISOseq技術(shù)獲得單細胞UMI計數(shù)也具有較高一致性(Pearson系數(shù)r=0.998)(圖3c);

3.相同樣本在不同測序長度下,細胞聚類結(jié)果類型及邊界基本一致(圖3d,e);

4.細胞條形碼計數(shù)的高度一致性,表明HIT-scISOseq 可以可靠地分析高通量單細胞轉(zhuǎn)錄組(圖3f);

5.每個細胞類群前15個標記基因的表達并在兩個平臺之間發(fā)現(xiàn)了相似的表達模式(圖3h,i)。

這些結(jié)果證實,基于HIT-scISOseq的單細胞基因表達譜分析結(jié)果與基于短讀長測序的方法的結(jié)果相當。

圖3 HIT-scISOseq單細胞全長轉(zhuǎn)錄組數(shù)據(jù)進行單細胞基因表達分析

●單細胞轉(zhuǎn)錄本亞型豐度與已知成分高度一致

為了驗證HIT-scISOseq可以準確量化亞型表達,首先使用SIRV來演示亞型檢測。

1. 使用HIT-scISOseq SIRV同種型數(shù)據(jù),顯示混淆率低至0.1066%(1-TPR,圖4b);

2. 通過將HITscISOseq獲得的觀察值與已知的ERCC異構(gòu)體豐度數(shù)據(jù)進行比較來評估異構(gòu)體量化結(jié)果:HIT-scISOseq測得的豐度與已知成分高度一致,相關(guān)系數(shù)為0.97(圖4a)。

圖4 HIT-scISOseq單細胞全長轉(zhuǎn)錄組數(shù)據(jù)進行單細胞異構(gòu)體水平表達分析

●在識別和量化單細胞亞型方面的能力強

1. 研究者從樣本s1和s2中保留了單細胞水平29,392和31,793個異構(gòu)體亞型,其中FSM(完全剪接匹配:與參考注釋匹配的異構(gòu)體)是兩個樣本中最豐富的亞型,并且有相當數(shù)量的NNC亞型(已有結(jié)果至少一個未注釋:包含至少一個未注釋的剪接位點的同種型),表明HIT-scISOseq可用于改進參考單細胞轉(zhuǎn)錄本異構(gòu)體注釋(圖4c)?;趤喰退降谋磉_,我們觀察到同一個細胞聚類模式如上述基因水平分析(圖4d);

2. 進一步分析了每個細胞簇的前15個標記亞型,發(fā)現(xiàn)其中一些亞型以前未被識別(圖4e)。在每種細胞類型中選擇了2個標記亞型用于表達模式驗證,并且結(jié)果顯示這些標記亞型確實呈現(xiàn)細胞類型特異性表達(圖4f,g),證明HIT-scISOseq是能夠有效解析單細胞亞型表達。

總 結(jié)

HIT-scISOseq是一種高通量、高精度、技術(shù)上可行的方法,可以加速長讀長單細胞轉(zhuǎn)錄組學(xué)新興領(lǐng)域的發(fā)展,極大的推動高通量單細胞長讀長測序成本的降低。

關(guān)鍵詞:

責(zé)任編輯:Rex_10

推薦閱讀