文献解读用于研究发育生理和疾病的单细
2020-8-11 来源:不详 浏览次数:次孕妇在日常饮食中应忌吃刺激性食物 http://www.bdfyy999.com/bdf/jiankangzatan/16045.html
论文标题:Single-cellRNAsequencingforthestudyofdevelopment,
physiologyanddisease
刊登时间:年5月
杂志信息:NatureReviewsNephrology
影响因子:19.
研究机构:辛辛那提大学医医院医学中心
本文背景及内容简介人体所有细胞都含有相同的一组基因(~20,),但不同细胞表达这些基因的水平不同,导致细胞间的膜成分、离子转运体、细胞骨架元素、生长因子、受体和转录因子的表达存在差异。因此,基因表达谱需要详细描述细胞的表型。早期的基因表达研究中,为了获得足够的RNA,局限于对聚集的细胞群的分析,不能够识别表达特定基因的细胞类型,而是提供了多个细胞成分的实际平均值,这很可能对目前存在的任何特定细胞类型了解甚少。例如,对肿瘤所有细胞的联合表达模式进行总体分析检查,以识别受干扰的分子通路,但肿瘤包含异质性细胞群,包括血管细胞、成纤维细胞、入侵的免疫细胞、快速分裂的癌细胞和更多静止的癌症干细胞,因此,合并的肿瘤细胞群体的基因表达谱只能提供细胞类型的总体平均值。细胞异质性也是器官发育的一个特征,通常对聚集的前体细胞群体的基因表达分析,并不能区分驱动前体细胞沿着特定的分化途径的信号;例如,决定一个肾元前体细胞是变成足细胞还是近端小管细胞的信号。为了更好地理解驱动细胞分化和决定细胞命运的信号,发育生物学家需要定义与单个细胞谱系选择相关的早期基因表达事件。单细胞RNA测序(scRNA-seq)能够快速确定成千上万个单个细胞的精确基因表达模式。这种对组成部分(单个细胞)的分析,相对于对聚集细胞群体的分析来说,对细胞行为提供了更有意义的洞见。而肿瘤细胞的scRNA-seq可以根据其基因表达特征将肿瘤成纤维细胞从内皮细胞和癌细胞中分离出来,同时肿瘤成纤维细胞可分为成纤维细胞亚型;这样的单细胞研究还能识别出以前未知的细胞类型,并为了解肿瘤内非癌细胞群的异质性提供了洞见,从而突出了这一研究工具的力量。本文将讨论单细胞RNA分析的基本概念,包括实验策略的讨论,以及不同技术的优缺点。还描述了该技术在发展、癌症和正常及病变肾脏研究中的具体应用。本文要点单细胞RNA测序(scRNA-seq)可以定义单个细胞的整体基因表达模式。几乎所有的组织和器官都包括各种细胞类型的混合,这些细胞群体的异质性可以通过使用scRNA-seq来确定。scRNA-seq可以全面定义转录因子、生长因子、受体、溶质转运蛋白和其他存在于每种细胞类型的蛋白的表达,为细胞功能和细胞间的相互作用提供深入的了解。scRNA-seq是一个日益强大的工具,用于分析发育以及正常和疾病过程。单细胞RNA测序方法综述RNA测序——一种分析基因表达模型的有效方法,无论是对单细胞或是对群体细胞的分析,都包括RNA反转录为cDNA后进行高通量测序的过程。RNA表达量与cDNA、DNA测序reads均成正比,进而可进行样本中特定基因表达量的分析。而scRNA-seq原理一致,首先进行单个细胞的分离,但由于单细胞RNA含量偏低,需进行cDNA的预扩增用于后续测序(图1)。传统的RNA测序根据DNA测序reads可确定特定基因的细胞中的表达量,而scRNA-seq能够确定所有基因的表达水平。图1单细胞RNA测序的通用实验策略许多scRNA-seq方法允许对大量细胞进行高通量分析。FluidigmC1microfluidicssystemin,单反应中能够提供96个细胞的基因表达数据,单次运行时间为1天;High-throughputFluidigmIFCchipsin,单次能够进行个细胞的检测。主要程序为:细胞裂解、反转录、微室中扩增,cDNA文库的构建,此文库中细胞均有特异性barcode,使所得到的DNA序列可分配给特定的细胞,但此方法成本偏高。微滴方法图2基于微滴方法的单细胞RNA测序技术运用微流体技术生成成千上万的微滴,这些微滴呈油包水状态,体积约2nm,微滴中含有的磁珠连接了含独特barcode的寡核苷酸序列和单细胞。细胞裂解后,含barcode的寡核苷酸序列与释放出的mRNA的polyA尾杂交。其中Drop-seq技术(原理如图3):磁珠连接着寡核苷酸序列及与之杂交的mRNA,均释放于微滴在单管中反应,之后进行反转录;而Chromium系统和InDrop技术(原理如图4,5):水凝胶磁珠在微滴中溶解,释放寡核苷酸与mRNA杂交,后续的反转录反应在微滴中进行;不论以上哪种情况,磁珠特异性barcode包含在cDNA中,能够进行后续的DNA测序最终定位于特定细胞。多平台比较结果显示,在各平台分离大鼠胚胎肾细胞并进行标记的过程中,微流体技术成本低于芯片技术。Chromium系统较Drop-seq技术相比,有一些明显的优势。首先,该系统可获取高质量数据,较drop-seq能够检测更多的基因,灵敏度高,技术噪音少;第二,该系统提供输入细胞的更丰富的基因表达图谱,几乎每一个细胞都能被分配在包含磁珠的微滴中。该系统仍然受到单一泊松分布的影响,两个细胞可能合并在一个液滴中,然而,实际上几乎每个细胞都在各自的水珠中。最终的结果是超过50%的输入细胞提供RNA-seq数据,大约高于Drop-seq10倍。当起始细胞量有限时,这种差别就显得尤为重要。Chromium系统相对于Drop-seq技术的另一个优势是易于设置和操作,但其主要的劣势就是试剂成本偏高。图3Drop-seq技术原理图示[1]图4InDrop-seq原理图示[2]图5Chromium系统原理图示非微流体方法scRNA-seq也能使用微孔板的技术对样本简单处理或分选后得到的细胞进行RNA-seq的操作。各种扩增反应也可使用微孔板模式,包括SMART-seq2chemistry,Cel-seq,MARS-seq和STRT-seq。SMART-seq2和STRT-seq使用PCR方法扩增反转录得到的cDNA,而Cel-seq和MARS-seq在cDNA中引入细菌病毒的启动子,可通过体外转录扩增。这些微流孔板方法对细胞大小无限制,不同细胞大小,需要不同的微流体设备。另外,微流孔板方法的设备和设置成本最低。此方法能够对全长cDNA进行测序,相反地,Drop-seq,InDrop,ChromiumandcellIFCFluidigm等系统,仅能提供cDNA3‘或5’端的测序信息,而非转录本全长,因此不能够用于分析备选的剪接模式。令人感兴趣的是,STRT-seq系统的一个年的修改,称为STRT-seq2,使用了一个微阵列平台,允许单细胞的微观确认,并产生高质量的scRNA-seq数据,每个细胞的竞争成本约为1美元,包括DNA测序。图6STRT-seq2原理图示[3]CytoSeq是另一种有力的scRNA-seq技术,它允许单个细胞通过重力沉降到微波容器中,然后将一个磁珠悬浮液以饱和浓度放置在其上,这样每个孔都能接收到一个磁珠。磁珠同Chromium和Drop-seq技术的相似,连接有独特barcode的寡核苷酸序列后进行反转录,大小控制为每个微孔中一个。过量的磁珠被去除后,细胞裂解,抓取mRNA,同Chromium和Drop-seq技术的相似。该系统不需要复杂的微流体系统。Microwell-seq,被用来对超过40万个小鼠细胞进行scRNA-seq,从而创建一个包括肾脏在内的大多数主要器官的单细胞图谱。图7CytoSeq原理图示[4]SPLiT-seq,设备与建库成本更低,此方法细胞需进行固定与透化,以便后续进行微孔分布。单细胞随机分布在96孔板中,在细胞内用孔特异性引物进行反转录,易扩展。Barcode以顺序和组合的方式连接在cDNA上。所有在96微孔板的单孔中的细胞都有一段孔特异性短核苷酸序列与它们的cDNA相连接。整个板中的细胞整合至一个单一的管子中,充分混匀并随机分布至另一个96孔板中。连接另一段孔特异性短核苷酸序列到cDNA上,即barcodes。三次整合与割分,之后进行第四轮的24个独立的PCR反应,最终获得共种barcode组合。在整合分布barcode的过程中,一个细胞中所有的cDNA都经过同样的路径,即含有同样的细胞特异性barcode。最终测序的数据与Chromium和Drop-seq技术存在相似性。这一技术主要的优势在于低成本生成cDNA文库,而scRNA-seq的主要成本消耗在DNA测序上。图8SPLiT-seq原理图示[5]scRNA-seq实验设计scRNA-seq实验需谨慎设计,考虑细胞数量、每个细胞reads数和生物学重复等多个因素。这三个变量中的每一个都对最终的分析结果产生影响,任一个变量变高都是有利的,但要考虑成本消耗。不同技术对于每个细胞测序reads的上限有不同的阈值,多余的测序数据无法提供有效的信息。对于不同技术的选择决定于待分析的细胞类型相似性。试图解决相似性极高的细胞类型,可能有必要用更昂贵的系统,能够提供更高的基因表达模式分辨率。生物变异的程度以及生物学重复的数量,都依赖于实验。咨询统计学家得到的建议是,没有一种解决方案能够解决所有问题。单细胞研究的挑战有限样本的处理单细胞研究的首要挑战是可处理的样本量有限。平均每个细胞仅含10pg的totalRNA,其中只含0.1pg的mRNA。每个细胞中,许多基因只有10个转录本。因此,上述所有的scRNA-seq技术都需要进行一步扩增生成足够的cDNA用于测序(单细胞中pg来源RNA)。然而,cDNA扩增并非呈现完美线性,导致细胞中所有的cDNA不相称分布。为了克服这个问题,几乎所有的scRNA-seq技术都在用于反转录的引物中引入了UMI。如果能够计数逆转录的初始cDNA产物而不是所有的扩增子,就可以避免我们在解释基因表达水平时的偏差。数据反褶积过程中的这一压缩步骤可以消除大多数基于扩增的基因表达数据失真。单细胞捕获——空间信息丢失scRNA-seq的另一个挑战是在处理组织或器官为单细胞的过程中所有空间信息的丢失。因此,在单细胞测序数据分析重建三维单细胞分辨率的基因表达图谱时需要第二步,即根据已知的基因表达特征对细胞类型进行生物信息学的空间定位。新定义的细胞类型空间定位需要原位杂交或免疫荧光研究。此类分析可生成一个具有标记意义的虚拟器官,所有的转录因子、生长因子、其他分泌蛋白和受体均被定义为每一种细胞类型。图9虚拟器官的构建过程单细胞捕获——解离酶的应用上述方法存在难点,即通用于组织解离的酶,如:胰酶、胶原酶、胰酶替代物、中性蛋白酶、liberase(胶原酶)和链霉蛋白酶均需进行37℃孵育,在这个温度下,哺乳动物细胞内的酶,包括转录机制,都处于最活跃的状态。因此我们认为,细胞在进行解离的过程中,由于受到外界环境的影响会改变它们的基因表达模型。确实存在早期应答的基因,包括FOS和JUN家族的多数成员,在37℃解离几分钟后基因表达量会有大幅度提升。因此,在某种程度上,细胞分离过程中的基因表达产物几乎肯定会污染迄今为止生成的大多数scrna-seq数据集。一种减少这些解离产物的方式就是获取细胞核中的RNA序列而非整个细胞。但核RNA分析同样也包含了高比例未处理的转录本,这些转录本中仍含内含子,使分析更复杂。另外,还有一些担忧是关于哪些核RNA的含量反映细胞质RNA。尽管存在这些挑战,但这个方法仍有巨大的潜力,当细胞质RNA难分离且难分析时,这个方法能够为细胞中基因表达的分析提供有力的工具。除了核RNA分析外,通用使用转录抑制剂能够获得细胞解离过程中体内基因表达模式。尤其是α-amanitin(抑制RNA聚合酶II的转录)的添加,能够减少细胞解离过程中基因表达产物的生成。这种方法的一个缺点是细胞吸收α-amanitin缓慢,需要花费几个小时,并且需要特定的转运蛋白。另外,转录抑制剂不阻止RNA的转换,依然会影响RNA含量。另外一个最小化解离过程中基因表达产物的方法是用冷适应性蛋白水解酶获取单细胞。与能在极热环境下生存的喜热生物不同,我们可以用喜寒微生物中得到的蛋白酶在极冷的温度下进行细胞解离,这样能够更好地保存体内基因表达模型。测序数据分析噪音scRNA测序所获得的大量信息中存在重要的局限性。一个重要的局限性是,基因表达的脉动性和爆发性所产生的生物噪音的后果。在一个既定的细胞中,各种基因转录水平处于不断变化的状态。这种基因表达的频跳是基因表达的基本特性,并且不可避免。另一个局限性在于,当起始单细胞中RNA总量有限时转录水平的方法测量。scRNA测序研究中20%的噪音预估为生物学来源,而剩下的80%为技术局限性的结果。由于scRNA测序与噪音紧密联系,用这种测序技术所获得的基因表达谱通常足够包含未监督的细胞群。无监督聚类允许软件分析程序搜索细胞组的模式和相似性,而不需要研究者输入任何关于不同细胞类型表达的已知标记基因的信息。一旦相似细胞群被聚类,那么一个单细胞类型中所有细胞的基因表达数据都会综合起来,去进行基因表达谱的大量测量。这种聚类与综合分析策略提供了重要的数据互补。低表达水平的基因可能只在一小部分细胞中被检测到,但会在聚集体中被发现。图10使用cluster和