导语
当前,临床前药物发现非常依赖于对基因组进行操作的能力。通过改变基因的序列或表达,科学家开发出很多方法来鉴别疾病靶点和测试治疗效果。然而,快速、准确和低成本地进行基因组操作常常受到技术的限制。
RNAi、ZFNs和TALENs等第一代编辑工具的局限性,限制了基因编辑在药物发现中的应用。但随着新的基因编辑技术CRISPR的兴起,情况正在迅速改变。
CRISPR/Cas9由两部分组成:具有核酸内切酶活性的Cas9蛋白和识别特异序列的引导RNA (guide RNA, gRNA)。gRNA与目标DNA结合后,Cas9的内切酶活性在基因组目标位点上产生双链断裂。在这个断裂点上,研究人员常利用细胞自身的DNA修复机制来修复双链断裂;举例而言,如果目的是敲除目标基因的表达,就可以利用非同源末端连接(NHEJ)的修复方式。
这种DNA修复途径在本质上是容易出错的,通常导致1个或多个碱基的增加或删除,这会破坏基因功能,因为核苷酸的丢失会打断开放阅读框,常常过早地产生终止密码子,从而阻止了蛋白质的产生。故而这样的操作,起到了一种敲除(KO)的效果。
如果需要更精确的基因编辑,可以采用同源驱动修复途径(HDR),通过设计包含所需序列变化的修复模板,用同源重组将任何变化引入(或称为“敲入”)基因组DNA。
图1 背景资料:关于DNA断裂的修复。
修复一般通过两种方式。在酶的帮助下把两个悬空的末端粘合,通常这会导致1个或多个碱基的增加或删除,这会破坏基因功能;另一些酶可以用一段DNA单链匹配被剪切的DNA片段的上游和下游序列,建立互补DNA链完成双链修复。前者被称为非同源末端连接,是CRISPR切割导致的最常见情况。后者被称为同源定向修复,发生的频率似乎根据不同细胞类型具有选择性倾向。
“CRISPR–Cas9对合成生物学和医学来说都是革命性的,但目前还没人知道把它放入细胞后真正会发生什么,”Richardson说。“我们只知道创建一些断口,剩下的依靠细胞自己修复它们,我们并没有真正理解过这一过程是如何运作的。”
药物发现工作流程中靶点的识别和验证
利用CRISPR的高通量筛选通常系统性地敲除、抑制或激活大量候选基因,通过研究相关的基因干扰是否加剧或阻碍了疾病,来寻找潜在的药物靶点。
在药物发现阶段的早期阶段,用CRISPR “pools” 进行靶点粗筛或表型筛选是常用的高通量方法,这些pools可以是全基因组范围的,也可以是自定义的。gRNA文库装载于慢病毒中转染细胞,通过实验条件的控制,平均让每个细胞都只转染入一个引导RNA。这些细胞用于正向或负向筛选,识别潜在的药物靶点,此时的细胞一般不需要再次利用,因此这个阶段不需要对细胞做单克隆。
一旦鉴别出了假定的基因靶点,则需要进一步的体外和体内的研究收集其功能信息,对其进行验证。
图2 背景资料:关于sgRNA文库构建和用突变细胞识别潜在靶点的工作流程(图片来源:金唯智公司)。
靶点验证阶段的克隆源性筛选
图4 Cripsr/Cas9 cell line 建株工作流程示意。
验证靶点,阐明疾病的途径,揭示细胞水平的机制,在做等等这些工作时,有关的每个基因都需要敲除(KO),这些敲除需要在稳定的细胞株中进行。此外,研究特定信号通路中多个相关基因也需要建立稳定的细胞克隆。最近Astrazeneca的一篇poster(点击文末“阅读原文”)展示了一个高通量的建立“基因敲除细胞株Panels”(Knock–Out Cell Line Panels)的实践。购买商业化的“排列合成引导RNA文库”(arrayed synthetic guide RNA libraries,供应商如Dharmacon/Horizon, Synthego),用Cas9表达细胞反向转染这些文库,转染后将单个细胞分别接种到384孔板孔中,用专用的Cell Metric全孔成像,记录存活的转染细胞的生长情况,同时确定其单克隆性。
克隆生长率和克隆源性在Cell Metric软件的Clonality Report 中被完整地记录。
图5 克隆源性报告追踪每孔的生长率和克隆源性。“从单个细胞开始”,是为了遗传背景的一致性,这点很重要,就如同基因敲除小鼠都要用近交系动物来做类似。
然后用移液工作站将细胞克隆多孔板复制(Replicate plates)出多块子板,用其中一块子板中的样品做NGS来确认和筛选出纯合子敲除(Homozygous knockout)克隆,其他的板则直接冷冻保存。
为满足这个工作流程的高通量需求,可以使用Cell Metric CLD,用带有孵育和自动进板功能的Cassette一次进行10个板的自动筛选,也可以通过API将Cell Metric连接入第三方机械手工作站(如Tecan、Hamilton、Thermo)。
靶点验证的工作完成后,接下来就可以在细胞水平对化合物进行筛选了。
Hit验证
通过建立可以精确重现疾病的模型,CRISPR深刻地影响了临床前药物的发现。
科学家们现在可以生产出有特定细胞和遗传背景的原代细胞、干细胞,甚至类器官,而不仅仅局限在一些常规的“永生化”的细胞系。举例而言,人源诱导多能干细胞(iPSCs)几乎可以分化为任何类型的细胞,从这样的干细胞中,可以很容易产生拥有相同基因组的各种细胞系,可以通过精确的基因编辑去重建出疾病相关的遗传变异。
为后续的下游工作启动建立这些疾病模型时,iPSCs细胞株的单克隆源性和生长率也是同样至关重要的,这些工作可以通过Cell Metric来完成。
这样构建的疾病细胞模型是从单个细胞起始而来,遗传背景更加真实可信,可以大大提高hit验证的有效性,使潜在的药物能够得到更准确的评估。
单击以下链接阅读及下载全文: