
在真核生物中,将非天然氨基酸(ncAAs)特异性插入蛋白质主要依赖于吡咯赖氨酸氨酰 tRNA 合成酶/tRNA 对。然而,为了扩大真核生物中 ncAAs 工具箱的结构多样性,获得更多的易于工程化的氨酰 tRNA 合成酶/tRNA 对,大肠杆菌来源的亮氨酸氨酰 tRNA 合成酶(EcLeuRS)/tRNA 对是非常有前景的替代方案。在这项研究中,通过优化以酵母为基础定向进化平台,作者快速分离出许多新的 EcLeuRS 突变体,能够在哺乳动物细胞中引入各种 ncAAs。

由于 EcLeuRS/tRNA 对来源于细菌,因此必须在真核体系中进行工程设计,避免其于与内源性对应物发生交叉反应。作者开发了一种基于酵母的定向进化系统,EcLeuRS/tRNAEcLeuCUA 对抑制 GAL4 转录因子中的 TAG 密码子(GAL4-T44TAG-R110TAG; GAL4-2*),驱动代谢报告基因如 URA3 或 HIS3 的表达(图 2A)。这些报告基因的表达允许酵母在缺乏尿嘧啶(Ura)和组氨酸(His)的培养基中分别存活,从而选择活性 EcLeuRS 突变体。该菌株包含 GAL4 驱动的 LacZ,以便通过蓝白实验进行下游筛选(正筛)。为了去除在缺乏 ncAA 底物的情况下仍保持活性的 EcLeuRS 突变体,使用负筛体系,通过表达 URA3 导致 5-氟乙酸(5-FOA)转化为有毒代谢物,导致细胞死亡(图 2A)。
为了对该筛选系统的性能进行测试,作者在酵母细胞中共表达 PLRS1 与其同源的 tRNACUAEcLeu 并测试了 ncAA Cap 的筛选情况。结果表明,尽管存在 Cap 的细胞生长更好,但在没有 Cap 的情况下也观察到大量意想不到的生长(图 2B)。此外,不表达 EcLeuRS 的细胞(仅表达tRNAEcLeuCUA 进行筛选)在选择条件下也显示出残留生长,表明了此系统的不严密性。作者进一步通过测量活性 EcLeuRS 突变体的富集水平来评估该筛选系统的性能。以 1:100 的比例混合两种编码 PLRS1 的质粒(活跃群体)或不编码 EcLeuRS 的质粒(不活跃群体),对其进行筛选,通过 PCR 对存活的克隆进行单独筛选,定量富集(图 2E)。结果发现,这种选择使活性与非活性群体的比例从 1:100 提升到约 1:1,表明约 100 倍富集。这种适度的富集水平可能不足以从大型突变文库中轻松识别罕见的 ncAA 选择性克隆,这解释了过去需要使用多轮筛选的原因。作者猜想可以通过在某些位点引入额外的 TAG 终止密码子从而抑制 GAL4-2* 的泄漏表达(图 2C)。为了验证这一猜想,作者在 GAL4-2* 的 5 个不同位置引入了第三个 TAG 密码子,构建了 5 个 GAL4-3* 变体。结果表明,严密性得到了改善(图 2D)。其中一个 GAL4-3* 突变体(GAL4-L3TAG-T44TAG-R110TAG)表现出最佳的存活模式,并能够得到至少 1000 倍的筛选富集效果(图 2E)。这些结果表明,与原始的 GAL4-2TAG 相比,基于 GAL4-3* 的筛选系统能够显著提高 EcLeuRS 的定向进化效率。
为了测试 GAL4-3* 筛选系统对于定向进化工程化 EcLeuRS 的有效性,作者随机选取其活性位点的 5 个关键残基:M40、L41、Y499、Y527、H527构建了突变体文库(图 3A)。此外,在编辑结构域引入了一个 T252A 突变,该突变已被证明可以提高 ncAA 的插入效率。在将该文库引入含有 GAL4-3* 选择系统的酵母细胞后,作者在每轮筛选步骤后从酵母细胞中分离 EcLeuRS 编码的 DNA,并在进行下一轮筛选之前将其转化至新鲜宿主细胞中(图 3B)。结果观察到,仅经过三轮筛选(正-负-正),ncAA 选择性突变体就能得到高效富集。对 10 个这样的克隆进行测序,发现 7 个不同的 EcLeuRS 突变体具有相似的活性位点结构(图 3C)。接下来,在哺乳动物细胞中共表达这些突变体与 tRNAEcLeuCUA,以测试它们将 Cap 插入到 EGFP-39-TAG 报告基因中的能力(图 3C)。7 个突变体都促进了高效的 Cap 依赖的报告基因表达,证明筛选成功。
在验证了筛选体系的可行性后,作者筛选了能够有效插入 ONBC 2(一种瓜氨酸的光笼衍生物)的 EcLeuRS。
此前的研究发现,多特异性的 EcLeuRS 突变体 PLRS1 能够偶然识别 ONBC,但效率很低。为了克服这一限制,作者使用优化的筛选系统来开发一种高效的 ONBC 选择性 EcLeuRS 突变体。在 3 轮筛选后得到了 7 个独特的突变体,其中有 6 个促进了 HEK293T 细胞中 EGFP-39-TAG 报告基因的 ONBC 依赖性表达(图 3D)。5 个突变体的活性明显高于先前报道的 PLRS1,其中最好的两个突变体提高了 4 倍活性。报告蛋白的 ESI-MS 进一步证实了 ONBC 的成功结合。在哺乳动物细胞中开发这种有效的瓜氨酸插入系统将有助于探索瓜氨酸化修饰在蛋白质组中的生理学作用。

乙酰化和甲基化是哺乳动物细胞中赖氨酸的两种主要翻译后修饰。最近,Lu-Culligan 等人发现赖氨酸也可以同时乙酰化和甲基化,在组蛋白 4(H4)上形成新的 PTM,Nε–乙酰基-Nε-甲基赖氨酸(Kacme 3),并与转录起始水平升高有关(图 4A)。这种新型 PTM 的生理作用尚不清楚,将其位点特异性地引入蛋白质将有助于阐明相关机制。作者合成得到了 Kacme,并利用此筛选系统来定向进化得到对应的 EcLeuRS。在 EcLeuRS 文库中对 Kacme 进行三轮筛选(阳性、阴性、阳性)得到 5 个不同的突变体(图 4B)。 HEK293T 细胞中,H1 和 EF9 表现出最高的活性(图 4C, 4D)。利用 C 端 polyHis 标签表达纯化报告蛋白并进行 ESI-MS 检测,结果验证了 Kacme 的成功插入(图 4E)。
最后,作者在 H4 的两个内源性修饰位点(K5 和 K12)上特异性地引入了 Kacme。在 HEK293T 细胞中分别转染编码 H4-5-TAG 和 H4-12-TAG 基因的质粒,同时共转染 EF9-EcLeuRS 和 tRNAEcLeuCUA 突变体 LeuIGI(图 4F)。Western blot 分析显示,只有在 Kacme 存在的情况下,全长 H4 才能成功表达(图 4G)。

众所周知,某些 aaRS 突变体是多特异性的,这意味着它们可以识别接受各种结构相似的 ncAA。这种多特异性的 aaRS 突变体是有价值的,因为它们可以方便地引入大量的 ncAA,无需进行长时间的定向进化实验。作者怀疑本文报道的新的 EcLeuRS 突变体可能表现出显著的多底物特异性。初步观察表明,两个特殊的 EcLeuRS 突变体 EF9 和 B11 有这种潜力。在 Cap 和 Kacme 筛选中都鉴定到了 EF9,而 B11 出现在 ONBC 筛选中。作者使用基于哺乳动物细胞的筛选策略,使用 EGFP-39-TAG 报告基因来探索 EF9 和 B11 是否可以识别插入各种线性脂肪族 ncAAs。两个突变体都展现出非凡的多底物特异性,能够插入的带有多样性化学功能基团的 ncAAs(图 1, 图 5A),包括带有化学偶联基团的 TCO*K,带有光交联基团的 DiazK 和带有 PTM 的 AcK 等。
鸟氨酸是一种丰富的非蛋白质源性氨基酸,也可以在多肽翻译后由精氨酸残基生成。这种较短的赖氨酸同源物与蛋白质的位点特异性结合为生物化学探针和蛋白质工程提供了独特的机会。然而,假定的鸟氨酸- tRNA 复合物的化学不稳定性,使得将其直接插入到蛋白质中具有挑战性。作者猜想鸟氨酸的光笼化衍生物 ONBO 21 可以克服这一挑战(图 5B)。ONBO 与蛋白质共翻译后,可以在光照下有效地转化为鸟氨酸。此外,作者怀疑与 ONBC 结构相似的 ONBO 可能很容易被多特异性 B11-EcLeuRS 识别插入。作者化学合成了 ONBO,并验证了这一假设,结果表明 B11-EcLeuRS 确实有效地将 ONBO 整合到 EGFP-39-TAG 中(图 5A)。通过 ESI-MS 对纯化得到得报告蛋白进行分析,证实了 ONBO 的有效插入,并进一步证明了光笼在照射后成功脱笼,在特定位点产生了鸟氨酸残基(图 5C)。

原文引用:https://doi.org/10.1002/anie.202423172
责任编辑:WXL