青云瑞晶

蛋白表达纯化第一步:质粒构建

2022-06-27 分享

        研究一个蛋白质的第一步是拿到它准确的基因序列,有了基因序列,我们就可以构建合适的质粒,表达出所需要的蛋白。

        质粒构建,英文名为plasmid construction。选定的目的外源基因(DNA)先要经过PCR扩增。随后用限制性内切酶分别切割载体和外源DNA片段,再使用DNA连接酶将切割后的载体与DNA片段连接,转入宿主细胞。最后经过筛选鉴定出正确的重组克隆质粒,实现目的基因在宿主细胞内的正确表达。


图一:质粒构建流程示意图



1、如何选择载体?

       载体通常分为克隆载体(Cloning Vector)与表达载体(Expression Vectors)两种。

       克隆载体大多是高拷贝载体,能够将外源基因与克隆载体的质粒连接,导入原核细菌内,进行大量复制克隆。主要用途是保存目的基因片段。


在选择克隆载体时应注意:

       ①具有自主复制能力,拷贝数高;

       ②携带易于筛选的选择标记;

       ③含有多种限制酶的单一识别序列,以供外源基因插入;

       ④载体应尽可能小(<15kb),便于导入细胞和进行繁殖;

       ⑤使用安全。克隆载体应只存在于有限范围的宿主内,在宿主体内不进行重组,不发生转移,不产生有害性状,并且不能离开工程宿主自由扩散。

       表达载体是为了使插入的外源DNA序列转录、翻译成多肽链而进行特殊设计的克隆载体。它含有特定的表达系统元件,即启动子--核糖体结合位点--克隆位点--转录终止信号。


根据表达的类型,表达载体可分四类:

       非融合型表达载体,如PKK223-3;

       分泌型表达载体,如PINⅢ-ompA1;

       融合蛋白型表达载体,如PGEX;

       包涵体型表达载体,如pBV220。



图二:基因片段选择


 2、引物设计中的规则

       运用PCR扩增目的基因的过程中,引物设计十分关键,以下是需要注意的:

       ①引物长度最好在18-30bp左右,常用的长度是 20-22bp;

       ②引物 Tm 值最好在 60℃ 左右,两条引物间 Tm 值要保持接近,相差最好不要超过 5°C;

       ③GC 的含量标准通常为 40%-60% 或45-55%;

       ④引物自身不应含有连续超过4个的互补的碱基,避免形成发卡结构或形成引物二聚体;

       ⑤引物的3' 端要避免出现连续重复的碱基,如 GGG 或 CCC ,这会导致错配的发生,最后一个碱基最好是 G 或 C;

       ⑥在引物的 5′ 端添加酶切位点时(在不影响扩增的特异性的前提下),根据酶切位点序列,需要添加不同种类和数量的保护碱基,通常多加3个碱基即可满足保护酶切位点的需求;

       ⑦上下游引物最好加入不同的酶切位点,相同的酶切位点可能导致目的基因片段出现倒置连接现象,影响基因序列的正常表达。


3、PCR扩增中常见的问题

        扩增基因的过程并不困难,但未必能保证百分之百的成功率。

        如结果出现引物二聚体、非特异性条带(大小不对)的现象,可以通过降低模板和引物的浓度、降低镁离子浓度、适当减少酶量,提高退火温度,来提高扩增特异性。

       若出现凝胶条带弥散状态,多为模板不纯、反应体系中各成分比例不合适、退火温度设置偏低、循环次数过多等原因。

       长片段基因的扩增容易增加点突变和错配率,选用高扩增能力、高保真、可靠性强的聚合酶也很关键。


4、其他问题

       在操作酶切连接的步骤时也要定性定量,保证酶活性充足,例如:双酶切尽可能选择同种缓冲buffer,一般用量40U单位以上(用量不超过总体积1/10),保证酶切过程充分;可根据 目标片段量(ng)=(载体量(ng)×目标片段长度(kb))/(载体DNA片段长度(kb))×目标片段和载体的摩尔比(1:3-1:8)计算出目标片段和载体的加入量,提高连接效率。

       构建好的载体放入感受态细胞中转化(TOP10、DH5α、BL21等,感受态细胞在使用时尽可能保证新鲜,避免反复冻融,冰上孵育和热激时间应严格控制),经抗性、菌落PCR、酶切、测序等多道程序验证,确定是否转化成功,最终获得正确的重组克隆基因片段。


5、如何选择正确的菌株和载体(详见文末列表)


E coli strain list


No. strain annotation Resistant
1 BL21 (DE3) 最常用的 No
2 Rosetta (DE3) 稀有密码子AUA, AGG, AGA, CUA, CCC, GGA Cl
3 Rosetta2 (DE3) 稀有密码子AUA, AGG, AGA, CUA, CCC, GGA和CGG Cl
3 Origami 2 (DE3) 二硫键及稀有密码子 StrR,Tet
4 C41 (DE3)orC43 (DE3) 疏水性蛋白 No
5 Arctic (DE3) TPN30 & TPN60 分子伴侣 Tet,Cam
6 Tuner(DE3) 通过IPTG精确控制表达量, 0.1mM IPTG No
7 BL21 (DE3) pLysS 降低毒性蛋白的本底表达 Cl
8 Rosetta(DE3) pLysS 降低毒性蛋白的本底表达,稀有密码子AUA, AGG, AGA, CUA, CCC, 和GGA。 Cl
9 BL21(DE3) del-slyXD BL21(DE3) knock out slyXD No
10 B834(DE3) Met缺陷菌株 No
11 T7 pLys Y 具有抗T1噬菌体感染能力 Cl
12 BL21star(DE3)
13 origamiB(DE3) 二硫键 KanR,TetR
14 Origami 2 (DE3) pLysS Origami 2 (DE3)的基础上加pLysS抑制本地表达。 Cl,StrR,Tet
15 Dh5α 克隆菌株 No
16 Dh5α-T1 具有抗T1噬菌体感染能力 No
17 Dh10bac Bacmid 制备 Tet,gentamicin
18 BL21-Gold(DE3) 可以同时用作蛋白表达菌株和质粒克隆菌株 No


Plasmid list


名称 长度 抗性 特殊性能
PAO815 7709 bp Amp 酵母表达
pAxCAwt 44741 bp Amp 腺病毒表达
pAxcw 42410 bp Amp 腺病毒表达
pAAV-MCS 4.7 kbp Amp 哺乳动物细胞表达
pBacPAK8 5.5 kbp Amp 杆状病毒表达
PBI121 13.0 kbp Kan 植物细胞表达
pBV220 3665 bp Amp 原核表达
pCAMBIA 1300 植物细胞表达
pCAMBIA 1301 11837 bp Kan 植物细胞表达
pCAT3-Basic 4047 bp Amp
pcDNA 3 5446 bp Amp 哺乳动物细胞表达
pcDNA 3.1(+) 5428 bp Amp 哺乳动物细胞表达
pcDNA 3.1/ mys-HisA 5494 bp Amp 哺乳动物细胞表达
pCl-neo 5472 bp Amp 哺乳动物细胞表达
pCMV-MCS 4.5 kbp Amp 哺乳动物细胞表达
pET-3a 4640 bp Amp 大肠杆菌表达
pET-11a 5677 bp Amp 大肠杆菌表达
pET-15b(+) 5708 bp Amp 大肠杆菌表达
pET-20b(+) 3716 bp Amp 大肠杆菌表达
pET-22b(+) 5493 bp Amp 大肠杆菌表达
pET-23a(+) 3666 bp Amp 大肠杆菌表达
pET-23b(+) 3665 bp Amp 大肠杆菌表达
pET-23c(+) 3664 bp Amp 大肠杆菌表达
pET-23d(+) 3663 bp Amp 大肠杆菌表达
pET-28a(+) 5369 bp Kan 大肠杆菌表达
pET-28b(+) 5368 bp Kan 大肠杆菌表达
pET-28c(+) 5367 bp Kan 大肠杆菌表达
pET-30a(+) 5422 bp Kan 大肠杆菌表达
pET-30b(+) 5421 bp Kan 大肠杆菌表达
pET-30c(+) 5423 bp Kan 大肠杆菌表达
pET-31b(+) 5742 bp Amp 大肠杆菌表达
pET-32a(+) 5900 bp Amp 大肠杆菌表达
pET-32b(+) 5899 bp Amp 大肠杆菌表达
pET-32c(+) 5901 bp Amp 大肠杆菌表达
pET-39b 6106 bp Kan 大肠杆菌表达
pET-42a 5930 bp Kan 大肠杆菌表达
pGAPZ-aA 3147 bp Zeo 酵母表达
pGBKT7 7.3 kbp Kan 酵母表达
pGEM3Zb 原核表达
pGEM3Zf(+) 原核表达
pGEM7Zf(+) 原核表达
pGEX-2T 4969 bp Amp 原核表达
pGEX-4T-1 4969 bp Amp 原核表达
pGFP-N2 4732 bp Kan 哺乳动物细胞荧光蛋白表达
pEGFP-C1 4731 bp Kan 哺乳动物细胞荧光蛋白表达
pEGFP-C3 4727 bp Kan 哺乳动物细胞荧光蛋白表达
pEGFP-N1 4733 bp Kan 哺乳动物细胞荧光蛋白表达
pLEGFP-N1 6892 bp Amp 哺乳动物细胞荧光蛋白表达
pGL3-Basic 4818 bp Amp
pGL36
pLNCX 6620 bp Amp 反转录病毒表达
pLNHX 5.6 kbp Amp 反转录病毒表达
pLXSN 5.9 kbp Amp 反转录病毒表达
pLXIN 6.1 kbp Amp 反转录病毒表达
pMAL-p2x 6721 bp Amp 原核融合蛋白表达
pMAL-c2x 6721 bp Amp 原核融合蛋白表达
pPIC3.5K 9004 bp Amp/Kan 酵母表达
pPIC9 8024 bp Amp 酵母表达
pPIC9K 9276 bp Amp 酵母表达
pPICZ aA 3593 bp Zeo 酵母表达
pQBI PGK 5387 bp Amp 哺乳动物细胞荧光蛋白表达
pQE-30 3461 bp Amp 原核表达
pQE-9 3439 bp Amp 原核表达
pRevTRE 6487 bp Amp 反转录病毒表达
pSE420L 4617 bp Amp
pTac I Amp 原核表达
pTac I(BamH I) Amp 原核表达
pTAL-Luc 4956 bp Amp 哺乳动物细胞表达
pTWIN1 7375 bp Amp
pTXB1 6706 bp Amp
pVAX1 2999 bp Kan
留言板