如何設置html的關鍵字(html關鍵字高亮)
外源蛋白表達過程中谷氨酸棒狀桿菌轉錄組及代謝物的多變元分析
孫楊,劉秀霞,董貴斌,楊艷坤,白仲虎*
1(江南大學,糧食發(fā)酵工藝與技術國家工程實驗室,江蘇 無錫,214122) 2(江南大學,工業(yè)生物技術教育部重點實驗室,江蘇 無錫,214122) 3(江南大學,糖化學與生物技術教育部重點實驗室,江蘇 無錫,214122)
摘 要以谷氨酸棒狀桿菌為研究對象,在發(fā)酵罐水平30%溶解氧條件下對野生菌及表達EGFP的工程菌進行平行培養(yǎng),對培養(yǎng)20 h的菌體進行轉錄組分析,并對不同時間點所取樣品進行代謝物檢測。利用多變元分析方法分析轉錄組和代謝物數據,其中主要利用主成分分析法進行關鍵因素分析,利用正交偏最小二乘法判別分析進行轉錄組數據分析,繼而通過S-plot得到不同溶解氧下的生物標記物(biomarkers),最終找到了8個關鍵基因。代謝數據分析結果表明ATP、谷氨酸、乙酸、胞內谷氨酸、甲硫氨酸及乳酸是外源蛋白表達的關鍵代謝物;通過不同時間點代謝物含量變化分析發(fā)現外源蛋白表達的代謝變化類似于低氧環(huán)境下的代謝變化現象,即糖酵解增強,TCA溢流,回補途徑增加,乙酸、乳酸生成增加。通過對比外源蛋白表達工程菌與野生菌的轉錄組數據及代謝物含量數據,為今后在代謝工程中菌株改造、優(yōu)化代謝獲得高效表達外源蛋白的谷氨酸棒狀桿菌表達宿主奠定基礎。
關鍵詞:谷氨酸棒狀桿菌;多變元分析;正交偏最小二乘法判別分析);關鍵基因;轉錄組測序
谷氨酸棒狀桿菌(Corynebacteriumglutamicum,C.glutamicum)作為一種革蘭氏陽性菌,由于其獨特的優(yōu)點,例如與大腸桿菌表達系統相比具有胞外分泌表達外源蛋白、不產生內毒素等優(yōu)點[1-2],近些年被廣泛應用于外源蛋白的表達。然而C.glutamicum表達系統存在轉化效率低、可用遺傳工具少、蛋白表達量低等問題,為解決這些問題,已開展了許多相關研究。如構建和優(yōu)化適合表達外源蛋白的載體,包括啟動子、信號肽、目的基因、表達方式的篩選及優(yōu)化等[3-5];研究宿主基因的功能分析和調控機制,找出影響外源蛋白表達的關鍵基因用于宿主細胞的改造等。
近年來隨著組學不斷發(fā)展,人們對于C.glutamicum的基因背景更加了解,C.glutamicum基因組大小為3.2 Mb,編碼24 000個基因[6],其大部分基因也得到了注釋和分析,然而對于C.glutamicum外源蛋白表達中的相關基因,還沒有太多的研究,因此我們通過轉錄組測序(RNA-sequencing, RNA-seq)的手段,分析發(fā)酵罐水平表達增強型綠色熒光蛋白(enhanced green fluorescent protein, EGFP)的C.glutamicum[7]。首先通過GO (Gene Ontology)、KEGG (Kyoto Encyclopedia of Genes and Genomes)途徑分析對比了野生菌和表達EGFP工程菌在轉錄組水平的差異,其次在能量水平和物質水平對2種菌株的差異基因和代謝物進行了分析。在分析轉錄組數據時,通常控制的篩選標準為差異基因大于兩倍,p≤0.05,然而此種設置將會遺漏一部分對于外源蛋白表達的關鍵基因,因此本文通過利用基于SIMCA的多變元分析(Multivariate Data Analysis, MVDA)方法(PCA,principal component analysis;OPLS-DA, rthogonal Partial Least Squares-Discriiminate Analysis)[8],對轉錄組數據進行分析,最終獲得了外源蛋白表達過程中的較全面的關鍵基因。對這些關鍵基因的研究將有助于加深對外源蛋白表達過程的理解,為提高外源蛋白表達的代謝改造提供新途徑和新靶點。最后為了進一步研究EGFP的表達對C.glutamicum胞內關鍵代謝物的影響,本文通過相同的MVDA方法對不同時間點所取樣品的代謝物進行分析研究。
展開全文
綜上,本文通過利用MVDA的方法(PCA, OPLS-DA),對轉錄組原始數據整體進行分析,更加全面地從統計學角度分析了轉錄組數據,為C.glutamicum的代謝改造提供了關鍵基因靶點。同樣地對代謝數據進行分析,找出了外源蛋白表達的關鍵代謝物質,對外源蛋白表達相對于野生菌的代謝變化的理解提供了更進一步的解釋說明和有利證據。
1.1材料
1.1.1 菌株
由實驗室保存的張家港華昌制藥贈予的谷氨酸棒桿菌命名為CorynebacteriumglutamicumBZH001 (C.glutamicumBZH001),表達EGFP的工程菌CorynebacteriumglutamicumpXMJ19-EGFP (C.glutamicumEGFP)為本實驗室構建并保存的菌種[9]。
1.1.2 試劑和儀器
RNA提取試劑、反轉錄試劑盒及定量PCR試劑盒均購自TaKaRa公司;ATP檢測試劑盒、BCA蛋白濃度測定試劑盒檢測購于上海碧云天生物有限公司;乳酸、丙酮酸、甲醇以及常用氨基酸均為國產優(yōu)級純試劑。
主要儀器有:Applikon EZ-control 5 L發(fā)酵罐、安捷倫1200液相色譜儀、超純水系統、紫外分光光度計、化學發(fā)光儀、高通量破碎儀、高速冷凍離心機、熒光定量PCR儀等。
1.1.3 培養(yǎng)基
種子培養(yǎng)基:葡萄糖25 g/L,KH2PO41 g/L,MgSO41 g/L,尿素2 g/L,玉米漿30 g/L,(NH4)2SO420 g/L,pH 6.8~7.0,1×105Pa,115 ℃滅菌20 min。
發(fā)酵培養(yǎng)基:葡萄糖30 g/L,KH2PO41 g/L,MgSO41 g/L,玉米漿15 g/L,(NH4)2SO420 g/L,消泡劑萬分之0.5,pH 6.8~7.0,1×105Pa,115 ℃滅菌20 min。
1.1.4 軟件
商業(yè)化的多變元分析軟件用于多變元分析(PCA,OPLS-DA) -- SIMCA version 14.0 (MKS UmetricsAB, Sweden)
1.2實驗方法
1.2.1 培養(yǎng)方法
從-80 ℃冰箱取保藏甘油管1只,以1%接種量轉接于種子培養(yǎng)基中,30 ℃、230 r/min培養(yǎng)12 h后,按10%接種量接于裝有200 mL二級種子培養(yǎng)基的1 000 mL帶擋板搖瓶中,30 ℃、230 r/min培養(yǎng)12 h。在5 L發(fā)酵罐中,控制發(fā)酵溫度為30 ℃,pH 6.8,通過攪拌轉速和氧氣偶聯控制溶氧在30%,重復發(fā)酵3個批次。自動通過添加17%磷酸、純氨水,維持發(fā)酵液pH在6.8左右。在發(fā)酵20~22 h時以4 ml/h的速度開始添加300 g/L葡萄糖作為補充碳源,以控制葡萄糖濃度大于5 g/L。20 h時取樣,液氮迅速冷凍處理后保存于-80 ℃,待轉錄組測序時使用。
1.2.2 分析方法
1.2.2.1 轉錄組分析
總RNA的提取和RNA-seq過程參照[10],clean reads以FASTQ的格式提交到NCBI的Sequence Read Archive (SRA),登記號為GSE77502/GSE87077。
1.2.2.2 菌體濃度、葡萄糖、總蛋白量的測定
菌體濃度采用吸光度法測定,葡萄糖含量的測定參照3,5-二硝基水楊酸法(DNS),總蛋白含量測定采用Bradford方法。
1.2.2.3 氨基酸、有機酸含量測定
氨基酸含量通過OPA衍生化后經高效液相色譜(HPLC)檢測[11]。有機酸含量測定參照劉志成等的測定方法[12]。色譜柱采用安捷倫Agilent 1260,Hypersil GOLD (C18) 250 mm×4 mm 5 um,檢測器為紫外檢測器;檢測波長215 nm;柱溫30 ℃;進樣量20 μL;流動相:0.01 mol/L KH2PO4(pH2.5):甲醇=97∶3;V=0.6 mL/min。
1.2.2.4 NAD+/NADH、NADP+/NADPH及ATP含量的測定
能量和還原力含量的檢測方法參照文獻[13]。
1.2.2.5 RT-PCR驗證
總RNA的提取通過Trizol法進行提取。通過takara反轉錄試劑盒反轉為cDNA,通過ABI stepone Plus實時定量PCR儀和SYBR RT-PCR試劑盒進行RT-PCR,根據NCBI上基因序列設計相關引物。
表1Real-timePCR所用引物
Table1ThespecialprimerusedbyReal-timePCR
2 結果與分析
2.1轉錄組數據分析
本文對工程菌C.glutamicumEGFP和野生菌C.glutamicumBZH001進行了3批次平行發(fā)酵培養(yǎng),為了減少其他脅迫帶來的影響,控制溶解氧水平為30%,并在16 h開始進行葡萄糖補料,控制葡萄糖濃度不低于5 g/L,并維持其他培養(yǎng)條件保持一致。培養(yǎng)至20 h時野生菌和工程菌都進入穩(wěn)定期初期,此時細胞比生長速率相同,選取此取樣點作為轉錄組數據取樣點,消除了野生菌和工程菌細胞由于處在不同生長時期而造成的差異,另外此時外源蛋白合成速率較大并且有一定的積累(相對熒光表達量36587 RLU/OD600nm),更容易找出工程菌和野生菌之間的差別。利用Ilumina hiseq 2500進行轉錄組測序。測序結果表明工程菌和野生菌3個重復批次之間的變異系數CV2.5%,通過原始數據質控之后,clean data 與C.glutamicumATCC13032基因組(NC_003450.3)進行對比,唯一比對到基因組的reads為大于1 600 000,占總reads數84%以上,之后通過NOIseq處理六組clean data,并控制差異表達基因篩選條件為log2 ratio 1以及FDR0.05。以C.glutamicumBZH001作為對照組,C.glutamicumBZH001作為實驗組,有244個基因顯著下調,319個基因顯著上調。差異表達基因中有14個基因log2 ratio 4,其中4個基因為假設蛋白(NCgl1413, NCgl2845, NCgl2837及NCgl0910),5個基因沒有相關注釋,其余5個基因(NCgl0055,NCgl0487,NCgl0833,NCgl0909及NCgl0303)的功能涉及轉錄、翻譯、轉運等生命活動。其中NCgl0055與轉錄調控有關;NCgl0487(編碼與翻譯的延伸功能有關的50S核糖體蛋白L3 (rplC))出現約95倍的下調,而NCgl0833(編碼50S核糖體蛋白L33 (rpmG))出現24.18倍下調,有一個鋅指結構域。這兩個核糖體蛋白基因表達的下調可能跟EGFP表達的特殊性有關,但具體的原因還需進一步研究。NCgl0909(編碼ABC轉運體ATP酶)出現顯著性的上調,這意味著ATP結合性盒式轉運蛋白系統對糖類和氨基酸等底物的跨膜轉運活動的增加,為EGFP的表達提供足夠的底物。NCgl0303編碼的CspA家族的冷激蛋白與CspB同屬細胞膜蛋白類,有報道CspB蛋白突變體能促進Fab抗體的分泌[14]。
差異表達基因進一步通過KEGG數據庫(http://www.kegg.jp/kegg/pathway.html)和David數據庫(https://david.ncifcrf.gov/gene2gene.jsp)進行pathway和GO功能分析,發(fā)現差異基因富集最多的pathway為不同環(huán)境微生物代謝途徑,有46個差異基因的富集。而與代謝相關的糖酵解/糖異生、碳代謝、磷酸戊糖途徑和丙酮酸代謝也有相關的富集。另外有5個差異基因富集到磷酸轉移酶(phosphotransferase system, PTS)系統。PTS系統與糖的胞外向胞內轉運有關,通過磷酸化轉運葡萄糖到胞內進行物質代謝,從而為外源蛋白的合成提供能量和底物。而GO功能分析結果可以看出,控制p≤0.05,差異基因主要富集在生物過程(4)和分子功能(2),差異基因富集在生物過程中的有:GO:0009401-磷酸烯醇式丙酮酸-糖磷酸轉移酶系統、GO:0006355-轉錄和DNA模板調控、GO:0006096-glycolytic process和GO:0006351-轉錄和DNA模板。富集在分子功能中的有:GO:0008199-三價鐵耦合和GO:0035731-亞硝酸酰基鐵復合物耦合。由KEGG和GO分析可以看出差異基因主要集中在中心代謝途徑,物質轉運過程和翻譯過程。由此可見在外源蛋白表達過程中細胞內代謝也發(fā)生了顯著性變化,通過對這些變化的研究,可以了解外源蛋白表達的特殊性和差異性。
2.2外源蛋白表達過程谷氨酸棒狀桿菌轉錄水平多變元分析
在對轉錄組數據進行分析時,我們選擇了數據過濾閾值,即FDR0.05且foldchange2,這樣可以得到可靠的相關差異基因。但是與此同時也會丟失一些數據,即外源蛋白表達過程對C.glutamicum轉錄水平影響的相關基因。所以我們通過對控制溶解氧水平為30%條件下外源蛋白表達的轉錄組數據和相同條件下野生菌的轉錄組數據即標準化的RPKM值進行多變元分析,通過統計學方法(PCA,OPLS-DA),找出C.glutamicumEGFP與C.glutamicumBZH001轉錄水平的差異的關鍵基因。
對于任何數據組進行多變元分析時,先從整體上進行數據分析非常重要,特別是對于分組的數據,整體分析可以看出組內重復性的好壞和組間差異變量,并通過模型的好壞,確定模型的預測性和擬合度,因此我們通過PCA對外源蛋白表達工程菌和野生菌的六組數據及2566個基因進行主成份分析。PCA是通過降維的方法對多變量參數進行降維分析,從而用具有代表性的新變量來解釋說明整體變量參數,并對樣本進行分類。由模型擬合結果可知,模型被擬合為3個主成分,模型擬合參數:R2X(cum)=0.874,說明模型能夠解釋說明87.4%的數據變化;Q2(cum)=0.429,說明模型能夠預測42.9%的變量,這兩個數據說明本次擬合度較好,建立模型的解釋能力和預測能力都較好。由loading plot (圖1A)可見工程菌和野生菌具有較好的聚類趨勢,都位于95%置信區(qū)間的Hotelling’s T2橢圓形內,并在t[1]方向上有較好的分離度;野生菌和工程菌在t[2]方向上都有一定的趨勢,而這個趨勢的存在肯定由某些原因(樣本的處理,數據的處理等)造成的,因此通過對這個趨勢的分析,會在以后的試驗中改進模型的建立。由Score plot (圖1B)可知,樣本變量在t[1]兩側,分布密度較大,中間較小,因為變量數據較大,無法單獨分析邊界變量,所以需要進一步對數據進行分析。
A:Loading plot;G: C. glutamicum EGFP樣本組;W:C. glutamicum BZH001樣本組; B: Score plot
圖1 野生菌和工程菌的主成分分析
Fig. 1 PCA analysis result of C. glutamicum EGFP and C. glutamicum BZH001
為了進一步得到工程菌表達過程中相對于野生菌的“biomarker”,我們首先對樣本進行分組,分為工程菌(K-30,G-30,I-30)及野生菌(A-30,B-30,C-30),再進行OPLS-DA分析,并用S-plot進一步分析。通過對數據進行Par scaling,S-plot類似于S型,而S-plot 圖中X 軸P[1]代表變量對于分組的影響程度,數值越大代表影響程度越大的變量。P(corr)[1]表示變量對兩組樣本區(qū)分的可信度,范圍為-1-1,越接近1表示可信度越大,因此通常在S-plot兩端的變量為區(qū)分兩組樣本的“Biomaker”[15]。S-plot作為OPLS-DA中的常用分析方法,被用于代謝物的“biomarker”分析。S曲線的左右兩側紅色的數據點即為最有可能造成模型差異的差異基因(圖2)。進一步通過VIP圖可以得到這些基因對模型貢獻的差別。由圖2我們選擇了57個貢獻度最大的基因,這些基因涉及最多的為核糖體蛋白(rpsO、rpsR、rplC、rplJ)、應激蛋白、分子伴侶(冷激蛋白,dnaK)及轉錄因子等。
圖2 OPLS-DA分析(S-plot)
Fig. 2 Analysis result of OPLS-DA S-plot
通過結合在30% DO下的差異基因和多變元分析出的共同基因,我們得到了8個基因(圖3A),其中6個為核糖體蛋白,相關基因為NCgl0487 (50S 核糖體蛋白 L3)、NCgl0833 (50S 核糖體蛋白 L33)、NCgl0519 (50S 核糖體蛋白 L30)、NCgl2279 (50S 核糖體蛋白 L27)、NCgl0489 (50S 核糖體蛋白 L23)和NCgl0496 (30S 核糖體蛋白 S17),參與到與23SrRNA的結合、肽基轉移酶的活性、確保翻譯的保真度等生命活動中[16]。另外兩個基因,NCgl0303編碼冷激蛋白,屬于CspA家族,同時也參與轉錄的調節(jié)過程,在工程菌中的表達量大于野生菌;NCgl2632編碼的蛋白雖然為假設蛋白,但進行氨基酸序列同源對比發(fā)現,該蛋白與乙酰輔酶A乙酰轉移酶相似。乙酰輔酶A在代謝中具有重要作用,是從糖酵解進入TCA循環(huán)的關鍵物質,另外在脂肪酸的β氧化中硫解反應也產生乙酰輔酶A,而乙酰輔酶A乙酰轉移酶在分解代謝中起到關鍵作用[17],因此NCgl2632可能與蛋白的乙?;蚰芰看x有一定的相關性。選取4個關鍵基因進行RT-PCR驗證,結果表明這些基因與轉錄組數據相似,并且都具有較大的差異倍數(表2)。為了進一步驗證這些基因在外源蛋白表達過程中的作用,需要進一步研究這些基因的相關功能。
2.3代謝物多變元分析
為分析外源蛋白表達引起的代謝物含量變化,我們在發(fā)酵過程中每4個小時取一次樣,測定細胞內外代謝物含量。從代謝隨時間變化的趨勢無法對代謝物變化進行整體分析以及代謝物間的相互關系,因此對代謝物也采用多變元分析方法尋找影響本文EGFP表達的關鍵代謝物。分析對象為C.glutamicumBZH001和C.glutamicumEGFP在發(fā)酵罐培養(yǎng)水平8 h、20 h、36 h三個時間點的樣品,進行PCA分析(模型擬合為5個主成分,R2(cum)=0.932,Q2(cum)=0.631)。由圖4可見,同一樣本組沿平行方向被聚類在一起,并且同一取樣時間點的三個樣品被聚類在一起,表明實驗重復性較好。沿區(qū)分三個時間點樣本方向的乙酸、PC、ATP三因素為區(qū)分不同時間點的關鍵變量。
A: C. glutamicum EGFP和C. glutamicum BZH001關鍵基因熱圖分析;B: 多變元分析得到的關鍵基因和轉錄組數據維恩圖分析
圖3 外源蛋白表達關鍵基因分析
Fig. 3 Key gene analysis of foreign protein expression
表2差異基因的RT-PCR驗證
Table2RT-PCRofDEGs
圖4 不同時間點樣品代謝物的PCA分析
Fig. 4 PCA analysis result of metabolics of samplings
為找出對EGFP的表達貢獻度最大的代謝物,本文進一步對樣本進行OPLS-DA分析。圖5B為VIP圖,是對S-plot (圖5A)影響變量的排序。由圖5B可見,ATP、谷氨酸、乙酸、胞內谷氨酸(Glu-in)、甲硫氨酸及乳酸為區(qū)分C.glutamicumEGFP與C.glutamicumBZH001的biomarker。對C.glutamicumEGFP與C.glutamicumBZH001中代謝物含量分析發(fā)現工程菌和野生菌中有較大差異倍數,利用T檢驗分析P-value顯示兩組間有顯著性的差異(表3),進一步驗證了這六個代謝物在工程菌和野生菌中的差異性,已知外源蛋白在合成過程中,氨基酸的轉運、肽鏈的折疊、蛋白的跨膜運輸都需要ATP的參與。而C.glutamicum胞內氨基酸生成中Glu含量最多,因而其對OPLS-DA分析的權重就越大。而乙酸和乳酸作為代謝分析的關鍵物質,外源蛋白表達過程中工程菌中含量大于野生菌,這與在分析外源蛋白表達過程中發(fā)現的外源蛋白表達具有類似于低氧環(huán)境下的代謝變化現象是一致的,如圖6所示,C.glutamicumEGFP相對于C.glutamicumBZH001葡萄糖消耗增加,糖酵解增強,異檸檬酸裂解酶活性增強,乙醛酸循環(huán)增強,亮氨酸和纈氨酸含量增加,谷氨酸和甲硫氨酸合成增加,TCA溢流,PEPK活性增加,回補途徑增加,乙酸、乳酸生成增加。TCA還原臂通量減少,而乙酸的生成量增加,促進NADH生成的同時也保證了胞內氧化還原水平的平衡。這些代謝物作為影響外源蛋白表達的關鍵因素,其合成的變化也影響了碳源的利用和能量的分配。以上結論有助于指導通過分子生物學和系統生物學對宿主進行改造,提高能量和底物在蛋白合成途徑中的利用。
表3C.glutamicumEGFP與C.glutamicumBZH001關鍵代謝物含量分析
Table3CriticalmetaboliteconcentrationanalysisofC.glutamicumEGFPandC.glutamicumBZH001
3 結論與討論
C.glutamicum作為一種新的蛋白表達宿主具有許多優(yōu)點,目前被不斷地應用在單鏈抗體、工業(yè)酶等方面。為了優(yōu)化外源蛋白的表達, 其表達系統的構建、表達元件的優(yōu)化和篩選也是目前研究的熱點。我們通過二代測序對在發(fā)酵罐水平培養(yǎng)的EGFP表達工程菌和野生菌進行轉錄組測序, 通過P-value和差異倍數進行差異基因的篩選。但這種分析方法可能會丟失一些相關基因,因此我們首次通過多變元分析方法對EGFP在C.glutamicum中的轉錄水平的表達量(RPKM)進行相關性分析,通過OPLS-DA找出與外源蛋白表達具有相關性的57個基因,并通過跟差異基因的對比,鑒定8個關鍵基因,為外源蛋白表達的關鍵途徑的探索和改造提供了新的研究靶點。此外我們又通過對不同時間點兩種菌株胞內外代謝物進行同樣的多變元分析,找出了ATP、谷氨酸、乙酸、Glu-in、甲硫氨酸、乳酸等與外源蛋白表達相關的代謝物,這與之前所發(fā)現的外源蛋白表達出現的類似低溶解氧條件下代謝現象相似(糖酵解增強,TCA shunt,回補途徑增加,乙酸、乳酸生成增加),進一步加深了對外源蛋白表達過程的了解。
A:S-plot; B:VIP圖
圖5 工程菌和野生菌不同時間點代謝物OPLS-DA多變元分析
Fig. 5 OPLS-DA analysis of metabolics of C. glutamicum EGFP and C. glutamicum BZH001
圖6 C. glutamicum EGFP 與C. glutamicum BZH001代謝變化
Fig. 6 Metabolism change between C. glutamicum EGFP and C. glutamicum BZH001.
注:六邊形代表酶活,方框表示代謝物,箭頭表示上調和下調。G-6-P:6-磷酸-果糖;3-PG:3-磷酸甘油醛;PEP:磷酸烯醇式丙酮酸;PYR:丙酮酸;LDH:乳酸脫氫酶;Lac:乳酸;PDH:丙酮酸脫氫酶;AcCoA:乙酰輔酶A;PC:丙酮酸羧化酶;PEPCK:磷酸烯醇式丙酮酸羧化酶;OAA:草酰乙酸;CIT:檸檬酸;ICIT:異檸檬酸;ICL:異檸檬酸裂解酶;α-KG:α-酮戊二酸;GDH:谷氨酸脫氫酶;Glu:谷氨酸;Suc:琥珀酸;MAL:蘋果酸;ICL:異檸檬酸裂解酶;MS:蘋果酸合酶。
參考文獻
[1] LIU Xiu-xia,ZHANG Wei,ZHAO Zi-hao,et al.Protein secretion inCorynebacteriumglutamicum[J].Critical Reviews in Biotechnology,2017,37(4):541-551
[2] LIU Xiu-xia,YANG Yan-kun,ZHANG Wei,et al.Expression of recombinant protein usingCorynebacteriumGlutamicum: progress, challenges and applications[J].Critical Reviews in Biotechnology,2016,36(4):652-664.
[3] YIM S S,AN S J,CHOI J W,et al.High-level secretory production of recombinant single-chain variable fragment (scFv) inCorynebacteriumglutamicum[J].Applied Microbiology and Biotechnology,2014,98(1):273-284.
[4] PATEK M,NESVERA J.Sigma factors and promoters inCorynebacteriumglutamicum[J].Journal of Biotechnology,2011,154(2-3):101-113.
[5] WATANABE K,TSUCHIDA Y,OKIBE N,et al.Scanning theCorynebacteriumglutamicumR genome for high-efficiency secretion signal sequences[J].Microbiology,2009,155(Pt 3):741-750.
[6] KALINOWSKI J,BATHE B,BARTELS D,et al.The completeCorynebacteriumglutamicumATCC 13032 genome sequence and its impact on the production of l-aspartate-derived amino acids and vitamins[J].Journal of Biotechnology,2003,104(1-3):5-25.
[7] MIKSCH G,BETTENWORTH F,FRIEHS K,et al.A rapid reporter system using GFP as a reporter protein for identification and screening of synthetic stationary-phase promoters inEscherichiacoli[J].Applied Microbiology and Biotechnology,2006,70(2):229-236.
[8] BOCCARD J,RUTLEDGE D N.A consensus orthogonal partial least squares discriminant analysis (OPLS-DA) strategy for multiblock Omics data fusion[J].Analytical Chimica Acta,2013,769(6):30-39.
[9] 劉秀霞,趙子豪,孫楊等.谷氨酸棒桿菌內源表達元件的篩選[J].微生物學通報,2016(8):1 671-1 678.
[10] Sun Yang,Guo Wen-wen,Wang Fen,et al.Tranome and multivariable data analysis ofCorynebacteriumglutamicumunder different dissolved oxygen conditions in bioreactors[J].PLoS One,2016,11(12):e0167156.
[11] 張傳志.谷氨酸棒桿菌L-苯丙氨酸合成途徑系統改造及發(fā)酵優(yōu)化[D].無錫:江南大學,2014.
[12] 劉志成,鄭穗平.HPLC法測定谷氨酸發(fā)酵中有機酸含量的方法研究[J].中國釀造,2009;28(3):154-157.
[13] 王芬.不同溶氧條件對谷氨酸棒桿菌EGFP表達過程中代謝影響的研究[D].無錫:江南大學,2016.
[14] MATSUDA Y,ITAYA H,KITAHARA Y,et al.Double mutation of cell wall proteins CspB and PBP1a increases secretion of the antibody Fab fragment fromCorynebacteriumglutamicum[J].Microbial Cell Factories,2014,13(1):56.
[15] KOUASSI NZOUGHET J,BOCCA C,SIMARD G,et al.A non-targeted UHPLC-HRMS metabolomics pipeline for metabolite identification; application to cardiac remote ischemic preconditioning[J].Analytical Chemistry,2017,89(3):2 138-2 146.
[16] SIMITSOPOULOU M,AVILA H,FRANCESCHI F.Ribosomal gene disruption in the extreme thermophile Thermus thermophilus HB8. Generation of a mutant lacking ribosomal protein S17[J].European Journal of Biochemistry,1999,266(2):524-532.
[17] STRIJBIS K,DISTEL B.Intracellular acetyl unit transport in fungal carbon metabolism[J].Eukaryotic Cell,2010,9(12):1 809-1 815.
MVDAanalysisofRNA- seqandmetabolismdataduringtheprocessofrecombinantproteinexpressioninCorynebacteriumglutamicum
SUN Yang, LIU Xiu-xia, DONG Gui-bin, YANG Yan-kun, BAI Zhong-hu*
1(National Engineering Laboratory for Cereal Fermentation Technology, Jiangnan University, Wuxi 214122, China) 2(The Key Laboratory of Industrial Biotechnology, Ministry of Education, School of Biotechnology, Jiangnan University, Wuxi 214122, China) 3(The Key Laboratory of Carbohydrate Chemistry and Biotechnology, Ministry of Education, School of Biotechnology,Jiangnan University, Wuxi 214122, China)
ABSTRACTThe engineering strain expressing EGFP (C.glutamicumEGFP) and wild type strain (C.glutamicumBZH001) were cultivated in parallel in 5 L fermenters under 30% dissolved oxygen concentration.Samplings at 20 h were analyzed through RNA-sequencing (RNA-seq).Extracellular and intracellular metabolites and key enzymes’ activity of both strains were investigated.Multivariate data analysis (MVDA) was used to deal with the RPKM data of RNA-seq and metabolism data.The principal component analysis (PCA) was used to analyze the principal component.And the S-plot of OPLS-DA was used to find the biomarkers ofC.glutamicumBZH001 andC.glutamicumEGFP.Eight critical genes were found,and ATP,glutamic acid,acetate,intracellular glutamic acid,methionine and lactate were identified as the critical metabolites.The metabolism-like anaerobic conditions were as followed: the glycolysis was enhanced,the TCA cycle was shunted,and the contents of acetate and lactate increased.This research laid a foundation for optimizingC.glutamicumhost structure to get high protein expression level.
Key wordsCorynebacteriumglutamicum; multivariate data analysis (MVDA); orthogonal partial least squares-discriiminate Analysis (OPLS-DA); critical genes; RNA-sequencing (RNA-seq)
DOI:10.13995/j.cnki.11-1802/ts.014085
第一作者:博士研究生(白仲虎教授為通訊作者,E-mail:baizhonghu@jiangnan.edu.cn)。
基金項目:國家973 計劃項目(No. 2013CB733602);國家自然科學基金項目(No. 31570034);江蘇省自然科學基金項目(No. BK20150148);中央高?;究蒲袠I(yè)務費專項(No. JUSRP51401A)
收稿日期:2017-02-17, 改回日期:2017-03-09
掃描二維碼推送至手機訪問。
版權聲明:本文由飛速云SEO網絡優(yōu)化推廣發(fā)布,如需轉載請注明出處。