Kozak序列是位于真核生物mRNA 5’端帽子結(jié)構(gòu)后面的一段核酸序列,通常是GCCACCAUGG,它可以與翻譯起始因子結(jié)合而介導含有5’帽子結(jié)構(gòu)的mRNA翻譯起始。對應于原核生物的SD序列。存在于真核生物mRNA的一段序列,其在翻譯的起始中有重要作用。
簡介與原核生物的核糖體結(jié)合位點(RBS)相對應,真核生物mRNA位于起始密碼子AUG兩側(cè)的序列(通常為 ACCACCAUGG)通過與翻譯起始因子的結(jié)合而介導含5'帽子結(jié)構(gòu)的mRNA翻譯起始,這段序列稱為 Kozak序列。其中,AUG之后的第一位堿基G以及之前的第三位堿基A或G對翻譯起始至關重要;此外,AUG上游的15個堿基中一般不含T1。
kozak序列: Kozak consensus sequence, Kozak consensusor Kozak sequence
存在于真核生物mRNA的一段序列,其在翻譯的起始中有重要作用。
核糖體能夠識別mRNA上的這段序列,并把它作為翻譯起始位點。注意這段序列并不是ribosomal binding site (RBS)核糖體結(jié)合位點,而是帽子結(jié)構(gòu)。
真核生物基因中起始密碼子上下游的最佳序列為,-3位為嘌呤堿基;+4位為G,起始密碼子AUG中的A處于+1位。A/GCCAUGG被稱為kozak序列或掃描序列。
KOZAK是一個女科學家,她研究過起始密碼子AUG周邊堿基定點突變后對轉(zhuǎn)錄和翻譯所造成的影響,并總結(jié)出在真核生物中,起始密碼子兩端序列為:—— G/N-C/N-C/N-ANNAUGG——,如GCCACCAUGG、GCCAUGAUGG時,轉(zhuǎn)錄和翻譯效率最高,特別是-3位的A對翻譯效率非常重要。該序列被后人稱為Kozak序列,并被應用于表達載體的構(gòu)建中。
真核 Kozak序列和翻譯起始的掃描模型原核和真核生物mRNA翻譯的重要組成元件是起始密碼子AUG,但是mRNA的編碼區(qū)也存在AUG。為什么第一個AUG能作為起始密碼子而內(nèi)部的AUG不能被起始翻譯?其原因之一是第一個AUG的兩側(cè)翼序列是保守的序列,即AUG上游的-3位是A或G,下游+4位是G。
前面曾介紹大多數(shù)原核mRNA是多順反子,每個多順反子有自己的起始密碼子和核糖體結(jié)合位點;而真核mRNA則多為單順反子。在起始翻譯時,40S nRNA通常面臨著一個任務,即發(fā)現(xiàn)靠近轉(zhuǎn)錄物5′端的起始密碼子。 Marilyn Kozak于1978年首次提出了翻譯起始的第一個AUG規(guī)則和掃描模型。她根據(jù)如下實驗結(jié)果:①真核mRNA翻譯起始并不利用編碼區(qū)內(nèi)部的AUC;②從mRNA5′端起,翻譯并不在一個固定的位點起始2。
規(guī)則所謂Kozak規(guī)則,即第一個AUG側(cè)翼序列的堿基分布所滿足的統(tǒng)計規(guī)律,若將第一個AUG中的堿基A,U,G分別標為1,2,3位,則Kozak規(guī)則可描述如下:
(1)第4位的偏好堿基為G;
(2)AUG的5’端約15bp范圍的側(cè)翼序列內(nèi)不含堿基T;
(3)在-3,-6和-9位置,G是偏好堿基;
(4)除-3,-6和-9位,在整個側(cè)翼序列區(qū),C是偏好堿基。
Kozak規(guī)則是基于已知數(shù)據(jù)的統(tǒng)計結(jié)果,不見得必須全部滿足,一般來說,滿足前兩項即可3。
真核引物設計需在AUG前加上GCCACC。
不論全長還是部分,在做真核表達時,一般都要帶上kozak序列,用部分cDNA時,還要加上AUG。多加一些上游序列對你有利,因為一些上游序列自帶KOZAK序列;或其他促進表達的序列。.有利于引物設計,因為從AUG開始設計引物,不是每個基因都可以的。引物擴增時頭幾個容易錯,在上游序序列就沒關系了。
加Kozak sequence(GCCACC)是用來增強真核基因的翻譯效率的。是最優(yōu)化的AUG環(huán)境,避免ribosome(核糖體)出現(xiàn)leaky scan。
本詞條內(nèi)容貢獻者為:
趙磊 - 副教授 - 中國農(nóng)業(yè)大學