專利名稱:Botryosphaeria Rhodina的多肽的制作方法
技術領域:
本發(fā)明涉及由以保藏號CBS 274.96保藏的棉色二孢(Diplodiagossypina),異名為Botryospaeria rhodina的mRNA中包含的多核苷酸所編碼的功能性多肽。本發(fā)明還涉及編碼這些多肽或有助于它們表達的多核苷酸或這些多核苷酸的構建體,以及制備該多肽的方法。本發(fā)明還涉及包含該多肽的組合物和該多肽的用途。
背景技術:
Botryosphaeria rhodina(Berk.& M.A.Curtis)Arx,(異名Diplodiagossypina Cooke)。目前已發(fā)表的關于這種生物的特征描述的報道非常少;Selbmann等人在2003年報道了Botryosphaeria rhodina的外泌多糖(exopolysaccharide)生產(Selbmann L,Stingele F和Petruccioli M(2003).Exopolysaccharide production by filamentous fungithe example ofBotryosphaeria rhodina.Antonie van Leeuwenhoek,842,pp.135-145)。有單獨的一篇專利涉及使用Botryosphaeria rhodina羥化β-二氫大馬酮作為煙草的增香劑(CH654567-A)。通過發(fā)酵該生物還可以生產茉莉酸(EP1118672-A)。先前已報道了纖維二糖水解酶(cellobiohydrolases)(WO 03/000941-A2)和乳糖酶(WO 01/49878-A)的存在。
在新酶的探尋中,還知道通過對可能的候選物進行特定的酶測定來篩選這樣的新酶。該方法受酶測定的可用性的限制,而且不能鑒定活性尚未知的功能性酶或多肽。
另外,全基因測序(whole genome sequencing)是一種獲得來自特定的微生物的所有基因上的信息的已知方法,例如Fleischmann等人;Wholegenome sequences and assembly of Haemophilus influenzae Rd;Nature 269496-512;(1995)描述的那樣。
工業(yè)上應用的大多數(shù)酶都是被微生物分泌到介質中的酶。但是,微生物的基因組只有百分之幾是編碼分泌蛋白質的。例如,枯草芽孢桿菌(Bacillus subtilis)基因組或其最接近的親緣物種只有4%是編碼分泌蛋白質的。(Van Dijl等人Protein transport pathways in Bacillus subtilisa ge-nome-based road map;于″Basillus subtilis and it′s closest relatives″-Fromgenes to cells;p.337-355;A.L.Sonenshein編;ASM Press 2002)。
基因組測序的缺點之一是所得序列的絕大部分是編碼非分泌蛋白質的。
特別地,對于真核生物例如真菌而言,基因組測序的另一個缺點是基因組的大小比細菌基因組大很多倍,從而通過這種方法來發(fā)現(xiàn)基因要耗費更多的成本和時間。
cDNA隨機測序(表達序列標簽,或稱EST)是另一種可以發(fā)現(xiàn)分泌蛋白質的手段。一般地,就分泌蛋白的鑒定而言EST方法有兩個缺點1)取決于被測序的cDNA文庫所用的誘導條件,只有很少的cDNA,通常為0.5%-15%或甚至1-5%的cDNA編碼分泌蛋白質;2)所有的克隆都來自cDNA池(pool),該cDNA池是從這些在生物中與各個特定的基因成比例地存在的mRNA得來的。
另一種已知的方法是信號捕捉(signal trapping),該方法通過與自身缺少信號的胞外報道基因翻譯融合,來鑒定編碼信號肽的基因包括核苷酸。
發(fā)明概述微生物的基因組包含成千上萬種不同的基因,其中一些編碼多肽,一些編碼RNA。微生物基因組中只有有限數(shù)量的基因編碼這樣的功能性多肽,它們被該微生物分泌到介質中以實現(xiàn)其外部功能。
這些多肽能夠以顯著的量在連續(xù)的過程中生產,而不破壞產生這些多肽的細胞,從這一點看它們在工業(yè)上是令人感興趣的。
本發(fā)明的目的是鑒定和提供由以保藏號CBS 274.96保藏的Botryosphaeria rhodina分泌的、對Botryosphaeria rhodina起功能性作用的多肽,因為這些多肽不僅可用于工業(yè)用途,而且可以以工業(yè)相關的過程/方法和產量生產。
本發(fā)明在第一個方面中提供分離的多肽,其選自(a)包含氨基酸序列的多肽,所述氨基酸序列與由SEQ ID NO2,4,6,8,10,12,14,16,18,20,22,24,26,28,30 32,34,36,38,40和42構成的組的中所包含的成熟多肽具有至少90%的同一性;(b)由核苷酸序列所編碼的多肽,該核苷酸序列在高度嚴緊條件下與多核苷酸探針雜交,所述多核苷酸探針選自(i)核苷酸序列的互補鏈,所述核苷酸序列選自SEQ ID NO1,3,5,7,9,11,13,15,17,19,21,23,25,27,39,31,33,35,37,39和41的編碼成熟多肽的區(qū)域,(ii)核苷酸序列中所包含的cDNA序列的互補鏈,所述核苷酸序列選自SEQ ID NO1,3,5,7,9,11,13,15,17,19,21,23,25,27,39,31,33,35,37,39和41的編碼成熟多肽的區(qū)域,其中所述多肽具有由SEQ ID NO2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40和42構成的組中所包含的相應成熟多肽的功能。
本發(fā)明的另一個方面涉及分離的酶,其選自(a)包含氨基酸序列的酶,所述氨基酸序列與選自以CBS保藏號274.96保藏的Botryosphaeria rhodina菌株所分泌的木聚糖酶、絲氨酸酯酶、過氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、內切阿拉伯糖酶(endo-arabinase)和胃蛋白酶肽酶的成熟酶的氨基酸序列具有至少90%的同一性。
(b)由核苷酸序列編碼的多肽,該核苷酸序列在高度嚴緊條件下與選自下列的多核苷酸探針雜交(i)核苷酸序列的互補鏈,所述核苷酸序列包含于以CBS保藏號274.96保藏的Botryosphaeria rhodina菌株中,并編碼成熟酶,該成熟酶選自該菌株所分泌的木聚糖酶、絲氨酸酯酶、過氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、B-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶,(ii)核苷酸序列所包含的cDNA序列的互補鏈,所述核苷酸序列包含于以CBS保藏號274.96保藏的Botryosphaeria rhodina菌株中,并編碼成熟酶,該成熟酶選自該菌株所分泌的木聚糖酶、絲氨酸酯酶、過氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶;其中所述酶具有選自木聚糖酶、絲氨酸酯酶、過氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶的功能。
本發(fā)明的另外的方面提供編碼本發(fā)明多肽的多核苷酸;包含編碼該多肽的多核苷酸的核苷酸構建體,其中所述多核苷酸與一種或多種指導該多肽在宿主細胞中生產的調控序列可操作地連接;包含本發(fā)明的核苷酸構建體的重組表達載體,和包含本發(fā)明的核苷酸構建體的重組宿主細胞。
本發(fā)明的另一個方面提供制備本發(fā)明的多肽的方法,包括(a)培養(yǎng)包含編碼本發(fā)明多肽的核苷酸序列的株系以產生所述多肽,其中所述株系能夠表達并分泌該多肽;及(b)回收該多肽。
本發(fā)明的另外的方面提供包含本發(fā)明的多肽的組合物,以及制備這樣的組合物的方法,包括將本發(fā)明的多肽與賦形劑混合。
本發(fā)明的另外的方面提供本發(fā)明的多肽或包含所述多肽的組合物在多種應用中的用途。
序列表本發(fā)明包含序列表形式的信息,其附于本申請中并在連同本申請的數(shù)據(jù)載體上提交。數(shù)據(jù)載體的內容全部通過引用并入本文。選自SEQ ID NO1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39和41的序列的編碼成熟多肽的區(qū)域,分別編碼選自SEQ ID NO2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42的序列的成熟多肽。因此SEQ ID NO1的編碼成熟多肽的區(qū)域編碼SEQ ID NO2中包含的成熟多肽序列,SEQ ID NO3的編碼成熟多肽的區(qū)域編碼SEQ ID NO4中包含的成熟多肽序列,依此類推。
沒有附圖。
發(fā)明詳述定義如以下所用的,術語“ADNA組”指由SEQ ID NO1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39和41組成的核苷酸序列的組。因此,當提到包含于或選自由“ADNA組”組成的序列組(或包含于或選自“ADNA組”)的核苷酸序列時,是指該序列包含于或選自由SEQ ID NO1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39和41組成的核苷酸序列的組。
如以下所用的,術語“EDNA組”指由SEQ ID NO1,3,5,7,9,11,13,15,17,33,35,37,39和41組成的核苷酸序列的組。因此,當提到包含于或選自由“EDNA組”組成的序列組(或包含于或選自“EDNA組”)的核苷酸序列時,是指該序列包含于或選自由SEQ ID NO1,3,5,7,9,11,13,15,17,33,35,37,39和41組成的核苷酸序列的組。
類似地,如以下所用的,術語“B多肽組”指由SEQ ID NO2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40和42組成的多肽序列的組。因此,當提到包含于或選自由“B多肽組”組成的序列組(或包含于或選自“B多肽組”)的多肽序列時,是指該序列包含于或選自由SEQ ID NO2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40和42組成的多肽序列的組。
類似地,如以下所用的,術語“D多肽組”指由SEQ ID NO2,4,6,8,10,12,14,16,18,34,36,38,40和42組成的多肽序列的組。因此,當提到包含于或選自由“D多肽組”組成的序列組(或包含于或選自“D多肽組”)的多肽序列時,是指該序列包含于或選自由SEQ ID NO2,4,6,8,10,12,14,16,18,34,36,38,40和42組成的多肽序列的組。
本文中使用的術語“同一性”理解為兩條氨基酸序列或兩條核苷酸序列之間的同源性。對于本發(fā)明而言,同一性程度是使用Vector NTI程序7.1版(Informax inc.,7600 Wisconsin Avenue,Suite#1100,Bethesda,MD 20814,USA)的AlignX確定的。氨基酸比對使用Clustal W算法(Thompson,J.D.,Higgins,D.G.和Gibson,T.J.(1994)CLUSTAL Wimproving the sensitivity ofprogressive multiple sequence alignment through sequence weighting,positions-specific gap penalties and weight matrix choice.Nucleic Acids Research,224673-4680)來生成。還使用下面的參數(shù)缺口生成罰分(gap openingpenalty)為10,缺口延伸罰分(gap extension penalty)為0.05,缺口分離罰分范圍(gap separation penalty range)為8。配對比對(pairwise alignment)參數(shù)為Ktuple=1,缺口罰分(gap penalty)=3,缺口長度生成罰分(gap lengthopening penalty)=10,缺口延伸罰分=0.1,窗口大小(window size)=5,對角線(diagonals)=5。兩條核苷酸序列之間同一性程度的確定也是使用如上所述的相同算法和軟件包,例如用下列的設定缺口罰分為10,缺口長度罰分為10。配對比對參數(shù)為Ktuple=3,缺口罰分=3,窗口=20。
在本發(fā)明的范圍內,術語“功能性多肽”(functional polypeptide)是指這樣的多肽,其可被細胞表達和分泌,并且構成能夠根據(jù)其按照細胞設計應實現(xiàn)的功能來運作的操作單元??蛇x地,該多肽要具備預定的功能可能需要輔因子(co-factors)。功能性多肽的一個例子是具有催化活性的多肽或酶,其幫助細胞催化細胞周圍環(huán)境中的反應。另外的例子有充當信號物質的多肽。另外的例子還有行使針對環(huán)境參數(shù)(細胞周圍環(huán)境中的化學物質)的傳感物(受體)功能的多肽,或具有抗別的生物的活性的多肽(抗微生物(多)肽),或對細胞的結構完整性作貢獻的多肽。
在本文中,關于氨基酸序列或多肽的部分使用的術語“成熟區(qū)域”(mature region)是指氨基酸序列或多肽中作為成熟的功能性多肽的部分(portion)、區(qū)域(region)、域(domain)或區(qū)段(section)。
本文中使用的術語“編碼成熟多肽的核苷酸序列”是指從編碼成熟多肽的第一個氨基酸的三聯(lián)體算起,直到編碼成熟多肽的最后一個氨基酸的三聯(lián)體的區(qū)域。
在本文中,關于本發(fā)明的特定酶使用的術語“GH”,例如“GH10”,是由B.Henrissat建立的糖基水解酶(glycosyl hydrolase enzymes)的家族分類系統(tǒng)。GH后面的數(shù)字指不同的家族。該分類系統(tǒng)對本領域技術人員而言是熟知的。見Henrissat B.,A classification of glycosyl hydrolases based onamino-acid sequence similarities,Biochem.J.280309-316(1991);Henrissat B.,Bairoch A,New families in the classification of glycosyl hydrolases based onamino acid sequence similarities,Biochem.J.293781-788(1993);Henrissat B.,Bairoch A.,Updating the sequence-based classification of glycosyl hydrolases,Biochem.J.316695-696(1996);Davies G.,Henrissat B.,Structures andmechanisms of glycosyl hydrolases,Structure 3853-859(1995)。
本發(fā)明的多肽本發(fā)明的多肽都是被Botryosphaeria rhodina CBS 274.96分泌,以為該特定細胞執(zhí)行功能的多肽。
在Botryosphaeria rhodina CBS 274.96基因組中有數(shù)千個可能的基因,其中,該基因組的多核苷酸編碼21種B多肽組中所包括的分泌的功能性成熟多肽,這些多肽已被鑒定為功能性的,并被所選的宿主細胞翻譯成功能性多肽并分泌。
因此,Botryosphaeria rhodina CBS 274.96表達并分泌B多肽組中所包括的功能性成熟多肽,而且在該特定菌株的基因組中,ADNA組的序列的編碼成熟多肽的區(qū)域,是編碼B多肽組序列中所包括的成熟多肽的基因。另外在特定的實施方案中,當培養(yǎng)用包含ADNA組的序列的編碼成熟多肽的區(qū)域的多核苷酸轉化的大腸桿菌(E.coli)宿主時,所有編碼B多肽組中所包括的成熟多肽的基因都可以表達,而且它們相應的成熟多肽可以被分泌。通過比較這21個多肽序列的序列與已知序列的同源性或同一性,標定了這些多肽的具體功能。這21種分泌的功能性多肽中的至少14種被確定是酶和/或類似酶。
因此,本發(fā)明提供選自下列的分離多肽(a)具有氨基酸序列的多肽所述氨基酸序列與選自B多肽組中所包括的成熟多肽的氨基酸序列具有至少90%的同一性;(b)由核苷酸序列編碼的多肽所述核苷酸序列在高度嚴緊條件下與選自下列的多核苷酸探針雜交(i)核苷酸序列的互補鏈,所述核苷酸序列選自ADNA組序列的編碼成熟多肽的區(qū)域;(ii)核苷酸序列所包含的cDNA序列的互補鏈,所述核苷酸序列選自ADNA組序列的編碼成熟多肽的區(qū)域;其中該多肽顯示相應的B多肽組的成熟多肽序列的功能。
在一個具體的實施方案中,本發(fā)明的多肽選自由本發(fā)明人分離并以CBS保藏登錄號(accession No.)274.96保藏的Botryosphaeria rhodina所分泌的酶,即由木聚糖酶、絲氨酸酯酶、過氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶組成的酶組。
本發(fā)明還提供選自下列的分離的酶
(a)包含這樣的氨基酸序列的酶,所述氨基酸序列與選自以CBS保藏號274.96保藏的Botryosphaeria rhodina菌株所分泌的木聚糖酶、絲氨酸酯酶、過氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶組成的組中的成熟酶的氨基酸序列具有至少90%的同一性。
(b)由核苷酸序列編碼的多肽,該核苷酸序列在高度嚴緊條件下與選自下列的多核苷酸探針雜交(i)核苷酸序列的互補鏈,所述核苷酸序列包含于以CBS保藏號274.96保藏的Botryosphaeria rhodina菌株中,并編碼成熟酶,該成熟酶選自該菌株所分泌的木聚糖酶、絲氨酸酯酶、過氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶,(ii)核苷酸序列所含cDNA序列的互補鏈,所述核苷酸序列包含于以CBS保藏號274.96保藏的Botryosphaeria rhodina菌株中,并編碼成熟酶,該成熟酶選自該菌株所分泌的木聚糖酶、絲氨酸酯酶、過氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶;其中所述酶具有選自木聚糖酶、絲氨酸酯酶、過氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶的功能。
在一個具體的實施方案中,所述酶是選自下列的分離的酶(a)具有與下述氨基酸序列具有至少90%的同一性的氨基酸序列的酶,所述氨基酸序列選自D多肽組的序列中所包含的成熟酶;(b)由核苷酸序列編碼的酶,該核苷酸序列在高度嚴緊條件下與多核苷酸探針雜交,所述多核苷酸探針選自(i)核苷酸序列的互補鏈,所述核苷酸序列選自EDNA組序列的編碼成熟酶的區(qū)域;(ii)核苷酸序列所包含的cDNA序列的互補鏈,所述核苷酸序列選自EDNA組序列的編碼成熟酶的區(qū)域;其中該酶顯示相應的D多肽組的成熟酶的功能。
本發(fā)明的多肽是分離多肽,優(yōu)選地,本發(fā)明的多肽的制劑包含最多90重量%的可能與之天然地相伴隨的其他多肽物質(更低百分比的其他多肽物質是優(yōu)選的,例如最多80重量%,最多60重量%,最多50重量%,最多40重量%,最多30重量%,最多20重量%,最多10重量%,最多9重量%,最多8重量%,最多7重量%,最多6重量%,最多5重量%,最多4重量%,最多3重量%,最多2重量%,最多1重量%,及最多重量%)。因此,優(yōu)選本發(fā)明的分離多肽為92%純,即本發(fā)明的多肽構成制劑中存在的所有多肽物質的至少92重量%,且優(yōu)選更高的重量百分比,例如至少94%純,至少95%純,至少96%純,至少96%純,至少97%純,至少98%純,至少99%純,及至多99.5%純。特別地本發(fā)明的多肽優(yōu)選是基本上純的形式。具體而言,優(yōu)選地,所述多肽是“基本上(essentially)純的形式”,即多肽制備物基本上不含與該多肽天然相伴隨的其它多肽物質。這可通過例如采用熟知的重組方法制備多肽來實現(xiàn)。
本發(fā)明的多肽可以是合成制造的,天然存在的,或其組合。在一個具體的實施方案中,本發(fā)明的多肽可以從微生物,例如原核細胞,古細菌細胞或真核細胞得到。這些細胞還可以是已通過基因工程改變的。
在一個具體的實施方案中,本發(fā)明的多肽是這樣的酶,其在約10℃到約80℃,具體是在約20℃到約60℃的溫度下顯示最佳酶活性。
在一個具體的實施方案中,本發(fā)明的多肽是這樣的酶,其在高至100℃,具體是高至80℃,更具體是高至60℃的溫度下是功能上穩(wěn)定的。
在一個具體的實施方案中,本發(fā)明的多肽是這樣的酶,其顯示選自B多肽組所包括的成熟酶的酶的至少20%,具體是至少40%,例如至少50%,具體是至少60%,例如至少70%,更具體是至少80%,例如至少90%,更具體是至少95%,例如至少100%的酶活性。
在一個具體的實施方案中,本發(fā)明的多肽包括,含有,或由這樣的氨基酸序列組成該氨基酸序列與選自B多肽組所包括的成熟酶的多肽序列具有至少90%的同一性,特別是至少95%,例如至少96%,例如至少97%,更具體為至少98%,例如至少99%或甚至100%的同一性。
在一個具體的實施方案中,本發(fā)明的多肽包括,含有,或由這樣的氨基酸序列組成該氨基酸序列與選自B多肽組所包括的成熟酶的多肽序列具有至少50%的同一性,具體是至少60%,具體是至少65%,具體是至少70%,具體是至少75%,具體是至少80%或更具體是至少85%的同一性。
在一個具體的實施方案中,本發(fā)明的多肽的氨基酸序列與B多肽組所包括的成熟酶具有最多10個氨基酸(例如10個氨基酸),具體是最多5個氨基酸(例如5個氨基酸),例如最多4個氨基酸(例如4個氨基酸),例如最多3個氨基酸(例如3個氨基酸),具體是最多2個氨基酸(例如2個氨基酸),例如1個氨基酸的不同。
本發(fā)明的多肽可以是從天然來源,例如Botryosphaeria rhodina CBS274.96株或其他野生型株分離的野生型多肽,但本發(fā)明也涵蓋這樣的人工變體,其中本發(fā)明的多肽被突變,例如通過在保持該多肽的功能和/或其他性質的同時,對所述多肽添加,置換和/或缺失一個或多個氨基酸。
因此,本發(fā)明的多肽可以是人工變體,其中,包含由B多肽組所包括的成熟酶,或由其所組成的氨基酸序列至少發(fā)生了一個氨基酸的置換,缺失和/或插入。
本發(fā)明的多肽還包括本文所述的氨基酸序列的功能性片段和編碼本文所述的氨基酸序列的功能性片段的核酸,包括如本文所述的以CBS保藏號274.96保藏的Botryosphaeria rhodina株分泌的成熟酶的片段,包括從所述以CBS保藏號274.96保藏的Botryosphaeria rhodina株分泌的木聚糖酶、絲氨酸酯酶、過氧化物酶、GH61A多肽、GH61B多肽、GH61C多肽、GH61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶中選擇的酶的片段。
人工變體可以使用本領域已知的標準技術構建,通常隨后進行篩選和/或性質鑒定。標準技術包括經典的誘變,例如通過對細胞進行紫外照射或用化學誘變劑處理細胞,如Gerhardt等人(1994)所述的;體內基因改組(shuffling),如WO 97/07205所述的,體外改組,如Stemmer,(1994)或WO 95/17413所述的,隨機誘變,如Eisenstadt E.等人.(1994)所述的;PCR技術,例如Poulsen等人(1991)所述的;家族改組(family shuffling),如J.E.Ness等人,Nature Biotechnology,vol.17,pp.893-896(1999)所述的;定點誘變,如Sambrook等人(1989),Molecular Cloning,A Laboratory Manual,ColdSpring Harbor,NY所述的。關于核苷酸置換的一般性描述可見Ford等人,1991,Protein Expression and Purification 2,p.95-107。
這樣的標準基因工程方法還可以用來從編碼一種或多種本發(fā)明的親本酶(parent enzyme)的基因制備多樣性的變體核苷酸序列文庫,在合適的宿主細胞中表達這些酶變體,并選擇合適的變體。多樣性的文庫可以用多種本領域已知的方法建立(Reetz MT;Jaeger KE,于Biocatalysis-fromDiscovery to Application,F(xiàn)essner WD編,Vol.200,pp.31-57(1999);Stemmer,Nature,vol.370,p.389-391,1994;Zhao和Arnold,Proc.Natl.Acad.ScL,USA,vol.94,pp.7997-8000,1997;或Yano等人,Proc.Natl.Acad.ScL,USA,vol.95,pp 5511-5515,1998)。
在本發(fā)明的一個優(yōu)選的實施方案中,(人工變體和野生型酶中的)氨基酸的改變從性質上說是輕微的,即其是不顯著影響蛋白質的折疊和/或活性的保守性的氨基酸置換;小的缺失,通常為1到大約30個氨基酸;小的氨基或羧基末端延伸,例如氨基末端的甲硫氨酸殘基;長達大約20-25個殘基的小接頭肽;或通過改變凈電荷或其他功能而有助于純化的小段延伸(small extension),諸如多組氨酸序列段(poly-histidine tract)、抗原性表位(antigenic epitope)、或結合域(binding domain)。
下面各組中是保守性置換的例子堿性氨基酸(精氨酸、賴氨酸和組氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、極性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、異亮氨酸、纈氨酸和甲硫氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、和小氨基酸(甘氨酸、丙氨酸、絲氨酸和蘇氨酸)。一般情況下不改變或損害蛋白質功能的氨基酸置換是本領域已知的,例如H.Neurath和R.L.Hill在The Proteins中所述(1979,Academic Press,New York)。最常發(fā)生的取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly,以及上述反向的置換。
在一個具體的實施方案中,所述氨基酸改變具有這樣的性質,使得多肽的物理化學特性被改變。例如,所進行的氨基酸改變可提高酶的熱穩(wěn)定性、改變底物特異性、改變最佳pH等等。
具體地,在本發(fā)明的多肽,特別是選自B多肽組中所包含的成熟多肽的那些多肽中,產生人工變體的所述置換、缺失和/或插入的數(shù)目最多為10,如最多9,例如最多8,更優(yōu)選最多7,例如最多6,例如最多5,最優(yōu)選最多4,例如最多3,如最多2,特別是最多1。
在一個具體的實施方案中所述人工變體是這樣的變體,其在包括人的動物中,與親本酶相比,具有改變的、優(yōu)選減少的免疫原性,特別是變應原性。術語“免疫原性”在本文中應理解為人工變體當被施用于動物,包括通過靜脈內、皮膚、皮下、口服和氣管內施用于動物時,引起改變的、特別是減少的免疫反應的能力。術語“免疫反應”在本文中指該人工變體的施用造成該動物體內免疫球蛋白例如IgE、IgG和IgM的水平的改變,或該動物體內細胞因子水平的改變。定位(mapping)蛋白質的免疫原性/抗原性表位的方法、制備具有改變的免疫原性的抗體及測量免疫反應的方法在本領域是公知的,且在例如WO 92/10755、WO 00/26230、WO 00/26354和WO 01/31989中有描述。本文中術語“變應原性”理解為該人工變體造成動物中IgE生產的改變特別是減少的能力,以及結合來自該動物的IgE的能力。特別地,由于對動物氣管內使用所述多肽變體而產生的變應原性(又稱呼吸性變應原性(respiratory allergenicity))是本文特別感興趣的。
在另一個實施方案中,本發(fā)明的多肽是由這樣的核苷酸序列編碼的多肽,該核苷酸序列在至少高度嚴緊的條件,特別是極高度嚴緊條件下,與選自下列的多核苷酸探針雜交(i)核苷酸序列的互補鏈,所述核苷酸序列選自ADNA組序列的編碼成熟多肽的區(qū)域;(ii)核苷酸序列中所含的cDNA序列的互補鏈,所述核苷酸序列選自ADNA組序列的編碼成熟多肽的區(qū)域;(iii)(i)或(ii)的編碼分泌多肽的片段,所述分泌多肽具有B多肽組中所包含的相應成熟多肽的功能。
(J.Sambrook,E.F.Fritsch,和T.Maniatus,1989,Molecular Cloning,ALaboratory Manual,第二版,Cold Spring Harbor,New York)。
特別地,本發(fā)明的多肽被包含這樣的核苷酸序列的多核苷酸所編碼,所述核苷酸序列選自ADNA組序列的編碼成熟多肽的區(qū)域,或者與其由于遺傳密碼的簡并性而相異的序列。更具體地,本發(fā)明的多肽被由這樣的核苷酸序列組成的多核苷酸所編碼,所述核苷酸序列選自ADNA組序列的編碼成熟多肽的區(qū)域,或者與其由于遺傳密碼的簡并性而相異的序列。
ADNA組的序列的編碼成熟多肽的區(qū)域的核苷酸序列或其子序列,以及B多肽組中包含的成熟多肽的氨基酸序列或其片段,可以用來設計多核苷酸探針,以根據(jù)本領域熟知的方法,從不同屬或種的株系中鑒定和克隆編碼本發(fā)明的酶的DNA。特別地,這樣的探針可以用來根據(jù)標準的Southern印跡程序與目標屬或種的基因組或cDNA雜交,以鑒定和分離其中的相應基因。這樣的探針可以顯著地短于整個序列,但長度應該為至少15,優(yōu)選至少25,更優(yōu)選至少35個核苷酸,例如長度為至少70個核苷酸。但是優(yōu)選該多核苷酸探針為至少100個核苷酸長。例如,該多核苷酸探針可為至少200個核苷酸長,至少300個核苷酸長,至少400個核苷酸長,或至少500個核苷酸長。還可以用更長的探針,例如至少600個核苷酸長,至少700個核苷酸長,至少800個核苷酸長,或至少900個核苷酸長的多核苷酸探針。DNA和RNA探針都可以使用。探針通常進行標記來檢測相應的基因(例如用32P、3H、35S、生物素、或抗生物素蛋白)。
因此,可從這樣的其它生物體制備的基因組DNA或cDNA文庫中篩選與上述探針發(fā)生雜交、且編碼本發(fā)明的酶的DNA。來自這樣的其它生物體的基因組或其它DNA可通過瓊脂糖或聚丙烯酰胺凝膠電泳或其它分離技術來分離??蓪碜晕膸斓腄NA或分離的DNA轉移到并固定在硝酸纖維素或其它適宜的載體材料上。為了鑒定與選自ADNA組序列中編碼成熟多肽的區(qū)域的核苷酸具有所需的同源性和/或同一性,或與之同源和/或同一的克隆或DNA,在Southern印跡中使用帶有固定的DNA的載體材料。
對本發(fā)明而言,“雜交”意味著所述核苷酸序列與標記的多核苷酸探針雜交,所述探針在高度到極高度嚴緊條件下與選自ADNA組的序列編碼成熟多肽的區(qū)域的核苷酸序列雜交。在這些條件下與多核苷酸探針雜交的分子可以用X射線膠片或本領域已知的任何方法來檢測。本文中無論何時使用術語“多核苷酸探針”時,應理解這樣的探針含有至少15個核苷酸。
在一個感興趣的實施方案中,所述多核苷酸探針是選自ADNA組的序列的編碼成熟多肽的區(qū)域的核苷酸序列的互補鏈。
在另一個感興趣的實施方案中,所述多核苷酸探針是編碼選自B多肽組的酶的核苷酸序列的互補鏈。在另一個感興趣的實施方案中,所述多核苷酸探針是核苷酸序列的成熟多肽編碼區(qū)域的互補鏈,所述核苷酸序列選自ADNA組的序列的編碼成熟多肽的區(qū)域。
對于長度為至少100個核苷酸的長探針來說,高度至極高度的嚴緊條件定義為遵循標準Southern印跡程序,于42℃,在5X SSPE、5X Darhardt’s溶液、1.0%SDS、100μg/ml經剪切且經變性的鮭精DNA中進行預雜交和雜交。優(yōu)選地,所述至少100個核苷酸的長探針不含有多于1000個核苷酸。對于長度為至少100個核苷酸的長探針來說,最后在60℃下用0.1xSSC、0.1%SDS(高嚴緊度)洗滌3次,每次15分鐘;特別是在68℃下用0.1xSSC、0.1%SDS(極高嚴緊度)洗滌3次,每次15分鐘。
雖然不是特別優(yōu)選的,還考慮可以使用更短的探針,例如長為大約15到99個核苷酸的探針,例如長為約15到約70個核苷酸。對于這樣的短探針,嚴緊條件定義為遵循標準Southern印跡程序,在比根據(jù)Bolton和McCarthy(1962,Proceedings of the National Academy of Sciences USA 481390)的計算方法算得的Tm值低大約5℃至大約10℃的溫度下,在0.9MNaCl、0.09M Tris-HCl pH7.6、6mM EDTA、0.5%NP-40、1X Denhardt’s溶液、1mM焦磷酸鈉、1mM磷酸二氫鈉(sodium monobasic phosphate)、0.1mM ATP、和0.2mg/ml酵母RNA中進行預雜交、雜交和雜交后清洗。
對于長度為大約15個核苷酸至大約99個核苷酸的短探針來說,在比Tm計算值低大約5℃至10℃的溫度下,將載體材料用6XSCC加0.1%SDS洗滌1次15分鐘,然后用6XSSC洗滌兩次,每次15分鐘。
SEQ ID NO2木聚糖酶GH10在一個特定的實施方案中,本發(fā)明的多肽是包含或由這樣的氨基酸序列組成的GH10木聚糖酶,所述氨基酸序列與可以從Botryosphaeria rhodina,具體是以保藏號CBS 274.96保藏的Botryosphaeria rhodina菌株得到的GH 10木聚糖酶,更具體是SEQ ID NO2中包含的成熟GH10木聚糖酶具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述成熟GH10木聚糖酶包含或由SEQ ID NO2第1到291位的序列組成。在本文中,GH10木聚糖酶定義為屬于EC 3.2.1.8酶活類群的酶。該類群內切水解(endohydrolyse)木聚糖中的1,4-β-D-木糖苷鍵。糖苷水解酶家族10(GH10)還包括具有另外兩種已知活性的酶;內切-1,3-β-木聚糖酶(EC3.2.1.32);纖維二糖水解酶(EC3.2.1.91)。
SEQ ID NO4木聚糖酶GH11在一個特定的實施方案中,本發(fā)明的多肽是包含或由這樣的氨基酸序列組成的GH11木聚糖酶,所述氨基酸序列與可以從Botryosphaeria rhodina,具體是以保藏號CBS 274.96保藏的Botryosphaeria rhodina菌株得到的GH11木聚糖酶,更具體是SEQ ID NO4中包含的成熟GH11木聚糖酶具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述成熟GH11木聚糖酶包含或由SEQ ID NO4第1到202位的序列組成。在本文中,GH11木聚糖酶定義為屬于EC 3.2.1.8酶活類群的酶。該類群內切水解木聚糖中的1,4-β-D-木糖苷鍵。糖苷水解酶家族11(GH11)包括只具有一種已知活性的酶;木聚糖酶(EC3.2.1.8)。
SEQ ID NO6絲氨酸酯酶在一個特定的實施方案中,本發(fā)明的多肽是絲氨酸酯酶,具體是包含或由這樣的氨基酸序列組成的角質酶或脂肪酶或羧基酯酶(carboxyesterase)所述氨基酸序列與可以從Botryosphaeria rhodina,具體是以保藏號CBS 274.96保藏的Botryosphaeria rhodina菌株得到的絲氨酸酯酶,更具體是SEQ ID NO6中包含的成熟絲氨酸酯酶具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述成熟絲氨酸酯酶包含或由SEQ ID NO6第1到352位的序列組成。在本文中,絲氨酸酯酶定義為能夠水解溶液中的可溶性酯類(非膠束(micelle)形式的酯類)的酶。更具體地,絲氨酸酯酶是充當角質酶(EC 3.1.1.50)或脂肪酶(EC.3.1.1.3)或羧基酯酶,能夠水解蠟-脂類(wax-esters)、角質、三?;?tracyl fats),油和/或脂肪酸鏈。具體地,所述絲氨酸酯酶含有經典的絲氨酸水解酶Ser、His、Asp三聯(lián)體,例如三酰基脂肪酶/角質酶。
SEQ ID NO8假絲酵母B型脂肪酶在一個特定的實施方案中,本發(fā)明的多肽是假絲酵母(candida)B型脂肪酶(EC 3.1.1.3),其包含或由這樣的氨基酸序列組成所述氨基酸序列與可以從Botryosphaeria rhodina,具體是以保藏號CBS 274.96保藏的Botryosphaeria rhodina菌株得到的假絲酵母B型脂肪酶,更具體是SEQ IDNO8中包含的假絲酵母B型脂肪酶具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述成熟假絲酵母B型脂肪酶包含或由SEQ ID NO8第1到431位的序列組成。在本文中,假絲酵母B型脂肪酶(Candida B type lipase)定義為能夠將甘油三酸酯(triglycerides)水解為二?;视王?diacyl glycerides)和脂肪酸陰離子,特別是將三?;视退鉃槎;视秃椭舅彡庪x子的酶。
SEQ ID NO10過氧化物酶在一個特定的實施方案中,本發(fā)明的多肽是過氧化物酶,其包含或由這樣的氨基酸序列組成所述氨基酸序列與可以從Botryosphaeria rhodina,具體是以保藏號CBS 274.96保藏的Botryosphaeria rhodina菌株得到的過氧化物酶,更具體是SEQ ID NO10中包含的過氧化物酶具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述成熟過氧化物酶包含或由SEQ ID NO10第1到185位的序列組成。在本文中,過氧化物酶定義為屬于能夠催化氧化-還原反應的酶類的酶。因此,它們被歸類為氧化還原酶。它們的正式EC號為1.11.1。過氧化物酶將H2O2還原為水,而氧化多種底物。因此,過氧化物酶是利用H2O2作為電子受體來催化不同氧化反應的氧化還原酶。
SEQ ID NO12 GH61A 多肽在一個特定的實施方案中,本發(fā)明的多肽是GH61A多肽,其包含或由這樣的氨基酸序列組成所述氨基酸序列與可以從Botryosphaeria rhodina,具體是以保藏號CBS 274.96保藏的Botryosphaeria rhodina菌株得到的GH61A多肽,更具體是SEQ ID NO8中包含的GH61A多肽具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述成熟GH61A多肽包含或由SEQ ID NO12第1到218位的序列組成。在本文中,GH61A多肽定義為提供選自下列的一組或多組效應的分泌多肽或蛋白質1)當與纖維素酶或纖維素酶混合物聯(lián)合使用時,促進纖維質(cellulosic)材料的降解。
2)增加酶的溶解性。
3)增加酶的穩(wěn)定性。
4)減少酶抑制。
SEQ ID NO14 GH61B多肽在一個特定的實施方案中,本發(fā)明的多肽是GH61B多肽,其包含或由這樣的氨基酸序列組成所述氨基酸序列與可以從Botryosphaeria rhodina,具體是以保藏號CBS 274.96保藏的Botryosphaeria rhodina菌株得到的GH61B多肽,更具體是SEQ ID NO14中包含的GH61B多肽具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述成熟GH61B多肽包含或由SEQ ID NO14第1到249位的序列組成。在本文中,GH61B多肽定義為提供選自下列的一組或多組效應的分泌多肽或蛋白質1)當與纖維素酶或纖維素酶混合物聯(lián)合使用時,促進纖維質材料的降解。
2)增加酶的溶解性。
3)增加酶的穩(wěn)定性。
SEQ ID NO16 GH61C多肽在一個特定的實施方案中,本發(fā)明的多肽是GH61C多肽,其包含或由這樣的氨基酸序列組成所述氨基酸序列與可以從Botryosphaeria rhodina,具體是以保藏號CBS 274.96保藏的Botryosphaeria rhodina菌株得到的GH61C多肽,更具體是SEQ ID NO16中包含的GH61C多肽具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述成熟GH61C多肽包含或由SEQ ID NO16第1到255位的序列組成。在本文中,GH61C多肽定義為提供選自下列的一組或多組效應的分泌多肽或蛋白質1)當與纖維素酶或纖維素酶混合物聯(lián)合使用時,促進纖維質材料的降解。
2)增加酶的溶解性。
3)增加酶的穩(wěn)定性。
SEQ ID NO18 GH61D多肽在一個特定的實施方案中,本發(fā)明的多肽是GH61D多肽,其包含或由這樣的氨基酸序列組成所述氨基酸序列與可以從Botryosphaeria rhodina,具體是以保藏號CBS 274.96保藏的Botryosphaeria rhodina菌株得到的GH61D多肽,更具體是SEQ ID NO18中包含的GH61D多肽具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述成熟GH61D多肽包含或由SEQ ID NO18第1到205位的序列組成。在本文中,GH61D多肽定義為提供選自下列的一組或多組效應的分泌多肽或蛋白質1)當與纖維素酶或纖維素酶混合物聯(lián)合使用時,促進纖維質材料的降解。
2)增加酶的溶解性。
3)增加酶的穩(wěn)定性。
SEQ ID NO20功能性多肽在一個特定的實施方案中,本發(fā)明的多肽是功能性多肽,其包含或由這樣的氨基酸序列組成所述氨基酸序列與SEQ ID NO20具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。特別是與SEQ IDNO20中包含的成熟功能性多肽。更具體地,所述成熟功能性多肽包含或由SEQ ID NO20第1到243位的序列組成。
SEQ ID NO22功能性多肽在一個特定的實施方案中,本發(fā)明的多肽是功能性多肽,其包含或由這樣的氨基酸序列組成所述氨基酸序列與SEQ ID NO22具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。特別是與SEQ IDNO22中包含的成熟功能性多肽。更具體地,所述成熟功能性多肽包含或由SEQ ID NO22第1到415位的序列組成。
SEQ ID NO24功能性多肽在一個特定的實施方案中,本發(fā)明的多肽是功能性多肽,其包含或由這樣的氨基酸序列組成所述氨基酸序列與SEQ ID NO24具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。特別是與SEQ IDNO24中包含的成熟功能性多肽。更具體地,所述成熟功能性多肽包含或由SEQ ID NO24第1到377位的序列組成。
SEQ ID NO26功能性多肽在一個特定的實施方案中,本發(fā)明的多肽是功能性多肽,其包含或由這樣的氨基酸序列組成所述氨基酸序列與SEQ ID NO26具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。特別是與SEQ IDNO26中包含的成熟功能性多肽。更具體地,所述成熟功能性多肽包含或由SEQ ID NO26第1到259位的序列組成。
SEQ ID NO28功能性多肽在一個特定的實施方案中,本發(fā)明的多肽是功能性多肽,其包含或由這樣的氨基酸序列組成所述氨基酸序列與SEQ ID NO28具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。特別是與SEQ IDNO28中包含的成熟功能性多肽。更具體地,所述成熟功能性多肽包含或由SEQ ID NO28第1到248位的序列組成。
SEQ ID NO30功能性多肽在一個特定的實施方案中,本發(fā)明的多肽是功能性多肽,其包含或由這樣的氨基酸序列組成所述氨基酸序列與SEQ ID NO30具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。特別是與SEQ IDNO30中包含的成熟功能性多肽。更具體地,所述成熟功能性多肽包含或由SEQ ID NO30第1到149位的序列組成。
SEQ ID NO32功能性多肽在一個特定的實施方案中,本發(fā)明的多肽是功能性多肽,其包含或由這樣的氨基酸序列組成所述氨基酸序列與SEQ ID NO32具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。特別是與SEQ IDNO32中包含的成熟功能性多肽。更具體地,所述成熟功能性多肽包含或由SEQ ID NO32第1到202位的序列組成。
SEQ ID NO34 β-葡糖苷酶在一個特定的實施方案中,本發(fā)明的多肽是β-葡糖苷酶,其包含或由這樣的氨基酸序列組成所述氨基酸序列與可以從Botryosphaeria rhodina,具體是以保藏號CBS 274.96保藏的Botryosphaeria rhodina菌株得到的β-葡糖苷酶,更具體是SEQ ID NO34中包含的β-葡糖苷酶具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述β-葡糖苷酶包含或由SEQ ID NO34第1到603位的序列組成。在本文中,β-葡糖苷酶定義為這樣的β-D-葡萄糖苷-葡萄糖水解酶(β-D-glucoside-glucohydrolase)(E.C.3.2.1.21),其催化末端非還原的β-D-葡萄糖殘基的水解,并釋放β-D-葡萄糖。對本發(fā)明而言,β-葡糖苷酶活性是根據(jù)Venturi等人,2002,J.Basic Microbiol.4255-66中描述的基本步驟來測定的,只是采用了本文所述的不同條件。1個β-葡糖苷酶活性單位定義為在50℃,pH 5下,從100mM檸檬酸鈉、0.01%Tween-20中的底物4mM對-硝基苯基-β-D-吡喃葡萄糖苷中,每分鐘產生1.0微摩爾的對-硝基酚。
SEQ ID NO36內切阿拉伯糖酶在一個特定的實施方案中,本發(fā)明的多肽是內切阿拉伯糖酶,其包含或由這樣的氨基酸序列組成所述氨基酸序列與可以從Botryosphaeriarhodina,具體是以保藏號CBS 274.96保藏的Botryosphaeria rhodina菌株得到的內切阿拉伯糖酶,更具體是SEQ ID NO36中包含的內切阿拉伯糖酶具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述內切阿拉伯糖酶包含或由SEQ ID NO36第1到301位的序列組成。在本文中,內切阿拉伯糖酶(endo-arabinase)定義為能夠水解阿拉伯聚糖(arabinan)的酶。
SEQ ID NO38內切阿拉伯糖酶在一個特定的實施方案中,本發(fā)明的多肽是內切阿拉伯糖酶,其包含或由這樣的氨基酸序列組成所述氨基酸序列與可以從Botryosphaeriarhodina,具體是以保藏號CBS 274.96保藏的Botryosphaeria rhodina菌株得到的內切阿拉伯糖酶,更具體是SEQ ID NO36中包含的內切阿拉伯糖酶具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述內切阿拉伯糖酶包含或由SEQ ID NO38第1到438位的序列組成。在本文中,內切阿拉伯糖酶定義為能夠水解阿拉伯聚糖的酶。
SEQ ID NO40A1胃蛋白酶肽酶在一個特定的實施方案中,本發(fā)明的多肽是胃蛋白酶肽酶,其包含或由這樣的氨基酸序列組成所述氨基酸序列與可以從Botryosphaeriarhodina,具體是以保藏號CBS 274.96保藏的Botryosphaeria rhodina菌株得到的胃蛋白酶肽酶,更具體是SEQ ID NO40中包含的胃蛋白酶肽酶具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述胃蛋白酶肽酶包含或由SEQ ID NO40第1到396位的序列組成。在本文中,胃蛋白酶肽酶(pepsin peptidase)定義為能夠水解蛋白質或肽的酶。
SEQ ID NO42 M43胃蛋白酶肽酶在一個特定的實施方案中,本發(fā)明的多肽是胃蛋白酶肽酶,其包含或由這樣的氨基酸序列組成所述氨基酸序列與可以從Botryosphaeriarhodina,具體是以保藏號CBS 274.96保藏的Botryospbaeria rhodina菌株得到的胃蛋白酶肽酶,更具體是SEQ ID NO42中包含的胃蛋白酶肽酶具有至少90%,具體是至少95%,更具體是至少96%,更具體是至少97%,更具體是至少98%,更具體是至少99%,或最具體是100%的同一性。更具體地,所述胃蛋白酶肽酶包含或由SEQ ID NO42第1到262位的序列組成。在本文中,胃蛋白酶肽酶定義為能夠水解蛋白質或肽的酶。
多核苷酸本發(fā)明還涉及包含或由編碼本發(fā)明的多肽的核苷酸序列組成的多核苷酸。在一個具體的實施方案中,所述核苷酸序列顯示在ADNA組的序列中,包括與其由于遺傳密碼的簡并性而相異的序列。在另一個實施方案中,本發(fā)明的多核苷酸是修飾的核苷酸序列,其包含或由ADNA組的序列的編碼成熟多肽的區(qū)域組成,而且其與ADNA組中所包含的親本核苷酸序列相比,包含至少一個修飾/突變。
用于分離或克隆編碼多肽的多核苷酸的技術在本領域是已知的,包括從基因組DNA分離,從cDNA制備,或者兩者的組合。從這些基因組DNA克隆本發(fā)明的多核苷酸序列可以通過,例如,利用公知的聚合酶鏈式反應(PCR),或用抗體篩選表達文庫以檢測出具有共同結構特征的克隆DNA片段來實現(xiàn)。例如參見Innis等人,1990,PCRA Guide to Methods andApplication,Academic Press,New York。還可以使用其它核酸擴增程序,諸如連接酶鏈式反應(LCR)、連接激活轉錄(LAT)、和基于核苷酸序列的擴增(NASBA)。
獲得所述核苷酸序列可通過基因工程中使用的標準克隆方法,將該核苷酸序列從其天然位置再定位(relocate)到該序列將被復制的其它位置??寺》椒砂ò幋a該多肽的核苷酸序列的期望片段的切割和分離、該片段向載體分子中的插入,以及重組載體向宿主細胞中的摻入,在宿主細胞中該核酸序列的多拷貝或克隆將被復制。該核酸序列可以是基因組、cDNA、RNA、半合成、合成的來源或其任意組合。
具體地,所述多核苷酸包含且優(yōu)選由這樣的核苷酸序列組成該核苷酸序列與選自ADNA組的序列的編碼成熟多肽的區(qū)域的核苷酸序列具有至少50%的同一性。具體地,所述核苷酸序列與選自ADNA組的序列的編碼成熟多肽的區(qū)域的核苷酸序列具有至少65%的同一性,更具體為70%的同一性,更具體為80%的同一性,更具體為90%的同一性,更具體為95%的同一性,更具體為96%的同一性,更具體為97%的同一性,更具體為98%的同一性,更具體為99%的同一性,或最具體為100%的同一性。具體地,所述核苷酸序列包含選自ADNA組的序列的編碼成熟多肽的區(qū)域的核苷酸序列。在更優(yōu)選的實施方案中,所述核苷酸序列由選自ADNA組的序列的編碼成熟多肽的區(qū)域的核苷酸序列組成。
具體地,所述多核苷酸包含并優(yōu)選由這樣的核苷酸序列組成該核苷酸序列編碼選自木聚糖酶、絲氨酸酯酶、過氧化物酶、GH61A多肽、GH61B多肽、GH61C多肽、GH61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶,并且該核苷酸序列與編碼本發(fā)明人分離并以CBS保藏號274.96保藏的Botryosphaeria rhodina菌株所分泌的木聚糖酶、絲氨酸酯酶、過氧化物酶、GH61A多肽、GH61B多肽、GH61C多肽、GH61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶的核苷酸序列,具有至少50%的同一性,具體為至少65%的同一性,更具體為70%的同一性,更具體為80%的同一性,更具體為90%的同一性,更具體為95%的同一性,更具體為96%的同一性,更具體為97%的同一性,更具體為98%的同一性,更具體為99%的同一性,或最具體為100%的同一性。
在一個具體的實施方案中,所述多核苷酸包含并優(yōu)選由這樣的核苷酸序列組成該核苷酸序列編碼選自木聚糖酶、絲氨酸酯酶、過氧化物酶、GH61A多肽、GH61B多肽、GH61C多肽、GH61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶,并且該核苷酸序列與編碼選自D多肽組的成熟酶核苷酸序列具有至少50%的同一性,具體為至少65%的同一性,更具體為70%的同一性,更具體為80%的同一性,更具體為90%的同一性,更具體為95%的同一性,更具體為96%的同一性,更具體為97%的同一性,更具體為98%的同一性,更具體為99%的同一性,或最具體為100%的同一性。
在一個具體的實施方案中,所述多核苷酸包含并優(yōu)選由這樣的核苷酸序列組成該核苷酸序列編碼選自木聚糖酶、絲氨酸酯酶、過氧化物酶、GH61A多肽、GH61B多肽、GH61C多肽、GH61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶,并且該核苷酸序列與選自EDNA組序列的核苷酸序列具有至少50%的同一性,具體為至少65%的同一性,更具體為70%的同一性,更具體為80%的同一性,更具體為90%的同一性,更具體為95%的同一性,更具體為96%的同一性,更具體為97%的同一性,更具體為98%的同一性,更具體為99%的同一性,或最具體為100%的同一性。
SEQ ID NO1在一個特定的實施方案中本發(fā)明的多核苷酸編碼GH10木聚糖酶,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO1的55到927位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO3在一個特定的實施方案中本發(fā)明的多核苷酸編碼GH11木聚糖酶,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO3的58到663位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO5在一個特定的實施方案中本發(fā)明的多核苷酸編碼絲氨酸酯酶,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO5的55到1110位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO7在一個特定的實施方案中本發(fā)明的多核苷酸編碼脂肪酶,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO7的55到1347位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO9在一個特定的實施方案中本發(fā)明的多核苷酸編碼過氧化物酶,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO9的1到555位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO11在一個特定的實施方案中本發(fā)明的多核苷酸編碼GH61A多肽,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO11的49到702位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO13在一個特定的實施方案中本發(fā)明的多核苷酸編碼GH61B多肽,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO13的40到786位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO15在一個特定的實施方案中本發(fā)明的多核苷酸編碼GH61C多肽,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO15的55到819位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO17在一個特定的實施方案中本發(fā)明的多核苷酸編碼GH61D多肽,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO17的61到675位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO19在一個特定的實施方案中本發(fā)明的多核苷酸編碼成熟功能性多肽,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO19的1到729位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO21在一個特定的實施方案中本發(fā)明的多核苷酸編碼成熟功能性多肽,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO21的55到1299位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO23在一個特定的實施方案中本發(fā)明的多核苷酸編碼成熟功能性多肽,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO23的49到1179位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO25在一個特定的實施方案中本發(fā)明的多核苷酸編碼成熟功能性多肽,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO25的70到846位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO27在一個特定的實施方案中本發(fā)明的多核苷酸編碼成熟功能性多肽,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO27的58到801位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO29在一個特定的實施方案中本發(fā)明的多核苷酸編碼成熟功能性多肽,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO29的157到603位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO31在一個特定的實施方案中本發(fā)明的多核苷酸編碼成熟功能性多肽,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO31的55到660位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO33在一個特定的實施方案中本發(fā)明的多核苷酸編碼β-葡糖苷酶,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO33的46到1854位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO35在一個特定的實施方案中本發(fā)明的多核苷酸編碼內切阿拉伯糖酶,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO35的64到966位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO37在一個特定的實施方案中本發(fā)明的多核苷酸編碼內切阿拉伯糖酶,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO37的55到1368位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SFQ ID NO39在一個特定的實施方案中本發(fā)明的多核苷酸編碼胃蛋白酶蛋白酶(pepsin protease),并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO39的61到1248位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
SEQ ID NO41在一個特定的實施方案中本發(fā)明的多核苷酸編碼胃蛋白酶蛋白酶,并包含或由這樣的核苷酸序列組成所述核苷酸序列與SEQ ID NO41的64到849位的核苷酸序列具有至少70%的同一性,更具體為至少80%的同一性,更具體為至少90%的同一性,更具體為至少95%的同一性,更具體為至少96%的同一性,更具體為至少97%的同一性,更具體為至少98%的同一性,更具體為至少99%的同一性,或最具體為100%的同一性。
為了合成包含相比于選自B多肽組所包含的成熟多肽的氨基酸序列具有至少一個置換、缺失和/或插入的氨基酸序列的多肽,編碼本發(fā)明的多肽的核苷酸序列的修飾可能是必需的。
對本領域技術人員而言顯而易見的是,可以使這些修飾保持酶的功能,即,可以在酶功能的關鍵區(qū)域之外進行這些修飾。對功能來說至關重要的氨基酸殘基因此優(yōu)選不被修飾,例如被替代。對功能來說至關重要的氨基酸殘基可以通過本領域已知的程序來鑒定,諸如定點誘變或丙氨酸掃描誘變(alanine scanning mutagenesis)(例如參見Cunningham和Wells,1989,Science 2441081-1085)。底物-酶相互作用位點可通過三維結構分析來確定,其中三維結構可由諸如核磁共振分析、晶體學、或光親和標記等技術來測定(例如參見de Vos等人,1992,Science 255306-312;Smith等人,1992,Journal of Molecular Biology 224899-904;Wlodaver等人,1992,F(xiàn)EBS Letters 30959-64)。
另外,可以通過引入核苷酸置換來改變編碼本發(fā)明的酶的核苷酸序列,這樣的置換不會使該核苷酸序列編碼產生另外的氨基酸序列,而是對應于意圖用來表達酶的宿主生物的密碼子使用習慣。
將一個核苷酸置換為另一個核苷酸的突變導入核苷酸序列,可以通過利用本領域已知的任何方法進行定點誘變來實現(xiàn)。特別有用的是利用具有目標插入片段的超螺旋雙鏈DNA載體和兩個含有所需突變的合成引物的方法。每條分別與載體的相對鏈互補的寡核苷酸引物借助Pfu DNA聚合酶在溫度循環(huán)過程中延伸。整合入引物后,生成包含錯列缺口的突變質粒。在溫度循環(huán)后,用對甲基化和半甲基化DNA特異性的DpnI處理產物以消化親代DNA模板,并選擇包含突變的合成的DNA。本領域已知的其它方法也可以使用。關于核苷酸置換的一般性描述參見,例如,F(xiàn)ord等,1991,Protein Expression and Purification 295-107。
本發(fā)明還涉及包含,優(yōu)選由這樣的核苷酸序列組成的多核苷酸所述核苷酸序列編碼本發(fā)明的多肽并在高度嚴緊條件,優(yōu)選極高度嚴緊條件下,與選自下列的多核苷酸探針雜交(i)核苷酸序列的互補鏈,所述核苷酸序列選自ADNA組序列的編碼成熟多肽的區(qū)域;(ii)核苷酸序列所包含的cDNA的互補鏈,所述核苷酸序列選自ADNA組序列的編碼成熟多肽的區(qū)域;(iii)(i)或(ii)的片段,其編碼具有B多肽組中所包含的相應成熟多肽的功能的分泌的成熟多肽。
(J.Sambrook,E.F.Fritsch和T.Maniatus,1989,Molecular Cloning,ALaboratory Manual,第二版,Cold Spring Harbor,New York)。
可以理解的是,關于核苷酸序列雜交的細節(jié)和詳情與本文中題為“本發(fā)明的多肽”部分中討論的雜交方面的內容相同或相近。
本發(fā)明還涉及適用于電子設備的、包含本發(fā)明的多肽的氨基酸序列或本發(fā)明的多核苷酸的核苷酸序列的信息的存儲介質。所述存儲介質可合適地為磁盤或光盤,所述電子設備可以是計算設備,所述信息具體可以數(shù)字形式存儲在存儲介質上。
核酸構建體本發(fā)明還涉及包含與一種或多種調控序列可操作地連接的本發(fā)明的多核苷酸的核酸構建體,所述調控序列在適當宿主細胞中與調控序列相容的條件下指導編碼序列的表達。
可利用多種方法操作編碼本發(fā)明多肽的分離多核苷酸以提供多肽的表達的條件。根據(jù)表達載體的不同,可能希望或必需在將多核苷酸序列插入載體之前對其進行操作。利用重組DNA方法修飾多核苷酸序列的技術是本領域眾所周知的。
調控序列可以是適當?shù)膯幼有蛄?,即被宿主細胞識別來表達所述核苷酸的核苷酸序列。啟動子序列包含調節(jié)多肽表達的轉錄調控序列。啟動子可以是在所選宿主細胞中表現(xiàn)出轉錄活性的任何核苷酸序列,包括突變的、截短的和雜合的啟動子,而且可從編碼與宿主細胞同源或異源的細胞外或細胞內多肽的基因獲得。
用于指導本發(fā)明的核酸構建體轉錄,尤其是在細菌宿主細胞中轉錄的適當啟動子的實例,是從大腸桿菌lac操縱子、天藍色鏈霉菌(Streptomycescoelicolor)瓊脂酶基因(dagA)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、地衣芽孢桿菌α-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌(Bacillusstearothermophilus)產麥芽糖淀粉酶(maltogenic amylase)基因(amyM)、解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌(Bacillus licheniformis)青霉素酶基因(penP)、枯草芽孢桿菌xylA和xylB基因、和原核生物的β-內酰胺酶基因(Villa-Kamaroff等人,1978,Proceedings of the National Academyof Sciences USA 753727-3731)中獲得的啟動子,以及tac啟動子(DeBoer等人,1983,Proceedings of the National Academy of Sciences USA 8021-25)。還有“Useful proteins from recombinant bacteria”,Scientific American,1980,24274-94及Sambrook等人,1989,同上中描述的其它啟動子。
用于在絲狀真菌宿主細胞中指導本發(fā)明的核酸構建體轉錄的適當啟動子的實例有從米曲霉(Aspergillus oryzae)TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸穩(wěn)定α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、Rhizomucor miehei脂肪酶、米曲霉堿性蛋白酶、米曲霉磷酸丙糖異構酶、構巢曲霉(Aspergillus nidulans)乙酰胺酶和尖鐮孢(Fusarium oxysporum)胰蛋白酶樣蛋白酶(WO 96/00787)、以及NA2-tpi啟動子(來自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖異構酶基因的雜合啟動子);及其突變的、截短的、和雜合的啟動子。
在酵母宿主中,有用的啟動子有從釀酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、釀酒酵母半乳糖激酶(GAL1)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1、ADH2/GAP)和釀酒酵母3-磷酸甘油酸(phosphoglycerate)激酶基因中所獲得的。還有Romanos等人,1992,Yeast 8423-488中描述了用于酵母宿主細胞的其它有用啟動子。
調控序列也可以是適當?shù)霓D錄終止子序列,即由宿主細胞識別來終止轉錄的序列。終止子序列可操作地連接于編碼多肽的核苷酸序列的3′端。在所選擇的宿主細胞中起作用的任何終止子都可用于本發(fā)明。
對于絲狀真菌宿主細胞優(yōu)選的終止子是從米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸(anthranilate)合酶、黑曲霉α-葡糖苷酶、和尖鐮孢胰蛋白酶樣蛋白酶的基因中獲得的。
對于酵母宿主細胞優(yōu)選的終止子是從釀酒酵母烯醇化酶、釀酒酵母細胞色素C(CYC1)和釀酒酵母甘油醛-3-磷酸脫氫酶基因中獲得的。還有Romanos等人,1992,同上中描述的用于酵母宿主細胞的其它有用終止子。
調控序列還可以是適當?shù)那皩蛄?,即mRNA中對宿主細胞翻譯重要的非翻譯區(qū)。前導序列可操作地連接于編碼多肽的核苷酸序列的5′端。在所選擇的宿主細胞中起作用的任何前導序列都可用于本發(fā)明。
對于絲狀真菌宿主細胞優(yōu)選的前導序列是從米曲霉TAKA淀粉酶和構巢曲霉磷酸丙糖異構酶基因中獲得的。
對于酵母宿主細胞優(yōu)選的前導序列是從釀酒酵母烯醇化酶(ENO-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α-因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)基因中獲得的。
調控序列還可以是聚腺苷酸化序列,即可操作地連接于核苷酸序列3′端的序列,且當被轉錄時,作為將聚腺苷殘基添加到轉錄出的mRNA上的信號被宿主細胞所識別。在所選擇的宿主細胞中起作用的任何聚腺苷酸化序列都可用于本發(fā)明。
對于絲狀真菌宿主細胞優(yōu)選的聚腺苷酸化序列是從米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、尖鐮孢胰蛋白酶樣蛋白酶、和黑曲霉α-葡糖苷酶的基因獲得的。
Guo和Sherman等人,1995,Molecular Cellular Biology 155983-5990中描述了對酵母宿主細胞有用的聚腺苷酸化序列。
調控序列還可以是信號肽編碼區(qū),它編碼連接于多肽的氨基末端,并指導編碼的多肽進入細胞分泌途徑的氨基酸序列。核苷酸序列的編碼序列的5′端可固有地含有信號肽編碼區(qū),它在翻譯讀碼框中與編碼分泌多肽的編碼區(qū)段天然連接?;蛘?,編碼序列的5′端可以含有對編碼序列而言是外來的信號肽編碼區(qū)。如果編碼序列天然地不含信號肽編碼區(qū),則可能需要外來的信號肽編碼區(qū)?;蛘?,外來的信號肽編碼區(qū)可簡單地替換天然信號肽編碼區(qū)以便增強多肽的分泌。然而,指導表達的多肽進入所選擇宿主細胞分泌途徑的任何信號肽編碼區(qū)均可用于本發(fā)明。
對于細菌宿主細胞有效的信號肽編碼區(qū)有從芽孢桿菌NCIB 11837的產麥芽糖淀粉酶、嗜熱脂肪芽孢桿菌的α-淀粉酶、地衣芽孢桿菌的枯草桿菌蛋白酶、地衣芽孢桿菌的β-內酰胺酶、嗜熱脂肪芽孢桿菌的中性蛋白酶類(nprT、nprS、nprM)、和枯草芽孢桿菌的prsA基因獲得的信號肽編碼區(qū)。還有Simonen和Palva,1993,Microbiological Reviews 57109-137中描述的其它信號肽。
對于絲狀真菌宿主細胞有效的信號肽編碼區(qū)有從米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、Humicola insolens纖維素酶和Humicola lanuginosa脂肪酶的基因獲得的信號肽編碼區(qū)。
對于酵母宿主細胞有用的信號肽是從釀酒酵母α-因子和釀酒酵母轉化酶的基因獲得的。Romanos等人,1992,同上中描述了的其它有用的信號肽編碼區(qū)。
調控序列還可以是前肽(propeptide)編碼區(qū),它編碼位于多肽氨基末端的氨基酸序列。所得的多肽可稱為酶原(proenzyme)或多肽原(propolypeptide)。多肽原一般是沒有活性的,通過催化或自催化切割將前肽從多肽原切除后,可轉變?yōu)槌墒煊谢钚缘亩嚯?。前肽編碼區(qū)可從枯草芽孢桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母α-因子、Rhizomucormiehei天冬氨酸蛋白酶、和Myceliophthora thermophila漆酶(WO 95/33836)的基因獲得。
當信號肽和前肽區(qū)都存在于多肽的氨基末端時,前肽區(qū)位于靠近多肽氨基末端的位置,而信號肽區(qū)位于靠近前肽區(qū)的氨基末端位置。在酵母中,可使用ADH2系統(tǒng)或GAL1系統(tǒng)。在絲狀真菌中,可使用TAKAα-淀粉酶啟動子、黑曲霉葡糖淀粉酶啟動子、和米曲霉葡糖淀粉酶啟動子作為調節(jié)序列。
調節(jié)序列的其它實例有使基因得以擴增的那些調節(jié)序列。在真核系統(tǒng)中,這些包括在氨甲喋呤存在時擴增的二氫葉酸還原酶基因,以及在重金屬存在下擴增的金屬硫蛋白基因。在這些情況中,編碼多肽的核苷酸序列將與調節(jié)序列可操作地連接。
重組表達載體本發(fā)明還涉及包含本發(fā)明的核酸構建體的重組表達載體??梢詫⑸鲜鍪龅母鞣N核酸和調控序列連接到一起以產生重組表達載體,此載體可包括一個或多個便利的限制性位點使得在這些位點可插入或替換編碼多肽的核苷酸序列?;蛘?,本發(fā)明的核苷酸序列可通過將核苷酸序列或含有序列的核酸構建體插入適當?shù)谋磉_載體進行表達。構建表達載體時,將編碼序列置于載體中以使編碼序列與適當?shù)谋磉_調控可操作地連接。
重組表達載體可以是可方便的接受重組DNA操作并能引起核苷酸序列表達的任何載體(例如質?;虿《?。載體的選擇通常取決于載體與引入此載體的宿主細胞之間的相容性。載體可以是線性的或閉合環(huán)狀的質粒。
載體可以是自主復制載體,即以染色體外實體的形式存在,且其復制獨立于染色體的復制的載體,例如質粒、染色體外元件、微型染色體、或人工染色體。
載體可包含任何用于確保自我復制的手段?;蛘撸d體可以是這樣的載體它在導入宿主細胞后,整合到基因組中并與其整合進入的染色體一起復制。此外,可使用單一載體或質粒,或是一起含有待引入宿主細胞基因組的全部DNA的兩種或多種載體或質粒,或者轉座子。
本發(fā)明載體優(yōu)選包含一種或多種允許容易地選擇轉化細胞的選擇標記。選擇標記是這樣的一類基因,其產物有助于產生抗微生物劑或病毒抗性、重金屬抗性、營養(yǎng)缺陷型變成原養(yǎng)型(prototrophy to auxotrophs)等等。
細菌選擇標記的實例有來自枯草芽孢桿菌或地衣芽孢桿菌的dal基因,或者賦予抗生素抗性諸如氨芐青霉素、卡那霉素、氯霉素或四環(huán)素抗性的標記。適于酵母宿主細胞的標記有ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。在絲狀宿主細胞中使用的選擇標記包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲?;D移酶)、bar(膦絲菌素乙酰基轉移酶)、hygB(潮霉素磷酸轉移酶)、niaD(硝酸還原酶)、pyrG(乳清苷-5′-磷酸脫羧酶)、sC(硫酸腺苷酰轉移酶(sulfate adenyltransferase))和trpC(鄰氨基苯甲酸合酶)及其等價物。
優(yōu)選用于曲霉屬(Asperigillus)細胞的是構巢曲霉或米曲霉的amdS和pyrG基因以及吸水鏈霉菌(Streptomyces hygroscopicus)的bar基因。
本發(fā)明的載體優(yōu)選包含允許載體整合到宿主細胞基因組中或者允許載體在細胞中不依賴于基因組自主復制的元件。
對整合到宿主細胞基因組而言,載體可依賴編碼多肽的多核苷酸序列或任何其它載體元件通過同源或非同源重組整合到基因組中?;蛘?,載體可包含附加的核苷酸序列,來指導通過同源重組在染色體精確位置整合進入宿主細胞基因組中。這些附加的核苷酸序列使載體可以在染色體上的精確位置整合到宿主細胞基因組中。為了提高在精確位置整合的可能性,整合元件應優(yōu)選包含足夠數(shù)目的與對應靶序列高度同源的核酸,諸如100-1,500個堿基對、優(yōu)選400-1,500個堿基對、且最優(yōu)選800-1,500個堿基對,從而提高同源重組的概率。整合元件可以是與宿主細胞基因組中的靶序列同源的任何序列。此外,整合元件可以是非編碼或編碼核苷酸序列。另一方面,載體可通過非同源重組整合到宿主細胞的基因組中。
對自主復制而言,載體還可包含能使載體在所述的宿主細胞中自主復制的復制起點。細菌復制起點的實例有允許在大腸桿菌中復制的質粒pBR322、pUC19、pACYC177和pACYC184的復制起點,以及允許使得在芽孢桿菌中復制的pUB110、pE194、pTA1060和pAMβ1的復制起點。用于酵母宿主細胞的復制起點的實例有2μm復制起點、ARS1、ARS4、ARS1和CEN3的組合、及ARS4和CEN6的組合。
復制起點可以具有使其在宿主細胞內的作用成為溫度敏感型的突變(見,例如,Ehrlich,1978,Proceedings of the National.Academy of Sciences USA751433)。
可以將多于一個拷貝的編碼本發(fā)明的多肽的核酸序列插入宿主細胞中以增強該基因產物的表達。核苷酸序列拷貝數(shù)的增加可以通過下述實現(xiàn)將至少核酸序列的另一個拷貝整合到宿主細胞基因組中,或者將核酸序列包含有可擴增的選擇性標記基因,通過在合適的選擇劑的存在下培養(yǎng)細胞,能篩選出含有擴增拷貝的選擇性標記基因、從而也就含有所述核酸序列的更多拷貝的細胞。
用于連接上述元件以構建本發(fā)明重組表達載體的方法是本領域技術人員所熟知的(例如參見Sambrook等人,1989,同上)。
重組宿主細胞本發(fā)明還涉及包含本發(fā)明的核酸構建體的重組宿主細胞,它們可有利的用于所述多肽的重組生產。如前所述,將包含本發(fā)明核苷酸序列的載體引入宿主細胞,以使載體作為染色體的整合體或作為自主復制的染色體外載體被保持。
宿主細胞可以是單細胞微生物,例如原核生物,或非單細胞微生物,例如真核生物。
有用的單細胞微生物有細菌細胞,諸如革蘭氏陽性細菌,包括但不限于芽孢桿菌屬細胞,例如嗜堿芽孢桿菌(Bacillus alkaphilus)、解淀粉芽孢桿菌(Bacillus amyloliquefaciens)、短芽孢桿菌(Bacillus brevis)、環(huán)狀芽孢桿菌(Bacillus circulans)、Bacillus clausii、凝結芽孢桿菌(Bacillus coagulans)、燦爛芽孢桿菌(Bacillus lautus)、遲緩芽孢桿菌(Bacillus lentus)、地衣芽孢桿菌、巨大芽孢桿菌(Bacillus megaterium)、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌、和蘇云金芽孢桿菌(Bacillus thuringiensis);或鏈霉菌屬(Streptomyces)細胞,例如淺青紫鏈霉菌(Streptomyces lividans)和鼠灰鏈霉菌(Streptomycesmurinus),或者革蘭氏陰性細菌,諸如大腸桿菌和假單胞菌種(Pseudomonassp.)。在一個特定的實施方案中,細菌宿主細胞是遲緩芽孢桿菌、地衣芽孢桿菌、嗜熱脂肪芽孢桿菌、或枯草桿菌細胞。在另一個優(yōu)選的方面,芽孢桿菌屬細胞是嗜堿的(alkalophilic)芽孢桿菌。
將載體導入細菌宿主細胞可通過例如原生質體轉化(參見例如Chang和Cohen,1979,Molecular General Genetics 168111-115)、使用感受態(tài)細胞(參見例如Young和Spizizen,1961,Journal of Bacteriology 81823-829;或Dubnau和Davidoff-Abelson,1971,Journal of Molecular Biology 56209-221)、電穿孔(參見例如Shigekawa和Dower,1988,Biotechniques 6742-751)、或接合(參見例如Koehler和Thorne,1987,Journal of Bacteriology1695771-5278)來實現(xiàn)。
宿主細胞可以是真核細胞,諸如哺乳動物、昆蟲、植物、或真菌細胞。
在一個優(yōu)選的方面,宿主細胞是真菌細胞?!罢婢痹谟糜诒疚臅r包括子囊菌門(Ascomycota)、擔子菌門(Basidiomycota)、壺菌門(Chytridiomycota)、和接合菌門(Zygomycota)(如Hawksworth等人,在Ainsworth and Bisby’sDictionary of The Fungi,第八版,1995,CAB International,University Press,Cambridge,UK中所定義的),以及卵菌門(Oomycota)(如Hawksworth等人,1995,同上第171頁中所引用的)和所有有絲分裂孢子真菌(Hawksworth等人,1995,同上)。在一個更優(yōu)選的方面,真菌宿主細胞是酵母細胞?!敖湍浮痹谟糜诒疚臅r包括產子囊酵母(內孢霉目Endomycetales)、產擔孢子酵母、和屬于半知菌類(Fungi Imperfecti)的酵母(芽孢綱Blastomycetes)。由于酵母的分類今后還會變化,對于本發(fā)明來說,酵母應該是如在Biology and Activities of Yeast(Skinner,F(xiàn).A.、Passmore,S.M.和Davenport,R.R.編,Soc.App.Bacteriol.Symposium SeriesNo.9,1980)中所定義的。
在一個更優(yōu)選的方面,酵母宿主細胞是假絲酵母屬、漢遜酵母屬(Hansenula)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、糖酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)、或Yarrowia屬細胞。
在一個最優(yōu)選的方面,酵母宿主細胞是卡爾斯伯糖酵母(Saccharomycescarlsbergensis)、釀酒酵母(Saccharomyces cerevisiae)、糖化糖酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、Saccharomyceskluyveri、Saccharomyces norbensis或卵形糖酵母(Saccharomyces oviformis)細胞。在另一個最優(yōu)選的方案中,酵母宿主細胞是乳酸克魯維酵母(Kluyveromyces lactis)細胞。在另一個最優(yōu)選的方案中,酵母宿主細胞是Yarrowia lipolytica細胞。
在另一個更優(yōu)選的方面,真菌宿主細胞是絲狀真菌細胞。“絲狀真菌”包括真菌門(Eumycota)和卵菌門(Oomycota)(如Hawksworth等,1995,文獻同上所定義的)所有絲狀形式的亞類。絲狀真菌特征在于通常由幾丁質、纖維素、葡聚糖、脫乙酰殼多糖、甘露聚糖、以及其它復合多糖組成的菌絲體壁。營養(yǎng)生長依靠菌絲延長,且碳分解代謝是專性需氧的。相反,諸如釀酒酵母的酵母的營養(yǎng)生長通過單細胞原植體的芽殖進行,且碳分解代謝可以是發(fā)酵的。
在一個甚至更優(yōu)選的方面,絲狀真菌宿主細胞是Acremonium屬、曲霉屬、鐮孢屬(Fusarium)、腐質霉屬(Humicola)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、脈孢霉屬(Neurospora)、青霉屬(Penicillium)、梭孢殼屬(Thielavia)、Tolypocladium屬、或木霉屬(Trichoderma)的細胞。
在一個最優(yōu)選的方面,絲狀真菌宿主細胞是泡盛曲霉、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、構巢曲霉、黑曲霉、或米曲霉細胞。在另一個最優(yōu)選的方案中,絲狀真菌宿主細胞是桿孢狀鐮孢(Fusarium bactridioides)、Fusarium cerealis、Fusarium crookwellense,大刀鐮孢(Fusarium culmorum)、禾谷鐮孢(Fusarium graminearum)、禾赤鐮孢(Fusarium graminum)、異孢鐮孢(Fusarium heterosporum)、合歡木鐮孢(Fusarium negundi)、尖孢鐮孢(Fusarium oxysporum)、多枝鐮孢(Fusariumreticulatum)、玫瑰色鐮孢(Fusarium roseum)、接骨木鐮孢(Fusariumsambucinum)、膚色鐮孢(Fusarium sarcochroum)、擬分枝孢鐮孢(Fusariumsporotrichioides)、硫色鐮孢(Fusarium sulphureum)、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum細胞。在一種最優(yōu)選的實施方案中,絲狀真菌親代細胞是Fusarium venenatum(Nirenberg sp.nov.)細胞。在另一種最優(yōu)選的實施方案中,絲狀真菌宿主細胞是Humicola insolens、Humicola lanuginosa、Mucor miehei、Myceliophthora thermophila、粗糙脈孢霉(Neurospora crassa)、產紫青霉、Thielavia terrestris、Trichodermaharzianum、康寧木霉(Trichoderma koningii)、Trichoderma longibrachiatum、Trichoderma reesei或綠色木霉細胞。
真菌細胞可以本身已知的方式通過涉及原生質體形成、原生質體轉化、和細胞壁再生的過程進行轉化。EP 238 023和Yelton等人,1984,Proceedingsof the National Academy of Sciences USA 811470-1474中描述了適合曲霉屬和木霉屬宿主細胞轉化的過程。Malardier等人,1989,Gene 78147-159和WO 96/00787中描述了適合轉化鐮孢屬物種的方法。酵母可利用Becker和Guarente在Abelson,J.N.和Simon,M.I.編的Guide to Yeast Genetics andMolecular Biology,Methods in Enzymology,Volume.194,pp 182-187,Academic Press公司,New York;Ito等人,1983,Journal of Bacteriology 153163;及Hinnen等人,1978,Proceedings of the National Academy of SciencesUSA 751920中所描述的程序轉化。
生產方法本發(fā)明還涉及生產本發(fā)明的酶的方法,包括(a)培養(yǎng)包含編碼本發(fā)明的酶的核苷酸序列的生物株系,其中所述株系能表達和分泌該酶;并(b)回收所述酶。在一個具體的實施方案中,所述株系是野生型株系,例如Botryospaeria rhodina CBS 274.96,而在另一個實施方案中所述株系是如上所述的重組宿主細胞。
在本發(fā)明的生產方法中,利用本領域眾所周知的方法在適于產生所述酶的培養(yǎng)基中培養(yǎng)細胞。例如,可在實驗室或工業(yè)發(fā)酵罐中,在適當?shù)呐囵B(yǎng)基和可使所述多肽表達和/或分離的條件下,通過搖瓶培養(yǎng)、小規(guī)?;虼笠?guī)模發(fā)酵(包括連續(xù)、分批、補料-分批、或固態(tài)發(fā)酵)來進行細胞培養(yǎng)。培養(yǎng)使用本領域已知的程序在含有碳和氮源以及無機鹽的合適營養(yǎng)培養(yǎng)基中進行。適宜的培養(yǎng)基可從商業(yè)供應商獲得,或者可根據(jù)已公布的配方來制備(例如參見美國典型培養(yǎng)物保藏中心的目錄)。如果酶被分泌到培養(yǎng)基中,那么可直接從培養(yǎng)基中回收酶。如果酶不分泌,那么可從細胞裂解物中進行回收。
所得的酶多肽可通過本領域已知的方法回收。例如,可通過常規(guī)程序,包括但不限于離心、過濾、萃取、噴霧干燥、蒸發(fā)、或沉淀,從培養(yǎng)基中回收所述酶。
本發(fā)明的多肽可通過本領域已知的多種程序純化,包括但不限于層析(例如離子交換、親和、疏水、層析聚焦、和大小排阻)、電泳(例如制備性等電聚焦)、差異溶解(例如硫酸銨沉淀)、SDS-PAGE、或萃取(例如參見Protein Purification,J.-C.Janson和Lars Ryden編,VCH Publishers,New York,1989。
轉基因植物本發(fā)明還涉及轉基因植物、植物部分或者植物細胞,它們已被編碼本發(fā)明的酶的核苷酸序列所轉化,從而表達所述酶。在一個實施方案中所述植物可以用作以可回收的量生產所述酶的宿主??梢詮乃鲋参锘蛑参锊糠只厥彰??;蛘?,含有該重組酶的植物或植物部分本身可以用來提高食品或飼料的質量,例如,改善營養(yǎng)價值、適口性和流變學性質,或破壞抗營養(yǎng)因子(antinutritional factor)。具體地,表達所述酶的植物或植物部分可以作為改良的起始材料用于生產燃料酒精或生物乙醇(bio-ethanol)。
所述轉基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的實例是草類/禾本科(grasses),例如草地早熟禾(meadowgrass)(藍草(blue grass),早熟禾屬(Poa)),飼用牧草(forage grass),例如羊茅屬(festuca),黑麥草屬(lolium);寒地型牧草(temperate grass),例如剪股穎屬(Agrostis);和谷類(cereals),如小麥、燕麥、黑麥、大麥、稻、高粱和玉米(maize)(玉米(corn))。
雙子葉植物的例子有煙草;豆類(legumes),例如羽扇豆(lupins);馬鈴薯;甜菜;豌豆;菜豆(bean)和大豆,和十字花科植物(Brassicaceae),例如花椰菜、油菜籽(rape seed)和與之親緣關系緊密的模式生物擬南芥(Arabidopsis thaliana)。
植物部分的例子有莖、愈傷組織、葉、根、果實、種子和塊莖。特定的植物組織,例如葉綠體、質外體、線粒體、液泡、過氧化物酶體和細胞質,都被認為是植物部分。另外,任何植物細胞,不管其來自什么組織,都被認為是植物部分。
這些植物、植物部分和植物細胞的后代也被包括在本發(fā)明的范圍之內。
所述表達本發(fā)明的酶的轉基因植物或植物細胞可以根據(jù)本領域已知的方法構建。簡單地說,所述植物或植物細胞這樣構建的將一個或多個編碼本發(fā)明的酶的表達構建體整合入植物宿主的基因組,并使所得的修飾植物或植物細胞繁殖成為轉基因植物或植物細胞。
方便地,所述表達構建體是包含核苷酸序列的核酸構建體,所述核苷酸序列編碼本發(fā)明的酶,且可操作地連接于在所選植物或植物部分中表達該核苷酸序列所需的合適的調控序列。另外,該表達構建體還可以包括可用于鑒定已經整合了表達構建體的宿主細胞的可選擇標記;以及將該構建體導入所述的植物所需要的DNA序列(后者取決于使用的DNA導入方法)。
選擇調節(jié)序列,例如啟動子和終止子序列,以及可選的信號或轉運序列,是根據(jù)例如想要在何時、何處、怎樣表達該酶而決定的。例如,編碼本發(fā)明的酶的基因的表達可以是組成型或誘導型的,或者可為發(fā)育性、階段或組織特異性的,而且基因產物可以被靶向于具體的組織或者植物部分例如種子或葉。對調節(jié)序列的描述有例如Tague等,1988,Plant Physiology86506。
對于組成性表達,可以使用35S-CaMV啟動子(Franck等.,1980.Cell 21285-294)。器官特異性的啟動子可以是,例如,來自存儲性貯藏組織(storagesink tissues)例如種子、馬鈴薯的塊莖及果實的啟動子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24275-303),或者來自代謝性貯藏組織(metabolicsink tissues)例如分生組織的啟動子(Ito等,1994,Plant Mol.Biol.24863-878);或者是種子特異性的啟動子,例如來自稻的谷蛋白、谷醇溶蛋白、球蛋白或白蛋白啟動子(Wu等,1998,Plant and Cell Physiology 39885-889),來自蠶豆(Vicia faba)的豆球蛋白B4和未知的種子蛋白基因的蠶豆啟動子(Conrad等,1998,Journal of Plant Physiology 152708-711),來自種子油體(seed oil body)蛋白的啟動子(Chen等,1998,Plant and Cell Physiology 39935-941),來自歐洲油菜(Brassica napus)的貯存蛋白napA啟動子,或任何其他本領域已知的種子特異性的啟動子,例如WO 91/14772所描述的。另外,該啟動子還可以是葉特異性的啟動子,例如稻或西紅柿的rbcs啟動子(Kyozuka等,1993,Plant Physiology 102991-1000);小球藻病毒腺嘌呤甲基轉移酶基因啟動子(Mitra和Higgins,1994,Plant Molecular Biology 2685-93),或來自稻的aldP基因啟動子(Kagaya等人,1995,Molecular andGeneral Genetics 248668-674);或為創(chuàng)傷誘導的啟動子例如馬鈴薯pin2啟動子(Xu等,1993,Plant Molecular Biology 22573-588)。
也可以使用啟動子增強元件來獲得在植物中酶的更高表達。例如,啟動子增強元件可以是位于啟動子和編碼本發(fā)明的酶的核苷酸序列之間的內含子。例如Xu等,1993(同上)公開了稻肌動蛋白1基因的第一個內含子增強表達的用途。
可選擇標記基因和表達構建體的任何其他部分都可以從本領域可用的那些中選擇。
根據(jù)本領域已知的常規(guī)技術將該核酸構建體整合入植物基因組,所述技術包括農桿菌(Agrobacterium)介導的轉化、病毒介導的轉化、顯微注射、粒子轟擊、生物射彈轉化(biolistic tranformation)和電穿孔(Gasser等,1990,Science 2441293;Potrykus,1990,Bio/Technology 8535;Shimamoto等,1989,Nature 338274)。
目前,根瘤農桿菌(Agrobacterim tumefaciens)介導的基因轉移是產生轉基因雙子葉植物的優(yōu)選方法(見Hooykas和Schilperoort,1992,PlantMolecular Biology 1915-38的綜述)。不過該方法也可以用于轉化單子葉植物,盡管單子葉植物一般優(yōu)選別的轉化方法。目前,產生轉基因單子葉植物的優(yōu)選方法是粒子(被用于轉化的DNA所包被的極小金或鎢粒子)轟擊胚愈傷組織(embroynic calli)或發(fā)育中的胚(Christou,1992,Plant Journal 2275-281;Shimamoto,1994,Current Opinion Biotechnology 5158-162;Vasil等,1992,Bio/Technology 10667-674)。另外一種可選的轉化單子葉植物的方法是基于原生質體轉化,如Omirulleh等,1993,Plant Molecular Biology 21415-428所述。
轉化以后,選擇整合了表達構建體的轉化子,并根據(jù)本領域熟知的方使其再生為完整植株。
本發(fā)明還涉及產生本發(fā)明的酶的方法,其包括(a)在有利于生產所述酶的條件下,培養(yǎng)含有編碼本發(fā)明的酶的核苷酸序列的轉基因植物或植物細胞;和(b)回收該酶。
包含酶多肽的組合物和它們的制備方法本發(fā)明提供包含本發(fā)明的多肽和賦形劑的組合物和制備這樣的組合物的方法,該方法包括混合本發(fā)明的多肽和賦形劑。在一個具體的實施方案中,本發(fā)明的多肽是該組合物,例如單組分組合物中的主要(多肽)成分。在這里,賦形劑應理解為用于配制所述組合物的任何輔助性的試劑或化合物,包括溶劑、載體、穩(wěn)定劑等。
該組合物還可以包含一種或多種其它的酶,例如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質酶、角質酶、環(huán)糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、鹵素過氧化物酶(haloperoxidase)、轉化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果膠分解酶、肽谷氨酰胺酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶、或木聚糖酶。
所述組合物可以根據(jù)本領域已知的方法制備并可以為液體或固體組合物的形式。例如,酶組合物可以用多肽和/或藥品制劑技術領域已知的方法配制,例如配制為包衣或未包衣的顆?;蛭㈩w粒。因此本發(fā)明的多肽可以以顆粒,優(yōu)選非粉化性(non-dusting)顆粒,液體,特別是穩(wěn)定化的液體,漿液或被保護的多肽的形式提供。對于一定的用途,可優(yōu)選將多肽固定到固態(tài)基質上。
組合物中要包含的多肽可以根據(jù)本領域已知的方法穩(wěn)定化,例如通過加入抗氧化劑或還原劑以限制多肽的氧化從而穩(wěn)定組合物中的多肽,或可通過加入例如PVP、PVA、PEG或其它已知對多肽在固體或液體組合物中的穩(wěn)定性有益的合適的聚合物來穩(wěn)定它。
在另外的實施方案中,本發(fā)明的組合物是去污劑組合物,該組合物除了本發(fā)明的多肽以外還包含表面活性劑,以及,任選地,選自增效劑(builder)例如沸石、漂白劑例如過碳酸鹽、漂白促進劑(bleach enhancers)例如TAED或NOBS、抑泡劑(suds suppressors)、芳香劑等等的化合物。
在另一個實施方案中本發(fā)明的組合物是飼料組合物,其除了本發(fā)明的多肽以外還包含谷類(cereal)或谷物(grain)產品。
在另一個實施方案中本發(fā)明的組合物是包含本發(fā)明的多肽的食品組合物例如面包粉(baker’s flour)組合物、釀造產品、果汁、油或豬油產品。
在另一個實施方案中本發(fā)明的組合物是紙漿組合物,其除了本發(fā)明的多肽外還含有紙漿。
在另一個實施方案中本發(fā)明的組合物是殺生物(biocidal)組合物,其除了本發(fā)明的多肽外還含有氧化還原酶促進劑。
酶多肽和包含它們的組合物的用途在另外的方面中,本發(fā)明提供本發(fā)明的多肽或多核苷酸,或包含所述多肽或多核苷酸的組合物在多種應用特別是(技術)過程例如工業(yè)或家庭中進行的過程中,及下面的用于商業(yè)研究的目的的用途。因此本文涵蓋這樣的過程,其包括在(技術的)工業(yè)、研究或家用過程中使用本發(fā)明的多肽或本發(fā)明的多核苷酸。
在一個實施方案中本發(fā)明的多肽或組合物被用來清洗纖維質織物。
在另一個實施方案中使用本發(fā)明的多肽或組合物制備食品或飼料添加劑。
在另一個實施方案中使用本發(fā)明的多肽或組合物處理木質(lignolosic)材料和紙漿。
去污劑的公開本發(fā)明的多肽可以添加到去污劑(detergent)組合物中并因此成為其組分。
本發(fā)明的去污劑組合物可以,例如,配制為手洗或機洗衣物用去污劑組合物,其包括適用于預處理染污織物的洗衣添加劑組合物,和漂洗加入的織物軟化組合物(rinse added fabric softener composition);或者可以配制為用于一般家用硬表面清洗操作的去污劑組合物,或配制為用于手洗或機洗碗碟操作。
在一個特定的方面中,本發(fā)明提供包含本發(fā)明的多肽的去污劑添加劑。該去污劑添加劑及去污劑組合物可包含一種或多種其他的酶例如蛋白酶、脂肪酶、角質酶、淀粉酶、糖酶、纖維素酶、果膠酶、甘露聚糖酶、阿拉伯糖酶(arabinase)、半乳聚糖酶、木聚糖酶、氧化酶例如漆酶和/或過氧化物酶。
一般而言,所選的酶的性質應該與所選的去污劑相容(例如最適pH、與其他酶或非酶成分的相容性等等),而且該酶應當以有效量存在。
蛋白酶合適的蛋白酶包括動物、植物或微生物來源的那些蛋白酶。微生物來源是優(yōu)選的。還包括化學修飾的或蛋白質工程改造的突變體。該蛋白質可以是絲氨酸蛋白酶或金屬蛋白酶,優(yōu)選地為堿性微生物蛋白酶或胰蛋白酶樣(trypsin-like)蛋白酶。堿性蛋白酶的例子有枯草桿菌蛋白酶,特別是來自芽孢桿菌的那些,例如枯草桿菌蛋白酶Novo、枯草桿菌蛋白酶Carlsberg、枯草桿菌蛋白酶309、枯草桿菌蛋白酶147和枯草桿菌蛋白酶168(如WO 89/06279所述)。胰蛋白酶樣蛋白酶的例子有胰蛋白酶(例如豬或牛來源的)和鐮孢(Fusarium)蛋白酶,其在WO 89/06270和WO 94/25583中有描述。
有用的蛋白酶的例子有WO 92/19729、WO 98/20115、WO 98/20116和WO 98/34946中所描述的變體,特別是那些文獻中所述的特定位置上有置換的變體。
優(yōu)選的商業(yè)上可獲得的蛋白酶包括Alcalase,Savinase,Primase,Duralase,Esperase,和Kannase(Novozymes A/S),Maxatase,Maxacal,Maxapem,Properase,Purafect,Purafect OxP,F(xiàn)N2,和FN3(Genencor International Inc.)。
脂肪酶合適的脂肪酶包括細菌或真菌來源的那些脂肪酶。還包括化學修飾的或蛋白質工程改造的突變體。有用的脂肪酶的例子包括來自腐質霉屬(Humicola,與Thermomyces同義)的脂肪酶,例如EP 258 068和EP305 216所描述的來自H.lanuginosa(T.lanuginosus)的脂肪酶,或WO96/13580所描述的來自H.insolens的脂肪酶,假單胞菌(Pseudomonas)脂肪酶,例如來自產堿假單胞菌(P.alcaligenes)或類產堿假單胞菌(P.pseudoalcaligenes)(EP 218 272)、洋蔥假單胞菌(P.cepacia)(EP 331 376)、司徒茨假單胞菌(P.stutzeri)(GB 1,372,034)、熒光假單胞菌(P.fluorescens)、假單胞菌菌種SD705株(WO 95/06720和WO 96/27002)和P.wisconsinensis(WO 96/12012)的脂肪酶;芽孢桿菌脂肪酶,例如來自枯草芽孢桿菌(Dartois等人,(1993),Biochemica et Biophysica Acta,1131,253-360)、嗜熱脂肪芽孢桿菌(JP 64/744992)、或短小芽孢桿菌(B.pumilus)(WO 91/16422)的脂肪酶。
其他的例子有WO 92/05249,WO 94/01541,EP 407 225,EP 260 105,WO95/35381,WO 96/00292,WO 95/30744,WO 94/25578,WO 95/14783,WO95/22615,WO 97/04079和WO 97/07202中所描述的脂肪酶變體。
優(yōu)選的商業(yè)上可獲得的脂肪酶包括LipolaseTM,Lipolase UltraTM和LipexTM(Novozymes AJS)。
淀粉酶合適的淀粉酶(α和/或β)包括細菌或真菌來源的那些淀粉酶。還包括化學修飾的或蛋白質工程改造的突變體。淀粉酶包括,例如,得自芽孢桿菌,例如一種特別的地衣芽孢桿菌菌株(在GB 1,296,839中有詳述)的α-淀粉酶。
有用的淀粉酶的例子有WO 94/02597,WO 94/18314,WO 96/23873和WO 97/43424中描述的變體,特別是那些文獻中所述的特定位置上有置換的變體。
優(yōu)選的商業(yè)上可獲得的淀粉酶包括DuramylTM,TermamylTM,F(xiàn)ungamylTM和BANTM(Novozymes A/S),RapidaseTM和PurastarTM(來自Genencor International Inc.)。
纖維素酶合適的纖維素酶包括細菌或真菌來源的那些纖維素酶。還包括化學修飾的或蛋白質工程改造的突變體。合適的纖維素酶包括來自芽孢桿菌屬、假單胞菌屬、腐質霉屬、鐮孢屬、梭孢殼屬和Acremonium屬的纖維素酶,例如在US 4,435,307,US 5,648,263,US 5,691,178,US 5,776,757和WO 89/09259中描述的、由Humicola insolens、Myceliophthora thermophila和尖鐮孢產生的真菌纖維素酶。
特別合適的纖維素酶是具有護色(color care)的益處的堿性或中性纖維素酶。這樣的纖維素酶的例子有EP 0 495 257,EP 0 531 372,WO 96/11262,WO 96/29397和WO 98/08940中描述的纖維素酶。其他例子有纖維素酶變體,例如WO 94/07998,EP 0 531 315,US 5,457,046,US 5,686,593,US5,763,254,WO 95/24471,WO 98/12307和PCT/DK98/00299中描述的那些。
商業(yè)上可獲得的纖維素酶包括Celluzyme,和Carezyme(Novozymes),Clazinase,和Puradax HA(Genencor International Inc.),和KAC-500(B)(Kao Corporation)。
過氧化物酶/氧化酶合適的過氧化物酶/氧化酶包括植物、細菌或真菌來源的那些過氧化物酶/氧化酶。還包括化學修飾的或蛋白質工程改造的突變體。有用的過氧化物酶的例子包括來自鬼傘屬(Coprinus)的過氧化物酶,例如來自灰蓋鬼傘(C.cinereus),及其變體,如WO 93/24618,WO 95/10602,和WO 98/15257所述的那些的過氧化物酶。
商業(yè)上可獲得的過氧化物酶包括Guardzyme(Novozymes A/S)。
可以通過加入含有一種或多種酶的單獨的添加劑,或加入包含所有酶的復合添加劑,使去污酶(detergent enzyme(s))包含在去污劑組合物中。本發(fā)明的去污劑添加劑,即單獨的添加劑或復合添加劑,可以配置為例如顆粒、液體、漿液等等。優(yōu)選的去污劑添加劑的劑型為顆粒,特別是非粉化性顆粒、液體,特別是穩(wěn)定化的液體,或漿液。
非粉化性顆??梢?,例如,如US 4,106,991和4,661,452所公開的那樣制備,任選地,還可以用本領域已知的方法來包被。蠟狀(waxy)包被材料的例子有平均克分子量為1000-20000的聚(環(huán)氧乙烷)產品(聚乙二醇,PEG);具有16-50個環(huán)氧乙烷單位的乙氧基化壬基苯酚;乙氧基化脂肪醇,其中醇含12-20個碳原子,且其中有15-80個環(huán)氧乙烷單位;脂肪醇;脂肪酸;以及脂肪酸的甘油單酯、甘油二酯和甘油三酯。GB 1483591提供了適于通過流化床施用的成膜包被材料的例子。液體酶制備物可以,例如,按照已確立的方法,通過加入多元醇,如丙二醇、糖或糖醇、乳酸或硼酸來穩(wěn)定化??梢愿鶕?jù)EP 238,216所公開的方法制備被保護的酶。
本發(fā)明的去污劑組合物可以是任何方便的形式,例如條、片、粉、顆粒、糊或液體。液體去污劑可以是水性的,通常含有高達70%的水和0-30%的有機溶劑,或者可以是非水性的。
所述去污劑組合物包含一種或多種表面活性劑,表面活性劑可以是非離子型包括半極性的,和/或陰離子型的,和/或陽離子型的,和/或兩性離子型的。表面活性劑典型地以0.1-60重量%的水平存在。
當被包括在其中時,所述去污劑通常含有大約1%到大約40%的陰離子表面活性劑例如線性苯磺酸烷基酯、α-烯屬磺酸酯、硫酸烷基酯(脂肪醇硫酸酯)、脂肪醇乙氧基硫酸鹽(ethoxysulfate)、二級鏈烷磺酸鹽(alkanesulfonate)、α-磺基脂肪酸甲酯、烷基或烯基琥珀酸或肥皂。
當被包括在其中時,所述去污劑通常含有約0.2%到約40%的非離子表面活性劑如脂肪醇乙氧基化物、壬基苯酚乙氧基化物、烷基多苷、烷基二甲基胺氧化物、乙氧基化脂肪酸單乙醇胺、脂肪酸單乙醇胺、多羥基烷基脂肪酰胺(polyhydroxy alkyl fatty acid amide)、或葡糖胺(“葡萄糖胺”(“glucamides”))的N-?;鵑-烷基衍生物。
所述去污劑可包括0-65%的洗滌增效劑(detergent builder)或絡合劑(complexing agent)如沸石、二磷酸鹽、三磷酸鹽、膦酸鹽(phosphonate)、碳酸鹽、檸檬酸鹽、次氮基三乙酸、乙二胺四乙酸、二亞乙基三胺五乙酸、烷基或烯基琥珀酸、可溶的硅酸鹽或分層的(layered)硅酸鹽(例如來自Hoechst的SKS-6)所述去污劑可包含一種或多種聚合物。例如羧甲基纖維素、聚(乙烯吡咯烷酮)、聚(乙二醇)、聚(乙烯醇)、聚(乙烯吡啶-N-氧化物)、聚(乙烯咪唑)、聚羧酸酯如聚丙烯酸酯、馬來酸/丙烯酸共聚物和甲基丙烯酸月桂酯/丙烯酸共聚物。
所述去污劑可包含漂白系統(tǒng),所述系統(tǒng)包括H2O2源例如過硼酸鹽或過碳酸鹽,其可與產過酸漂白激活劑(peracid-forming bleach activator)如四乙?;叶坊蛉甚Q醣交撬狨?nonanoyloxybenzenesulfonate)組合?;蛘撸紫到y(tǒng)可包括例如酰胺、二酰亞胺或砜類型的過氧酸。
本發(fā)明的去污劑組合物的酶可以用常規(guī)的穩(wěn)定劑來穩(wěn)定化,例如多元醇如丙二醇或丙三醇、糖或糖醇、乳酸、硼酸或硼酸衍生物,例如,芳香族硼酸酯,或苯硼酸衍生物如4-甲酰苯硼酸,并且該組合物可以如WO92/19709和WO 92/19708中描述的那樣配制。
洗滌劑溶液也可包括其他常規(guī)的洗滌劑組分,例如織物調理劑(conditioner)包括粘土,促泡劑,抑泡劑,防蝕劑,污物懸浮劑,防污物再沉淀劑,染料,殺菌劑,熒光增白劑,水溶助長劑,晦暗抑制劑,或香料。
在此考慮,在所述去污劑組合物中,任何酶,特別是本發(fā)明的酶,可以以相當于0.01-100mg酶蛋白每升洗滌液,優(yōu)選0.05-5mg酶蛋白每升洗滌液,最優(yōu)選0.1-1mg酶蛋白每升洗滌液的量加入。
本發(fā)明的酶還可以摻入到WO 97/07202所公開的去污劑組合物中,在此將WO 97/07202并入本文作為參考。
保藏的微生物根據(jù)《國際承認的用于專利程序的微生物保存布達佩斯條約》,下列微生物被保藏在真菌菌種保藏中心(Centraalbureau voor Schimmelcultures),F(xiàn)ungal and Yeast Collection,Uppsala-laan 8,3584 CT Utrecht,P.O.Box 85167,3508 AD Utrecht,荷蘭名稱Botryosphaeria rhodina同義名棉色二孢(Diplodia gossypina)(SBL 274)(Berkeley& M.A.Curtis)von Arx,von 1970,″The genera offungi sporulating in pure culture″143分類Dothideaceae,Dothideales,Dothidemycetes,子囊菌門(Ascomycota)保藏號CBS 274.96保藏日期1996年3月12日實施例實施例1鑒定Botryosphaeria rhodina CBS 274.96分泌的功能性多肽培養(yǎng)液的酶指紋分析通過用多種酶測定方法對培養(yǎng)基肉湯進行測定,獲得了酶活性分布圖。制備帶底物的96孔微量滴定(MT)板并保存在10℃直到使用。制備了兩種不同的pH變化形式pH3和pH7。使用下面的底物0.05%AZCL(Mazurine染色和交聯(lián)的底物,Megazyme)-直鏈淀粉,阿拉伯聚糖,β-葡聚糖(大麥),酪蛋白,膠原,凝膠多糖,葡聚糖,半乳聚糖(馬鈴薯),半乳甘露聚糖(角豆)(carob),He-纖維素、支鏈淀粉(pullulan)、木聚糖(燕麥)和木葡聚糖(AZCL-酪蛋白不能用在pH3,因此這些板中不加入AZCL-酪蛋白)。
pH3底物的制備將0.1g的每種AZCL底物溶解在100ml的0.2M琥珀酸pH3+10微升Triton X-100(0.01%)中,得到0.1%AZCL的終濃度。
pH7底物的制備將0.1g的每種AZCL溶解在50ml的無菌H20加10微升Triton X-100(0.01%)中。向每個50ml AZCL底物中加入50ml 0.4M MOPS pH7,得到終體積100ml,以及終濃度0.2M緩沖液,0.1%AZCL。
還包括了漆酶和脂肪酶活性的測定,底物如下制備漆酶底物的制備
制備溶于0.2M磷酸鹽/硼酸鹽緩沖液,pH9的0.08mg/ml Chicago SkyBlue 35ml。
脂肪酶底物的制備通過以3∶1混合2%PVA溶液與大豆油制備聚乙烯醇(PVA)/大豆油乳液。使用ULTRA-TURRAX混合器將油乳化,并將12ml的乳液與500ml包含10mM CaCl2,pH5.5的0.2M乙酸鈉緩沖液,及5ml 0.2%的結晶紫溶液混合。
使用US Sterilin 96孔MT板和Multidrop S20裝板器(stacker),TitertekInstruments,Inc.,Alabama。將200微升的每種AZCL-底物和脂肪酶底物和150微升的漆酶底物分裝到MT孔中,并將30-50μl培養(yǎng)基肉湯加入每份底物中,26℃溫育過夜。如下對測定結果評分0無活性;1弱活性;2強活性。
結果表格棉色二孢培養(yǎng)基肉湯的指紋分析
a活性測定的結果評分0=無活性;1=弱反應;2=強反應
bnt=未測試A.cDNA文庫構建用標準的分子生物學技術(Ausuble等人1995″Current protocols inmolecular biology″Publ.John Wiley and sons)制備來自Botryosphaeriarhodina CBS 274.96的cDNA。
cDNA文庫生產中使用的生物質的發(fā)酵是從在28℃下溫育了7天的接種的PDA板開始的。在有Mex1培養(yǎng)基的搖瓶中接種數(shù)個菌絲體-PDA瓊脂塞(plugs),其中Mex1培養(yǎng)基含有(每升)20g大豆,15g麥麩,10g微結晶纖維素(cellulose Avicel),5g麥芽糖糊精01,3g細菌用蛋白胨(bactopeptone),0.2g聚氧丙烯(pluronic)PE6100,和1g橄欖油。在26℃下150rpm振蕩這些搖瓶。7日后通過Miracloth過濾收集菌絲體,并將菌絲體冷凍在液氮中,在-80℃下保存直到使用。
RNA分離從冰凍、粉狀的Botryospaeria rhodina菌絲體制備總RNA,方法是通過硫氰酸胍提取,然后通過5.7M CsCl的下層(cushion)超速離心(Chirgwin,J.M.,Przbyla,A.E.,Macdonlad,RJ.和Ruttwer W.J.,Isolation ofbiologically active ribonucleic acid from sources enriched in ribonuclease,Biochemistry 18,5294-5299,1979)。用寡聚(dT)-纖維素親和色譜(Aviv,H.和Leder,P.,Purification of biologically active globin messenger RNA bychromatography on oligothymidylic acid-cellulose,Proc.Natl.Acad.Sci.USA69(6),1408-1412,1972)分離富含多聚A的RNA。
cDNA文庫的構建根據(jù)Gubler U和Hoffman,B.J.,A simple and veryefficient method for generating cDNA libraries,Gene 25(2-3),263-269,(1983);Sambrook,J.,F(xiàn)ritsch,E.F.和Maniantis,T.Molecular cloningA laboratoryManual,第二版,1989,Cold Spring Harbor Laboratory,Cold Spring Harbor,New York和Kofod等人(1994)的一般方法使用多聚A-Not1引物(Promega,美國)合成雙鏈cDNA。合成以后,用綠豆核糖核酸酶處理cDNA,用T4 DNA聚合酶平末端化,然后與摩爾數(shù)過量50倍的EcoRI接頭(Invitrogen,美國)連接。根據(jù)制造商的指導,用限制酶NotI(New England Biolabs,美國)切割cDNA,然后用瓊脂糖凝膠電泳將cDNA按大小分級。將對應于700bp及更大的cDNA從凝膠上切下并用GFX DNA分離試劑盒(AP Biotech)純化。然后通過連接反應將制備好的cDNA定向克隆到EcoRI-NotI切割的pMHas5中。通過電穿孔將連接混合物導入DH10B細胞(Invitrogen)后,鋪到含50mg/升卡那霉素的LB瓊脂上。從原先的cDNA-pMHas5載體連接產物的總共30,000個轉化體制備cDNA質粒池(pool)。根據(jù)Qiagen的質粒DNA分離操作規(guī)程(Qiagen Inc.GMBH),從固體LB卡那霉素選擇培養(yǎng)基上回收的菌落的池中直接制備質粒DNA。
用于克隆的載體是pMhas5,其在專利WO 03/044049中有記載,具有下面的特征特征部位 描述CDS 365-1156 卡那霉素抗性CDS 2232-2387 β-半乳糖苷酶α肽-10信號 2189-2192 SD序列啟動子 2101-2189 Lac啟動子多樣性特征 626-650BACE系統(tǒng)的KanP1引物該質粒值得注意的特征是Lac啟動子的SD區(qū)域附近的EcoRI-NotI限制位點。它使得帶EcoRI-NotI接頭的cDNA能夠被克隆到載體中,且使所得的構建體在大腸桿菌宿主中能夠被活躍地轉錄和翻譯。
B.轉座子的構建和制備如WO 01/77315 A1所述的,轉座子協(xié)助信號捕捉(Transposon AssistedSignal Trapping,TAST)的基本原理是,將所選的基因組中所有的基因通過轉座子標簽與編碼無信號的β-內酰胺酶的基因相融合。這樣,當在含有氨芐青霉素的培養(yǎng)基中培養(yǎng)包含通過轉座子標簽與編碼無信號的β-內酰胺酶的基因融合的基因組的基因的宿主細胞克隆時,只有表達和分泌β-內酰胺酶的那些克隆能夠生存。但是,只有在與β-內酰胺酶基因融合的基因具有能夠被宿主株系識別的完整啟動子和核糖體結合位點(即,在真實的生命過程中被細胞表達產生多肽的基因),而且β-內酰胺酶被這樣翻譯,使得合成的多肽被轉運穿過細胞質膜并正確地折疊的條件下,β-內酰胺酶才會被分泌。因此,當將融合的基因插入到選擇的宿主細胞時,那些氨芐青霉素抗性的克隆就含有編碼功能性分泌多肽的基因。
通常,使用TAST方法時甚至不需要表達整個基因。當給基因加上轉座子標簽時,這些基因的N末端部分作為融合蛋白表達,就顯示這些基因含有完整的轉錄、翻譯和分泌序列。因此,通常認為這些基因的N末端部分作為融合蛋白的表達足以保證整個基因的表達和分泌。
因此可以下結論通過TAST方法得到的基因確實編碼分泌的功能性多肽。
含β-內酰胺酶報道基因的SigA4轉座子的構建按照WO 01/77315 A1的指導,使用標準分子生物學技術構建含有無信號β-內酰胺酶基因的轉座子。首先,使用具有校正活性的(proofreading)聚合酶(Pfu Turbo,Stratagene,美國)從pUC19載體PCR擴增無信號β-內酰胺酶基因。所得的PCR片段含有NotI和EcoRI限制性位點以便于克隆。含有Entranceposon和抗生素抗性標記CAT(在轉座子中編碼氯霉素抗性)的質粒pEntranceposon(Camr)是從Finnzymes,OY獲得的(Espoo芬蘭)。用限制酶NotI和EcoRI消化該質粒,凝膠純化后與含有無信號的β-內酰胺酶的片段連接。將連接產物轉化到電轉化感受態(tài)(electro-competent)的DH10B細胞中,通過限制性分析鑒定含有帶有所述無信號的β-內酰胺酶的質粒的大腸桿菌克隆,并命名為SigA2。
為制備轉座子,構建了較小的SigA2衍生物,其缺乏編碼β-內酰胺酶的bla基因使用結合到SigA2的bla基因的起始和終止處,且方向向外的兩個寡核苷酸引物SigA2NotU-P 5′-TCG CGA TCC GTT TTC GCA TTTATC GTG AAA CGC T-3′(SEQ ID NO43)和SigA2NotD-P 5′-CCG CAAACG CTG GTG AAA GTA AAA GAT GCT GAA-3′(SEQ ID NO44)來PCR擴增沒有bla基因的SigA2。該PCR反應產生的大約3.6kb的擴增產物經過重新連接(relegate)后轉化到合適的大腸桿菌菌株中。從能在LB氯霉素但不能在LB氨芐青霉素上生長的轉化體中分離了3.6kb的質粒。該質粒保留了所有兩個BglII位點并缺少活性的blg基因,被稱為pSig4。
60微升濃度為0.3μg/μl的pSigA4質粒DNA制備物用BglII消化并在瓊脂糖凝膠上分離。將2kb的SigA2轉座子DNA條帶洗脫下來,并根據(jù)供貨商的指導,用“GFXTMPCR、DNA和凝膠條帶純化試劑盒”(PCR,DNA andGel Band Purification Kit)(Amersham Pharmacia Biotech Inc.美國)純化,用200微升EB緩沖液洗脫。這樣制備的SigA2可以用于轉座子協(xié)助信號捕捉(TAST,見下文)。
C.轉座子標簽從pSigA4制備的轉座子帶有5’截短的bla基因,該基因編碼除去了分泌信號的β-內酰胺酶。β-內酰胺酶只有在被分泌到周質時才能賦予大腸桿菌氨芐青霉素抗性,而β-內酰胺酶的細胞質表達不能賦予氨芐青霉素抗性。如果沒有信號序列,β-內酰胺酶將不會被轉運到周質中,從而克隆也就不會在含有氨芐青霉素的培養(yǎng)基上生長。無信號的β-內酰胺酶基因以這樣的方式包含在轉座子中,使得轉座子的邊界和β-內酰胺酶編碼區(qū)域之間存在連續(xù)的開放閱讀框。這樣,被改變的轉座子當轉座到編碼分泌的蛋白質的基因中時,可以導致與目標基因的共閱讀框(in-frame)的融合。這樣就導致分泌到大腸桿菌周質并賦予氨芐青霉素抗性的融和基因產物的產生。而如果轉座子整合到編碼非分泌蛋白的基因中,即使是共閱讀框的,相應的宿主也不會成為氨芐青霉素抗性。
D.Botryosphaeria rhodina的轉座子協(xié)助信號捕捉關于轉座子協(xié)助信號捕捉的完整描述可以在WO 01/77315中找到。從最初的cDNA-pMHas5載體連接產物的總共30,000個轉化體構建了cDNA質粒池。根據(jù)Qiagen的質粒DNA分離操作規(guī)程(Qiagen Inc.),從固體LB卡那霉素選擇培養(yǎng)基上回收的菌落的池中直接制備質粒DNA。根據(jù)轉座酶制造商的指導(Finnizyme,F(xiàn)inland),用轉座子SigA2和MuA轉座酶處理質粒池。
為了給Botryosphaeria rhodina CBS 274.96 cDNA文庫加轉座子標簽,將含有約2.6微克的DNA的SigA2轉座子4或8微升,與質粒池DNA的DNA濃度的Botryosphaeria rhodina CBS 274.96 cDNA文庫1微升,F(xiàn)innzymesMuA轉座酶2微升(0.22微克/微升),和5x緩沖液(來自Finnzymes OY,Espoo,芬蘭)5微升在50微升的總體積中混合,并在30℃溫育3.5小時,然后在75℃熱失活10min。加入5微升3M乙酸鈉pH5和110微升96%乙醇,并在20000rpm離心30min使DNA沉淀。洗滌沉淀并干燥,然后在10微升TE緩沖液中重懸。
在Biorad基因脈沖設備(50μF,20mAmp,1.8kV)中,1.5微升的加有轉座子標簽的質粒池通過電穿孔導入20微升的DH10B超感受態(tài)(ultra-competent)細胞,根據(jù)隨該細胞提供的標準操作規(guī)程(Gibco-BRL)進行。將電穿孔的細胞在振蕩下溫育在SOC培養(yǎng)基中(28℃,2小時,250rpm),然后鋪在選擇培養(yǎng)基上。使用了3種瓊脂培養(yǎng)基LB+50mg/ml卡那霉素,LB+卡那霉素+15mg/ml氯霉素和/或LB+卡那霉素+氯霉素+12.5mg/ml氨芐青霉素。
通過將電穿孔產物稀釋并鋪在LB+卡那霉素+氯霉素培養(yǎng)基上,確定了每份電穿孔物大約存在72,000個含有帶SigA2轉座子的cDNA文庫質粒的菌落,且在三重選擇(LB、卡那霉素、氯霉素、氨芐青霉素)下,大約回收了69個菌落。進一步進行電穿孔和鋪板實驗,直到在三重選擇下從實驗中總共回收445個菌落。根據(jù)Qiagen Qiaturbo96操作規(guī)程(Qiagen Inc.美國)對這些菌落進行質粒小量提取(miniprep)。根據(jù)國際專利申請WO 01/77315的實施例中公開的方法(第28頁),用轉座子正向和反向引物(引物A和B)對質粒測序。
引物AAGCGT TTGCG GCCGC GATCC(SEQ ID NO45)引物BTTATT CGGTC GAAAA GGATC C(SEQ ID NO46)E.序列組裝和注釋用AB3700毛細管測序儀獲得反應物的DNA序列。修整這些序列以去除每個質粒的載體和轉座子序列及A和B引物讀取結果。由此得到225個組裝的序列,使用PhredPhrap程序(Brent Ewing,LaDeana Hillier,Michael C.Wendl和Phil Green;Base-calling of automated sequencer traces using phred I.Accuracy assessment;Genome Research;8175-185;1998;Brent Ewing和PhilGreen;Base-calling of automated se-quencer traces using phred II.Errorprobabilities;Genome Research 8186-194;1998)將它們分為148個毗連群(contigs)。然后使用BLASTX程序2.0a19MP-WashU[1998-7-14][構建Linux-x86 185144 30-Jul-1998](Gish,Warren 1994-1997-未公開;Gish,Warren和David J.States;Identification of protein coding regions by databasesimilarity search;Nat.Genet.3266-72;1993),將所有148個毗連群與可從標準公共DNA和蛋白質序列數(shù)據(jù)庫(TrEMBL,SWALL,PDB,EnsemblPep,GeneSeqP)獲得的序列比較。
所得的序列大部分是編碼完整的功能性多肽的功能性基因,如上所述其從氨芐青霉素抗性克隆獲得,用作人工分析的基礎。
為了確認所述菌落的氨芐青霉素抗性是β-內酰胺酶活性增加的結果,在10個cDNA上轉座子的到達位點(landing site)不同的信號捕捉克隆中測試了β-內酰胺酶活性。根據(jù)Invitrogen Life Technologies的操作規(guī)程將質粒DNA重新轉化到One Shot Top 10化學感受態(tài)大腸桿菌中,并將轉化混合物涂布在帶卡那霉素(50μg/ml)和氯霉素(10μg/ml)的LB瓊脂上。28℃下2天后,將菌落影印鋪板到LB卡那霉素、氯霉素和15(10μg/ml)氨芐青霉素的LB上。28℃下3天后,將真正生長的菌落(true growers)接種到含卡那霉素(50μg/ml)和氯霉素(10μg/ml)的10ml LB培養(yǎng)基中,37℃,275rpm溫育過夜。將過夜培養(yǎng)物按1∶100稀釋在新鮮的LB Kan/CAM培養(yǎng)基中并培養(yǎng)到OD600=0.5。離心收集細胞并用0.9%NaCl洗滌一次。將沉淀懸浮在超聲處理緩沖液(100mM Tris-HCl,2mM EDTA,pH 8.0)中,調節(jié)細胞數(shù)到光密度OD600=0.5,用Soniprep 150(MSE)以1.5μm的振幅超聲處理。將樣品在15,000rpm離心10min,將上清用于β-內酰胺酶測定。在塑料比色皿中,將上清與50μl nitrocefin生色β-內酰胺酶底物(1mg/ml,于50%DMSO;0.05M PO4緩沖液中)和0.1M PO4緩沖液混合到1ml,然后用3300pro分光光度計測量Abs482。結果如下所示表IX具有不同的Shine Dalgamo(SD)序列和ATG翻譯起始密碼子和之間的距離和轉座子到達位點的克隆β-內酰胺酶活性
上表說明了3個要點1)所有10個克隆中都可檢測到β-內酰胺酶活性。應當強調的是,相應的含有質粒的大腸桿菌轉化體對50mg/升氨芐青霉素選擇有抗性。這些事實共同顯示,所有10個克隆都產生由融合到β-內酰胺酶基因的帶轉座子標簽的cDNA的一部分組成的雜合蛋白,其中以提供具有β-內酰胺酶活性的肽的方式融合。
2)由于這10個克隆的cDNA被完全測序,SigA2轉座子在每個克隆中的到達位置得到了證實。這10個克隆都含有SigA2轉座子,其處于正確的方向和閱讀框中,以促使天然的被編碼蛋白的N末端與轉座子所編碼的β-內酰胺酶發(fā)生雜合融合。
3)在真核cDNA中,非翻譯的上游(5’UTR)前導序列的長度可在1bp到數(shù)百個堿基對之間變化。為了從大腸桿菌翻譯元件例如Shine-Dalgarno區(qū)域最優(yōu)地翻譯cDNA,ATG起始密碼子之前4到11個堿基對的最優(yōu)距離是最優(yōu)的。由上表可見,比最優(yōu)值長得多的5’UTR還是容許表達一些cDNA雜合體-β內酰胺酶融合蛋白,因為從樣品中的轉化大腸桿菌中觀察到了β-內酰胺酶活性。
所得的本發(fā)明的核苷酸序列是功能性基因編碼完整的功能性多肽,不但由于上述原因,而且因為它們是從氨芐青霉素抗性克隆獲得的。這里獲得的克隆是氨芐青霉素抗性的,因為加上轉座子標簽后,這些基因與無信號的β-內酰胺酶基因融合,無信號的β-內酰胺酶基因只有當與具有在宿主株中可被識別的完整啟動子和核糖體結合位點的基因融合時,才能被表達、翻譯、轉運穿過細胞質膜并正確地折疊。
因此,可以作結論,本發(fā)明的基因確實編碼活性的分泌的多肽。因為16個基因的序列分析顯示得到了與無信號的β-內酰胺酶基因的共閱讀框融合。另外,通過測定整個核苷酸序列,確證了這些基因的開放閱讀框的完整。
實施例2通過同源性確定酶活性通過與已知功能的基因或多肽比較,可以預測基因或被編碼的多肽的功能。分析了ADNA組和B多肽組序列與來自公共和內部數(shù)據(jù)庫的序列之間的相似性,以確定ADNA組和B多肽組序列的功能性。序列比較是用程序BLASTX2.0a19MP-WashU[1998-7-14]進行的。通過將ADNA組和B多肽組序列與其最接近的功能已知的序列進行仔細的人工序列比對,為預測這些基因和被編碼的多肽的功能提供了可能。即使在全體氨基酸的同一性低于40%,從而可能難以作出可靠的預測的情況下,通過仔細地分析并判讀催化位點和/或多肽序列的重要區(qū)域中的氨基酸殘基,預測ADNA組和B多肽組序列的功能也是可能的。如果已知序列的催化位點的氨基酸也存在于本發(fā)明的多肽中,同時具有足夠的全體氨基酸的同一性,就可以斷定該來自Botryosphaeriarhodina CBS 274.96的多肽與所述已知序列具有同樣的功能。
實施例3制備B多肽組多肽為了從絲狀真菌例如Botryosphaeria rhodina CBS 274.96的cDNA制備多肽,在酵母或另外的絲狀真菌中表達該cDNA是可行的。作為非窮舉性的例子,一種好的選擇是在米曲霉中表達。下面給出了怎樣在米曲霉中表達編碼木聚糖酶的cDNA(SEQ ID No3)。
使用表達質粒pDaU71。該質粒含有(1)構巢曲霉amdS基因,作為曲霉中的選擇標記;(2)酵母URA3基因,其被氨芐青霉素抗性基因隔斷,用于在大腸桿菌中選擇;(3)帶3個額外的amyR-位點的黑曲霉NA2啟動子(中性淀粉酶)+構巢曲霉TPI啟動子5′非翻譯部分的重疊,用于異源表達;和(4)黑曲霉AMG終止子。作為擴增Botryosphaeria rhodina cDNA文庫池的相關部分的模板,在PCR反應中使用下面的引物引物#166CGCGGATCCACCATGGTCTCCTTCAAGTCGATTC(SEQID NO47)引物#167CCGCTCGAGTTACTGCACGGTAATCGTAGC(SEQ ID NO47)使用下面的條件按照制造商的指示,使用Extensor Hi Fidelity Reddy Load DNA聚合酶PCR混合液(ABGene,英國)。
cDNA質粒池(1納克/微升)5微升引物#1661微升引物#1671微升PCR主混合液(master mix) 12.5微升去離子水7.5微升總體積 25微升將反應物轉入預熱到94℃的MJ Research DNA擴增儀中,然后進行下面的循環(huán)94℃ 2分鐘然后25個循環(huán)的94℃30秒53℃30秒72℃1分鐘然后72℃10分鐘用1%瓊脂糖凝膠分析5微升的產物以確認正確的大小并確定所得的PCR產物的量。根據(jù)制造商的指示(AP Pharma)用GFX純化所剩的20微升混合物。用40微升純化產物中的20微升在30微升標準的過夜消化反應體系中進行標準的BamHI-XhoI限制消化。然后再用GFX純化限制消化的產物,再將其與經過BamHI-XhoI限制消化并純化的pDau71進行標準的連接反應。將連接產物轉化到DH10B大腸桿菌細胞中(大腸桿菌DH10B或TOP10(可從Invitrogen獲得)在該表達載體的構建中可用作克隆宿主),并在LB氨芐青霉素培養(yǎng)基上鋪板。選擇10個轉化體進行質粒DNA純化,并對其測序以確定插入片段的序列完整性。選擇一個無PCR錯誤的克隆pPFJO47用于進一步研究。
如WO 00/39322所述構建米曲霉BECh2株(BECh2得自米曲霉JaL228,該菌株是如WO 98/12300所述以保藏的菌株米曲霉IFP4177為基礎構建的)。轉化和培養(yǎng)條件根據(jù)Christiansen等人,1988,Biotechnology 6,1419-1422及如WO 01/12794-A第63頁所述進行。進行一輪再分離后,用來自轉化體的孢子接種Nunc管中的10ml YP葡萄糖或YP麥芽糖,并將培養(yǎng)物在30℃下培育3天。
將來自上述10ml培養(yǎng)物的10微升上清樣品進行SDS凝膠電泳。用SYPRO Orange Protein Gel Stain(Molecular Probes)對凝膠染色。數(shù)種曲霉轉化體在SDS凝膠上具有顯著的條帶。通過在pH 6.0下進行AZCL-小麥阿拉伯木聚糖進一步分析這些陽性結果的木聚糖酶活性。在0.2M磷酸鈉鹽(Na-phosphate)緩沖液,pH 6.0+0.01%Triton-X 100中將底物即來自小麥的AZCL-阿拉伯木聚糖(Megazyme)制備為0.2%w/v的懸液。在Eppendorf熱混合儀(thermomixer)中將900微升的底物預熱到37℃。向底物中加入100微升來自重組宿主菌株Bech2的粗培養(yǎng)液上清或不同樣品并在最大速度下在37℃溫育15min。然后將反應混合物在冰上放置2分鐘,在用20,000xG離心1min。將2×200微升的上清轉移到微量滴定板并在OD590測量。測定吸光度的增加作為活性。
實施例4測定木聚糖酶活性活性的測定使用合適的緩沖液中的合成并分泌木聚糖酶的宿主株的培養(yǎng)液或細胞裂解物。將合適體積的這樣的樣品點到瓊脂平板上,瓊脂平板上含有不溶性的生色底物AZCL-Birch木聚糖(MegazymeTM)和合適的緩沖液,其pH為例如4.5-7.5。在合適的溫度,例如37℃下,將平板溫育合適的時間,例如一天。活性可見為點周圍的藍色的暈圈(halo)。
實施例5測定過氧化物酶活性過氧化物酶可以使用如Ishida等人1987所述的2,4-二氯苯酚方法(Ishida,A.,N.Futamura和T.Matsusaka.1987.Detection of peroxidaseacitvity and its localisation in the forespore envelopes of Bacillus cereus.J.Gen.Appl.Microbiol.3327-32.)用分光光度法來測定。作為指示劑,可以使用100mM磷酸鉀緩沖液(pH 7.0)中的1.0mM 2,4-二氯苯酚和82mM的4-氨基安替比林(aminoantipyrine)的混合物,合適的底物是100mM磷酸鉀緩沖液(pH 7.0)中的50mM過氧化氫(Sigma)。
將200微升合適地稀釋的培養(yǎng)液上清加入1ml塑料比色皿。加入200微升指示劑混合物。加入200微升過氧化氫底物啟動反應。用標準的分光光度計在510nm處測量吸光度的變化。
實施例6測量對纖維素降解酶或酶混合物的纖維素降解促進作用某些分泌的蛋白質在纖維素降解酶或其混合物存在下顯示纖維素降解的協(xié)同作用(synergistic action)。這些分泌的蛋白質本身可具有或不具有水解酶活性。在專利申請?zhí)朥S11/046,124和相應的2005年7月30日公布的PCT申請PCT/US2005/003525中可以找到這樣的分泌蛋白的例子和如何檢測它們的纖維素降解促進作用,特別是使用實施例24和25-28的任一項,在此將其引入供參考。
一種測定該促進作用的方法如下將合成并分泌纖維素酶促進性多肽的宿主株的培養(yǎng)液或細胞裂解物用裝有截留為10kDa的PM10膜的Amicon攪拌小室(Millipore,Billerica,MA)濃縮后,用Econo-Pac 10DG柱(BioRadLaboratories,Hercules,CA)脫鹽。用BCA(bicinchoninic acid,P.K.Smith等人1985,Anal.Biochem.15076)蛋白質測定試劑盒(Pierce,Rockford,IL)使用BSA作為標準測定蛋白濃度后,將這些多肽儲液保存在-20℃。對這些多肽不作進一步純化,并根據(jù)測得的總蛋白將儲液添加到反應混合物中。
在美國能源部國立可再生能源實驗室(U.S.Department of EnergyNational Renewable Energy Laboratory(NREL))用稀硫酸預處理玉米秸稈。預處理使用下面的條件1.4wt%的硫酸,165℃和107psi下8分鐘。根據(jù)NREL,預處理過的玉米秸稈(PCS)中的水不溶性固體含有56.5%纖維素,4.6%半纖維素和28.4%木質素。纖維素和半纖維素是使用NREL標準分析程序(NREL Standard Analytical Procedure)#002,進行二階段硫酸水解后,利用高效液相色譜測定進行糖分析而測定的。木質素是使用NREL標準分析程序#003,用硫酸水解纖維素和半纖維素級分后通過測量重量而測定的。在酶促水解前,在玻璃濾器上用大體積的去離子水”ish”所述PCS;得到水“ish”過的PCS的干重。通過在咖啡磨(coffee-grinder)中粉碎,然后在22μm的Millipore濾器(6P Express Membrane,Stericup,Millipore,Bedford,MA)上用去離子水“ish”,從水“ish”過的PCS制備粉碎的PCS。
PCS的水解是用1.1ml Immunoware小管(Pierce,Rockford,IL)進行的,所用的總反應體積為1.0ml。在該操作規(guī)程中,PCS(10mg/ml于50mM乙酸鈉pH 5.0緩沖液中)的水解,是在纖維素蛋白加樣量的3%的米曲霉β-葡糖苷酶(根據(jù)WO 02/095014在米曲霉中重組表達)的存在下,使用不同的蛋白質加樣量(表示為mg的酶每克PCS)的待測的本發(fā)明的多肽或Celluclast1.5L樣品(Novozymes A/S,Bagsvaerd,丹麥)來進行。本發(fā)明的多肽的PCS水解能力的篩選在50℃(Isotemp 10S水浴或TS Autoflow CO2夾層培養(yǎng)箱)下進行。通常,反應按一式四份進行并在水解過程中取等份樣品。通過混合20μl等份的每份水解物和180μl 0.11M NaOH(終止試劑)來終止PCS水解反應。對每份試樣作適當?shù)倪B續(xù)稀釋,并利用下述的適用于96孔微量培養(yǎng)板規(guī)格的對羥基苯甲酰肼(PHBAH,Sigma,St.Louis,MO)測定法測定還原糖含量。簡單地說,將90μl等份的適當稀釋的樣品置于96孔圓錐底微量培養(yǎng)板中。向各個孔中加入2%NaOH中的1.5%(w/v)PHBAH60μl。將板在95℃不加蓋加熱10分鐘。讓板冷卻到室溫(RT),然后向各個孔加入50μl蒸餾水。從每個孔轉移100μl等份到平底96孔板中,并用SpectraMax Microplate Reader(Molecular Devices,Sunnyvale,CA)測量A410nm的吸光度。用葡萄糖標準品(用0.4%氫氧化鈉稀釋的,0.1-0.0125mg/ml)制作標準曲線以將所得的A410nm值轉換為葡萄糖當量。用所得的當量計算每個反應的PCS纖維素轉化百分率。
纖維素轉化為還原糖的程度(轉化率,%)用下面的等式計算轉化率(%)=RS(mg/ml)*100*162/(纖維素(mg/ml)*180)=RS(mg/ml)*100/(纖維素(mg/ml)*1.111)在該式中,RS是以葡萄糖當量(mg/ml)量度的溶液中的還原糖濃度,因子1.111反映了纖維素轉化為葡萄糖的重量增加。
為了篩選能夠促進Celluclast1.5L性能的本發(fā)明的多肽,進行PCS水解反應(1.0ml的操作規(guī)程,10g PCS每升,50℃,加入總加樣量的3%的米曲霉β-葡糖苷酶),其中將2.5mg酶加樣量的Celluclast1.5L與2.5mg多肽加樣量的每個樣品(每個反應5mg酶加樣量的總蛋白)。測量了由10mg酶加樣量,5mg酶加樣量和2.5mg酶加樣量組成的Celluclast1.5L對照反應,并記錄它們的PCS纖維素轉化率用于比較。
實施例7 測定脂肪酶活性活性測量使用合適的緩沖液中的合成并分泌脂肪酶的宿主株的培養(yǎng)液或細胞裂解物。
脂肪酶測定(PNV測定)用移液器將20微升的稀釋緩沖液加到96孔微量培養(yǎng)板的各個孔中。向該稀釋緩沖液中加入5微升的樣品(上清)。測試開始時,向各個孔中加入200微升的底物,并將板裝到ELISA讀板器(能讀取96孔板的可編程的分光光度計)上。每30秒測量一次405nm的吸光度,測量10分鐘。用時間對abs405曲線的斜率作為任意活性單位。
稀釋緩沖液25ml 2M Tris/HCl pH 7.5,0.50ml 2M CaCl2,2.5ml 15%Brij 35,用水調節(jié)到500ml。
底物儲備溶液將0.1295g(117微升)的戊酸對硝基苯酯(p-Nitrophenylvalerate)SIGMA N 4377(密度1.11g/ml)溶于10ml甲醇中。在冷凍裝置中保存。
底物將100微升底物儲備溶液與10ml稀釋緩沖液混合。
實施例8 測定蛋白酶和肽酶活性在具有選定的肽酶活性最佳的pH緩沖液中的合成并分泌肽酶和/或蛋白酶的宿主株的培養(yǎng)液或細胞裂解物,其所述活性可以這樣測定將合適的樣品體積(例如20微升)點樣在瓊脂平板上,其中該瓊脂平板含有不溶性生色底物AZCL-酪蛋白(MegazymeTM)或AZCL-膠原(MegazymeTM)或Azocoll(Sigma-Aldrich),例如0.1%w/w的水平。在適合于肽酶起作用的溫度下,例如37℃下,將平板溫育合適的時間,例如1天。活性可見為點周圍的藍色暈圈。可以用非標記的膠原或非標記的酪蛋白來代替AZCL-酪蛋白和AZCL-膠原(MegazymeTM)。在被點樣到瓊脂平板的非標記的膠原或非標記的酪蛋白上,有肽酶和/或蛋白酶存在時形成清楚的區(qū)域。
實施例9 測定內切阿拉伯糖酶活性在具有選定的肽酶活性最佳的pH緩沖液中的合成并分泌阿拉伯糖酶的宿主株的培養(yǎng)液或細胞裂解物,其所述活性可以這樣測定將合適的樣品體積(例如20微升)點樣在瓊脂平板上,其中該瓊脂平板含有不溶性生色底物AZCL-阿拉伯聚糖,例如0.1%w/w水平。在適合于阿拉伯糖酶起作用的溫度下,例如37℃下,將平板溫育合適的時間,例如1天?;钚钥梢姙辄c周圍的藍色暈圈。
該測定可以在不同的pH下進行。在酸性pH下,可以通過將0.1g AZCL-阿拉伯聚糖(Mazurine染色的交聯(lián)底物,Megazyme,愛爾蘭)溶于100ml0.2M琥珀酸pH3+10微升Triton X-100(0.01%)得到0.1%AZCL-阿拉伯聚糖終濃度,來制備AZCL-阿拉伯聚糖。在中性pH下,可以通過將0.1g AZCL-阿拉伯聚糖(Mazurine染色的交聯(lián)底物,Megazyme,愛爾蘭)溶于50ml無菌水加10微升Triton X-100(0.01%)中來制備AZCL-阿拉伯聚糖。然后在該50ml AZCL底物中加入50ml 0.4M MOPS pH 7得到100ml的終體積,及0.2M緩沖液,0.1%AZCL的終濃度。
實施例10 測定β-葡糖苷酶活性許多β-葡糖苷酶可能對4-硝基苯基-β-D-吡喃葡萄糖苷或纖維二糖至少有一些活性,盡管這些可能不是它們的天然底物。用非常敏感的甲基傘形基(methyl-umbiliferyl)β-D-葡萄糖苷也可以發(fā)現(xiàn)活性。一般而言可以使用任何(1,4)-β-及(1,3)-β-寡葡萄糖苷(oligoglucosides)作為底物,通過Trinder測定系統(tǒng)(The Sigma Diagnostic Glucose(Trinder)Assay,Sigma,St.Louis,MO)測量釋放的葡萄糖,來評估β-葡糖苷酶活性。
一種測定β-葡糖苷酶活性的方法是制備合成并分泌阿拉伯糖酶的宿主株的培養(yǎng)液或細胞裂解物的制劑,使所述制劑含有大約6.9×10-6mg/ml的總蛋白,100mM檸檬酸鈉pH 5.0,0.01%Tween-20和4mM的對硝基苯基-β-D-吡喃葡萄糖苷。在50℃溫育該制劑,并在0.5、1、2、3、3.75和24小時取等份試樣。向各個等份試樣中加入1M碳酸鈉pH 10.0,然后由405nm的吸光度確定對硝基苯基陰離子的濃度。
另一種β-葡糖苷酶活性的方法是通過首先脫鹽(BioRad Econo-Pac10DG柱),然后濃縮(Centricon Plus-20,Biomax-5,5kD截留)到0.92mg/ml的濃度(BCA測定系統(tǒng)),來制備合成并分泌阿拉伯糖酶的宿主株的培養(yǎng)液或細胞裂解物的制劑。然后將該制劑以0.037和0.0092μg/ml總蛋白與100mM檸檬酸鈉pH 5.0加0.01%Tween-20中的10mM纖維二糖在65℃下溫育。在0.5,1,2,3,4,6和19小時取等份試樣。將等份試樣煮沸6分鐘以終止反應,然后使用Trinder測定系統(tǒng)(Sigma Chemical Co.,St.Louis,MO)和葡萄糖外標測定葡萄糖濃度。
實施例11 測定酯酶活性活性測定使用合適的緩沖液中的合成并分泌酯酶的宿主株的培養(yǎng)液或細胞裂解物。當選擇用于測定絲氨酸酯酶活性的底物時,應當優(yōu)先選擇在酯酶被底物飽和時的濃度下不形成膠束的底物,以獲得底物的最佳轉化率。
一種測試酯酶活性的方法是測量標準條件下,例如30℃、pH 7.0下,該酶水解三醋精的堿消耗,其中三醋精的濃度低于三醋精的CMC,堿消耗表示為時間的函數(shù)。酯酶水解三醋精會釋放乙酸,這就需要加入堿來維持pH恒定為7.0(恒定pH法),因此維持pH在7.0所需要的堿(通常以氫氧化鈉的形式)的量就是被水解的三醋精酯鍵的量度。
另一種測試酯酶活性的方式是測量酯酶水解PNP乙酸酯(乙酸對硝基苯酯)釋放有色的PNP。用移液器將20微升的稀釋緩沖液加到96孔微量滴定板的各個孔中。將5微升樣品(培養(yǎng)液上清或過濾的細胞裂解物)加入稀釋緩沖液中。在測定開始時向每個孔中加入200微升的底物并將板裝到ELISA讀板器(能讀取96孔板的可編程的分光光度計)上。每30秒測量一次405nm的吸光度,測量10分鐘。用時間對abs405曲線的斜率作為任意活性單位。
稀釋緩沖液25ml 2M Tris/HCl pH 7.5,0.50ml 2M CaCl2,2.5ml 15%Brij 35,用水調節(jié)到500ml。
底物儲備溶液將合適量的乙酸對硝基苯酯溶于10ml甲醇中。在冷凍裝置中保存。
底物將100微升底物儲備溶液與10ml稀釋緩沖液混合。
序列表<110>諾維信公司(Novozymes A/S)<120>BOTRYOSPHAERIA RHODINA的多肽<130>10543.000-dk<160>48<170>PatentIn version 3.2<210>1<211>930<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(927)<220>
<221>sig_peptide<222>(1)..(54)<220>
<221>mat_peptide<222>(55)..(927)<220>
<221>misc_feature<222>(55)..(162)<223>結構域CBM1<400>1atg cat cag aat tcc gcc ttg ttg ctg ctg gca gcc atc cca gcg acg48Met His Gln Asn Ser Ala Leu Leu Leu Leu Ala Ala Ile Pro Ala Thr-15 -10 -5tat gcc gcc gtc cct gcc tgg ggt cag tgc ggc ggt tcg ggc tat agt96Tyr Ala Ala Val Pro Ala Trp Gly Gln Cys Gly Gly Ser Gly Tyr Ser-1 1 5 10ggc gaa acc act tgt gta tct ggt tat acc tgc gtg act gta aac caa144Gly Glu Thr Thr Cys Val Ser Gly Tyr Thr Cys Val Thr Val Asn Gln15 20 25 30tgg tac tcc caa tgc cag caa gga tcc gca ggt ccc acc acc acg ctc192Trp Tyr Ser Gln Cys Gln Gln Gly Ser Ala Gly Pro Thr Thr Thr Leu35 40 45gcc aca gtc aca acc acg ggc agc ggc acc acg ccg agc tcg acc tct240Ala Thr Val Thr Thr Thr Gly Ser Gly Thr Thr Pro Ser Ser Thr Ser50 55 60ggc agc atc gat gcc aag ttc aag gcc aag gga aag aag tac ttt ggc288Gly Ser Ile Asp Ala Lys Phe Lys Ala Lys Gly Lys Lys Tyr Phe Gly65 70 75
gtg gcg acg gac cag ggc cga ctc acg agc ggg cag aac gcg gcc atc336Val Ala Thr Asp Gln Gly Arg Leu Thr Ser Gly Gln Asn Ala Ala Ile80 85 90atc aaa gcc gac ttt ggc cag gtc acg ccg gag aac agc atg aag tgg384Ile Lys Ala Asp Phe Gly Gln Val Thr Pro Glu Asn Ser Met Lys Trp95 100 105 110gac gcc acc gag cct tca cgc aac acg ttc acc ttc acg acg gcc gac432Asp Ala Thr Glu Pro Ser Arg Asn Thr Phe Thr Phe Thr Thr Ala Asp115 120 125tac ctg gtt gat tgg gcg acg acc aac gac aag ctg atc cgt ggc cac480Tyr Leu Val Asp Trp Ala Thr Thr Asn Asp Lys Leu Ile Arg Gly His130 135 140acg acc gtc tgg cac tcg cag ctg ccc acc tgg gtc tca agc atc acc528Thr Thr Val Trp His Ser Gln Leu Pro Thr Trp Val Ser Ser Ile Thr145 150 155gat aag gcc act ttg acg acc gtc atg cag aac cac atc gcc acc gaa576Asp Lys Ala Thr Leu Thr Thr Val Met Gln Asn His Ile Ala Thr Glu160 165 170atg ggt cgc tgg aag ggc aag atc tac gct tgg gat gtc gtc aac gag624Met Gly Arg Trp Lys Gly Lys Ile Tyr Ala Trp Asp Val Val Asn Glu175 180 185 190atc ttc aac gag gac ggc tca ttc agg tcc tcg gtc ttc tac aac gtc672Ile Phe Asn Glu Asp Gly Ser Phe Arg Ser Ser Val Phe Tyr Asn Val195 200 205ctc ggc gag gac ttt gtc cgc ctc gcc ttc gag gct gcg cgc gcc gcc720Leu Gly Glu Asp Phe Val Arg Leu Ala Phe Glu Ala Ala Arg Ala Ala210 215 220gac ccc aac gcc aag ctg tac atc aac gac tac aac ctc gac tcc gcc768Asp Pro Asn Ala Lys Leu Tyr Ile Asn Asp Tyr Asn Leu Asp Ser Ala225 230 235acc tac gcc aaa acc acc ggc ctg gac gtc acc aac tgc gtc ggc atc816Thr Tyr Ala Lys Thr Thr Gly Leu Asp Val Thr Asn Cys Val Gly Ile240 245 250acc gtt tgg ggc ctg cgc gac ccg gat agc tgg agg gcg agc agc acg864Thr Val Trp Gly Leu Arg Asp Pro Asp Ser Trp Arg Ala Ser Ser Thr255 260 265 270ccg ttg ctg ttt gat gcc gac ttc cag ccg aag gcc gcg tat acc gcc912Pro Leu Leu Phe Asp Ala Asp Phe Gln Pro Lys Ala Ala Tyr Thr Ala275 280 285att ttg aac agt ttg tag930Ile Leu Asn Ser Leu290<210>2<211>309<212>PRT
<213>Botryosphaeria rhodina<400>2Met His Gln Asn Ser Ala Leu Leu Leu Leu Ala Ala Ile Pro Ala Thr-15 -10 -5Tyr Ala Ala Val Pro Ala Trp Gly Gln Cys Gly Gly Ser Gly Tyr Ser-1 1 5 10Gly Glu Thr Thr Cys Val Ser Gly Tyr Thr Cys Val Thr Val Asn Gln15 20 25 30Trp Tyr Ser Gln Cys Gln Gln Gly Ser Ala Gly Pro Thr Thr Thr Leu35 40 45Ala Thr Val Thr Thr Thr Gly Ser Gly Thr Thr Pro Ser Ser Thr Ser50 55 60Gly Ser Ile Asp Ala Lys Phe Lys Ala Lys Gly Lys Lys Tyr Phe Gly65 70 75Val Ala Thr Asp Gln Gly Arg Leu Thr Ser Gly Gln Asn Ala Ala Ile80 85 90Ile Lys Ala Asp Phe Gly Gln Val Thr Pro Glu Asn Ser Met Lys Trp95 100 105 110Asp Ala Thr Glu Pro Ser Arg Asn Thr Phe Thr Phe Thr Thr Ala Asp115 120 125Tyr Leu Val Asp Trp Ala Thr Thr Asn Asp Lys Leu Ile Arg Gly His130 135 140Thr Thr Val Trp His Ser Gln Leu Pro Thr Trp Val Ser Ser Ile Thr145 150 155Asp Lys Ala Thr Leu Thr Thr Val Met Gln Asn His Ile Ala Thr Glu160 165 170Met Gly Arg Trp Lys Gly Lys Ile Tyr Ala Trp Asp Val Val Asn Glu175 180 185 190Ile Phe Asn Glu Asp Gly Ser Phe Arg Ser Ser Val Phe Tyr Asn Val195 200 205Leu Gly Glu Asp Phe Val Arg Leu Ala Phe Glu Ala Ala Arg Ala Ala210 215 220Asp Pro Asn Ala Lys Leu Tyr Ile Asn Asp Tyr Asn Leu Asp Ser Ala225 230 235Thr Tyr Ala Lys Thr Thr Gly Leu Asp Val Thr Asn Cys Val Gly Ile240 245 250Thr Val Trp Gly Leu Arg Asp Pro Asp Ser Trp Arg Ala Ser Ser Thr255 260 265 270Pro Leu Leu Phe Asp Ala Asp Phe Gln Pro Lys Ala Ala Tyr Thr Ala
275 280 285Ile Leu Asn Ser Leu290<210>3<211>663<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(663)<220>
<221>sig_peptide<222>(1)..(57)<220>
<221>mat_peptide<222>(58)..(663)<400>3atg gtc tcc ttc aag tcg att ctt ctc act ctc acc gcc gct gcc agc48Met Val Ser Phe Lys Ser Ile Leu Leu Thr Leu Thr Ala Ala Ala Ser-15 -10 -5gtc ttc tcc gcc ccg acc cct gag gcg ggc gag ctg atc gcg agg cag96Val Phe Ser Ala Pro Thr Pro Glu Ala Gly Glu Leu Ile Ala Arg Gln-1 1 5 10aac acg cca agc ggc acc ggc acg cac aac ggc tac ttc tat tcc ttc144Asn Thr Pro Ser Gly Thr Gly Thr His Asn Gly Tyr Phe Tyr Ser Phe15 20 25tgg acc gac ggt gct ggc cag gtg acc tac acc aac ggc gct ggt ggt192Trp Thr Asp Gly Ala Gly Gln Val Thr Tyr Thr Asn Gly Ala Gly Gly30 35 40 45teg tac agc gtg acg tgg tcc ggc aac gcc ggc aac tgg gtt ggc ggc240Ser Tyr Ser Val Thr Trp Ser Gly Asn Ala Gly Asn Trp Val Gly Gly50 55 60aag gga tgg cag acg ggc agc gcc agg acg atc aac tac tcg ggc acc288Lys Gly Trp Gln Thr Gly Ser Ala Arg Thr Ile Asn Tyr Ser Gly Thr65 70 75tac aac ccc aac ggc aac tcg tac ctc gcc gtg tac ggc tgg tcg cgc336Tyr Asn Pro Asn Gly Asn Ser Tyr Leu Ala Val Tyr Gly Trp Ser Arg80 85 90aac ccg ctg gtg gag tac tac atc gtc gag tcg tac ggc acg tac aac384Asn Pro Leu Val Glu Tyr Tyr Ile Val Glu Ser Tyr Gly Thr Tyr Asn95 100 105ccg ggc tcg ggc ggc acc aag aag ggc acg gtc acg tcg gac ggc ggc432Pro Gly Ser Gly Gly Thr Lys Lys Gly Thr Val Thr Ser Asp Gly Gly110 115 120 125
acc tac gac atc tac gtg agc acc cgc acc aac gcg ccc agc atc gac480Thr Tyr Asp Ile Tyr Val Ser Thr Arg Thr Asn Ala Pro Ser Ile Asp130 135 140ggc acc cag acc ttc cag cag tac tgg tcc gtg cgc cag tcc aag cgc528Gly Thr Gln Thr Phe Gln Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg145 150 155gtc ggc ggc acc gtg acg acc aag aac cac ttc gat gcc tgg gcc gcc576Val Gly Gly Thr Val Thr Thr Lys Asn His Phe Asp Ala Trp Ala Ala160 165 170gtt ggc ctt aac ctg ggc act ttc gac tac cag atc gtc gct acc gag624Val Gly Leu Asn Leu Gly Thr Phe Asp Tyr Gln Ile Val Ala Thr Glu175 180 185ggc tac cag agc agc ggg tcg gct acg att acc gtg cag663Gly Tyr Gln Ser Ser Gly Ser Ala Thr Ile Thr Val Gln190 195 200<210>4<211>221<212>PRT<213>Botryosphaeria rhodina<400>4Met Val Ser Phe Lys Ser Ile Leu Leu Thr Leu Thr Ala Ala Ala Ser-15 -10 -5Val Phe Ser Ala Pro Thr Pro Glu Ala Gly Glu Leu Ile Ala Arg Gln-1 1 5 10Asn Thr Pro Ser Gly Thr Gly Thr His Asn Gly Tyr Phe Tyr Ser Phe15 20 25Trp Thr Asp Gly Ala Gly Gln Val Thr Tyr Thr Asn Gly Ala Gly Gly30 35 40 45Ser Tyr Ser Val Thr Trp Ser Gly Asn Ala Gly Asn Trp Val Gly Gly50 55 60Lys Gly Trp Gln Thr Gly Ser Ala Arg Thr Ile Asn Tyr Ser Gly Thr65 70 75Tyr Asn Pro Asn Gly Asn Ser Tyr Leu Ala Val Tyr Gly Trp Ser Arg80 85 90Asn Pro Leu Val Glu Tyr Tyr Ile Val Glu Ser Tyr Gly Thr Tyr Asn95 100 105Pro Gly Ser Gly Gly Thr Lys Lys Gly Thr Val Thr Ser Asp Gly Gly110 115 120 125Thr Tyr Asp Ile Tyr Val Ser Thr Arg Thr Asn Ala Pro Ser Ile Asp130 135 140Gly Thr Gln Thr Phe Gln Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg145 150 155
Val Gly Gly Thr Val Thr Thr Lys Asn His Phe Asp Ala Trp Ala Ala160 165 170Val Gly Leu Asn Leu Gly Thr Phe Asp Tyr Gln Ile Val Ala Thr Glu175 180 185Gly Tyr Gln Ser Ser Gly Ser Ala Thr Ile Thr Val Gln190 195 200<210>5<211>1113<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(1110)<220>
<221>misc_feature<222>(1)..(1110)<223>前肽<220>
<221>transit_peptide<222>(1)..(54)<220>
<221>mat_peptide<222>(55)..(1110)<400>5atg gtc gct atc aac tac ctc gca acc ctg gcc ctg gcg gcc tca gca48Met Val Ala Ile Asn Tyr Leu Ala Thr Leu Ala Leu Ala Ala Ser Ala-15 -10 -5agc gcc atc ccc atg gac tcc cgc ctg gaa gcg cgc caa agc ttc tcc96Ser Ala Ile Pro Met Asp Ser Arg Leu Glu Ala Arg Gln Ser Phe Ser-1 1 5 10atc ccc ggc atc ggc gga cag acc gcc aac gac gtg cag tcc ggt acc144Ile Pro Gly Ile Gly Gly Gln Thr Ala Asn Asp Val Gln Ser Gly Thr15 20 25 30tgc aag gac gtg acg tac atc ttc gcg cgg ggc acg acg gag cag ggc192Cys Lys Asp Val Thr Tyr Ile Phe Ala Arg Gly Thr Thr Glu Gln Gly35 40 45aac atg ggc agc acg gtc ggg ccg gcg ctg aag acg aag ctg gag gcg240Asn Met Gly Ser Thr Val Gly Pro Ala Leu Lys Thr Lys Leu Glu Ala50 55 60gcc atc ggc gcc gac aag ctc gcg acg cag ggc gtc aac tac ccg gcc288Ala Ile Gly Ala Asp Lys Leu Ala Thr Gln Gly Val Asn Tyr Pro Ala65 70 75gac gtg gcg ggc acc gtc gtc ggc agc atg tca ccc ggc cag gcc gag336Asp Val Ala Gly Thr Val Val Gly Ser Met Ser Pro Gly Gln Ala Glu
80 85 90ggc agc aag aac tgc gcg cag ctg gtc aaa cag gct ttg tcc aac tgc384Gly Ser Lys Asn Cys Ala Gln Leu Val Lys Gln Ala Leu Ser Asn Cys95 100 105 110ccg cag acc aag atc gtg ctg gcc ggc tac tcg cag ggc gcg cag cag432Pro Gln Thr Lys Ile Val Leu Ala Gly Tyr Ser Gln Gly Ala Gln Gln115 120 125gtc cac ggc tgc ctc atc gat ttg agc gcc gat gag gcg cag aag gtc480Val His Gly Cys Leu Ile Asp Leu Ser Ala Asp Glu Ala Gln Lys Val130 135 140gcg gcc gcc gtc acc ttc ggc gac ccc ctg cgg gcg cag cag ttc aag528Ala Ala Ala Val Thr Phe Gly Asp Pro Leu Arg Ala Gln Gln Phe Lys145 150 155aac atc gac cag tcg cgc acc aag atc ttc tgc gcc acc ggc gac ctc576Asn Ile Asp Cln Ser Arg Thr Lys Ile Phe Cys Ala Thr Gly Asp Leu160 165 170gtc tgc acc aac cag ttc atc atc acg gcc gcc cac ctc tcc tat gcc624Val Cys Thr Asn Gln Phe Ile Ile Thr Ala Ala His Leu Ser Tyr Ala175 180 185 190tcc gag tcc acc ggc ccg gcc gcc gag ttc atc cag cag cag ctg ggc672Ser Glu Ser Thr Gly Pro Ala Ala Glu Phe Ile Gln Gln Gln Leu Gly195 200 205act ctc gac tcc tct tct tcc tcg tcc aac agc tcg tcg tcg acg acg720Thr Leu Asp Ser Ser Ser Ser Ser Ser Asn Ser Ser Ser Ser Thr Thr210 215 220acg gcg tca act tcc gct gac agc agc gcc acc agt acc ggc tcg tcc768Thr Ala Ser Thr Ser Ala Asp Ser Ser Ala Thr Ser Thr Gly Ser Ser225 230 235gac agc agc gtt gcc tcg tct ggc cta ggc tcc ggg ctt ctc ggt ggc816Asp Ser Ser Val Ala Ser Ser Gly Leu Gly Ser Gly Leu Leu Gly Gly240 245 250ggc ttg agt ggc ttg acc ggt ggc ggt tcc agc ggt ggt tcg agt ctg864Gly Leu Ser Gly Leu Thr Gly Gly Gly Ser Ser Gly Gly Ser Ser Leu255 260 265 270ctc agc ggc ttg agc ggt etg agt gga agt gat tcc agc agc agt ggc912Leu Ser Gly Leu Ser Gly Leu Ser Gly Ser Asp Ser Ser Ser Ser Gly275 280 285ggt tcg agc ctc ctg agt gga ttg agc gga ttg agc ggg agc agc ggt960Gly Ser Ser Leu Leu Ser Gly Leu Ser Gly Leu Ser Gly Ser Ser Gly290 295 300tcc agc gac agc ggt tcg agc atg ctt ggc ggg ctc agc ggt ctc agt1008Ser Ser Asp Ser Gly Ser Ser Met Leu Gly Gly Leu Ser Gly Leu Ser305 310 315ggg ctt agc ggg ctg gga gga tcg tcg agc ggc gga tcg ggc ctc atg1056
Gly Leu Ser Gly Leu Gly Gly Ser Ser Ser Gly Gly Ser Gly Leu Met320 325 330agc ggt ttg agc ggt ctg agt ggc ctg agc ggc ctt ggg ggc tcg aag1104Ser Gly Leu Ser Gly Leu Ser Gly Leu Ser Gly Leu Gly Gly Ser Lys335 340 345 350aag aac tga1113Lys Asn<210>6<211>370<212>PRT<213>Botryosphaeria rhodina<400>6Met Val Ala Ile Asn Tyr Leu Ala Thr Leu Ala Leu Ala Ala Ser Ala-15 -10-5Ser Ala Ile Pro Met Asp Ser Arg Leu Glu Ala Arg Gln Ser Phe Ser-1 1 5 10Ile Pro Gly Ile Gly Gly Gln Thr Ala Asn Asp Val Gln Ser Gly Thr15 20 25 30Cys Lys Asp Val Thr Tyr Ile Phe Ala Arg Gly Thr Thr Glu Gln Gly35 40 45Asn Met Gly Ser Thr Val Gly Pro Ala Leu Lys Thr Lys Leu Glu Ala50 55 60Ala Ile Gly Ala Asp Lys Leu Ala Thr Gln Gly Val Asn Tyr Pro Ala65 70 75Asp Val Ala Gly Thr Val Val Gly Ser Met Ser Pro Gly Gln Ala Glu80 85 90Gly Ser Lys Asn Cys Ala Gln Leu Val Lys Gln Ala Leu Ser Asn Cys95 100 105 110Pro Gln Thr Lys Ile Val Leu Ala Gly Tyr Ser Gln Gly Ala Gln Gln115 120 125Val His Gly Cys Leu Ile Asp Leu Ser Ala Asp Glu Ala Gln Lys Val130 135 140Ala Ala Ala Val Thr Phe Gly Asp Pro Leu Arg Ala Gln Gln Phe Lys145 150 155Asn Ile Asp Gln Ser Arg Thr Lys Ile Phe Cys Ala Thr Gly Asp Leu160 165 170Val Cys Thr Asn Gln Phe Ile Ile Thr Ala Ala His Leu Ser Tyr Ala175 180 185 190Ser Glu Ser Thr Gly Pro Ala Ala Glu Phe Ile Gln Gln Gln Leu Gly195 200 205
Thr Leu Asp Ser Ser Ser Ser Ser Ser Asn Ser Ser Ser Ser Thr Thr210 215 220Thr Ala Ser Thr Ser Ala Asp Ser Ser Ala Thr Ser Thr Gly Ser Ser225 230 235Asp Ser Ser Val Ala Ser Ser Gly Leu Gly Ser Gly Leu Leu Gly Gly240 245 250Gly Leu Ser Gly Leu Thr Gly Gly Gly Ser Ser Gly Gly Ser Ser Leu255 260 265 270Leu Ser Gly Leu Ser Gly Leu Ser Gly Ser Asp Ser Ser Ser Ser Gly275 280 285Gly Ser Ser Leu Leu Ser Gly Leu Ser Gly Leu Ser Gly Ser Ser Gly290 295 300Ser Ser Asp Ser Gly Ser Ser Met Leu Gly Gly Leu Ser Gly Leu Ser305 310 315Gly Leu Ser Gly Leu Gly Gly Ser Ser Ser Gly Gly Ser Gly Leu Met320 325 330Ser Gly Leu Ser Gly Leu Ser Gly Leu Ser Gly Leu Gly Gly Ser Lys335 340 345 350Lys Asn<210>7<211>1350<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(1347)<220>
<221>misc_feature<222>(1)..(1347)<223>前肽<220>
<221>transit_peptide<222>(1)..(54)<220>
<221>mat_peptide<222>(55)..(1347)<400>7atg cat ttg tcc agt gtt tgt ctc gtc ctc agt ggg ctt ctc ctt acc48Met His Leu Ser Ser Val Cys Leu Val Leu Ser Gly Leu Leu Leu Thr-15 -10 -5aac gct gcc cca gcc cct gtc cct gaa aat ggg ctc gag aag agg cag96
Asn Ala Ala Pro Ala Pro Val Pro Glu Asn Gly Leu Glu Lys Arg Gln-1 1 5 10tcc ctg agc agc gtc ctg agc gcc ctc agt ggc ctg acc gaa cct acg144Ser Leu Ser Ser Val Leu Ser Ala Leu Ser Gly Leu Thr Glu Pro Thr15 20 25 30gcc atc ttg tct cag ctc gag gcg gtt gaa gcg aca tcg acg ccc acc192Ala Ile Leu Ser Gln Leu Glu Ala Val Glu Ala Thr Ser Thr Pro Thr35 40 45agc gtc gag cag gcg cag gag cag ctc gag gcc atc tac ggg acg aca240Ser Val Glu Gln Ala Gln Glu Gln Leu Glu Ala Ile Tyr Gly Thr Thr50 55 60cca acc aac atc ttc gag aac atc gcg cag caa atc gcc gac gga ctg288Pro Thr Asn Ile Phe Glu Asn Ile Ala Gln Gln Ile Ala Asp Gly Leu65 70 75tcg acg ctg acc atc gtc caa gcc ctc ggc ttc tcc ccc agc ggc gag336Ser Thr Leu Thr Ile Val Gln Ala Leu Gly Phe Ser Pro Ser Gly Glu80 85 90aac tcg gaa acc aac agc aac acg cgc gaa ccg tcg acg acc atc tac384Asn Ser Glu Thr Asn Ser Asn Thr Arg Glu Pro Ser Thr Thr Ile Tyr95 100 105 110ccc aag aag tcg tcc tcg gat gcc ccc tat tcc atc act gag gaa gag432Pro Lys Lys Ser Ser Ser Asp Ala Pro Tyr Ser Ile Thr Glu Glu Glu115 120 125ctc cgc caa gcc atc tac atc ccc tcc gac ttc acg tac ggc gac aag480Leu Arg Gln Ala Ile Tyr Ile Pro Ser Asp Phe Thr Tyr Gly Asp Lys130 135 140ccg ccg gtc atc ttc gtg ccg ggc acg ggc tcg tac ggc ggc atc agc528Pro Pro Val Ile Phe Val Pro Gly Thr Gly Ser Tyr Gly Gly Ile Ser145 150 155ttc gga tcg aac ctg cgc aag ctg ctg acg ggc gtg tcg tac gcg gac576Phe Gly Ser Asn Leu Arg Lys Leu Leu Thr Gly Val Ser Tyr Ala Asp160 165 170ccg gtc tgg ctc aac gtg ccg gac gcg ctg ctg cgc gac gcg cag acg624Pro Val Trp Leu Asn Val Pro Asp Ala Leu Leu Arg Asp Ala Gln Thr175 180 185 190aac ggc gag ttc gtg gcg tac gcc atc aac tac atc tcg ggc ata tcc672Asn Gly Glu Phe Val Ala Tyr Ala Ile Asn Tyr Ile Ser Gly Ile Ser195 200 205ggc gac gcc aac gtg tcg gtc gtc tcg tgg tcg cag ggc ggg ctg gac720Gly Asp Ala Asn Val Ser Val Val Ser Trp Ser Gln Gly Gly Leu Asp210 215 220acg cag tgg gct ttt act tat tgg ccg tcg acg cgc gcc ctg gtc tct768Thr Gln Trp Ala Phe Thr Tyr Trp Pro Ser Thr Arg Ala Leu Val Ser225 230 235
gac ttc gtg ccc gtc agc ccg gac ttc cac ggc acc gtc ctg gcc aac816Asp Phe Val Pro Val Ser Pro Asp Phe His Gly Thr Val Leu Ala Asn240 245 250gtc atc tgc ctc aac ccg ggc gcc ggc ggt gtt ggg ttg ggc ccc tgc864Val Ile Cys Leu Asn Pro Gly Ala Gly Gly Val Gly Leu Gly Pro Cys255 260 265 270gcg ccg gcg gtg ctg cag cag gag tac aac agc aac ttc gtc acg gcc912Ala Pro Ala Val Leu Gln Gln Glu Tyr Asn Ser Asn Phe Val Thr Ala275 280 285ctg cgc gcg gcg ggc ggt gcg gac gct tac gtg ccg acg acg tct gtt960Leu Arg Ala Ala Gly Gly Ala Asp Ala Tyr Val Pro Thr Thr Ser Val290 295 300ttc tct ggc ttc ctc gat gag att gtc cag ccg cag tcc ggc acc ggc1008Phe Ser Gly Phe Leu Asp Glu Ile Val Gln Pro Gln Ser Gly Thr Gly305 310 315gcg tcc gcg tac atc aat gat gct agg ggt gtg ggc acg acc aat gct1056Ala Ser Ala Tyr Ile Asn Asp Ala Arg Gly Val Gly Thr Thr Asn Ala320 325 330gag gtg cag gtc gtg tgc aag ggc aag ggt ccc gct ggc ggt ttt tac1104Glu Val Gln Val Val Cys Lys Gly Lys Gly Pro Ala Gly Gly Phe Tyr335 340 345 350acg cac gag agc ttg ctg gtc aac ccg ctg acc tat gct ctc ctc gtc1152Thr His Glu Ser Leu Leu Val Asn Pro Leu Thr Tyr Ala Leu Leu Val355 360 365gat gcc ttg acc cat gat ggc ccg ggt agt gtg gac agg ctg gat ctg1200Asp Ala Leu Thr His Asp Gly Pro Gly Ser Val Asp Arg Leu Asp Leu370 375 380gat acc gtg tgc tcg acc gtc gtg gcg ccc ggc ctg ggg ctg gat gcg1248Asp Thr Val Cys Ser Thr Val Val Ala Pro Gly Leu Gly Leu Asp Ala385 390 395ttg ttg gag att gag ggc gtg aat gtt ctg gcc gct gtc aat ctg ttg1296Leu Leu Glu Ile Glu Gly Val Asn Val Leu Ala Ala Val Asn Leu Leu400 405 410acc tac tcg gac agg agg ttg gcc gag ccg gcg ctg atg tct tat gcg1344Thr Tyr Ser Asp Arg Arg Leu Ala Glu Pro Ala Leu Met Ser Tyr Ala415 420 425 430gct taa1350Ala<210>8<211>449<212>PRT<213>Botryosphaeria rhodina<400>8
Met His Leu Ser Ser Val Cys Leu Val Leu Ser Gly Leu Leu Leu Thr-15 -10 -5Asn Ala Ala Pro Ala Pro Val Pro Glu Asn Gly Leu Glu Lys Arg Gln-1 1 5 10Ser Leu Ser Ser Val Leu Ser Ala Leu Ser Gly Leu Thr Glu Pro Thr15 20 25 30Ala Ile Leu Ser Gln Leu Glu Ala Val Glu Ala Thr Ser Thr Pro Thr35 40 45Ser Val Glu Gln Ala Gln Glu Gln Leu Glu Ala Ile Tyr Gly Thr Thr50 55 60Pro Thr Asn Ile Phe Glu Asn Ile Ala Gln Gln Ile Ala Asp Gly Leu65 70 75Ser Thr Leu Thr Ile Val Gln Ala Leu Gly Phe Ser Pro Ser Gly Glu80 85 90Asn Ser Glu Thr Asn Ser Asn Thr Arg Glu Pro Ser Thr Thr Ile Tyr95 100 105 110Pro Lys Lys Ser Ser Ser Asp Ala Pro Tyr Ser Ile Thr Glu Glu Glu115 120 125Leu Arg Gln Ala Ile Tyr Ile Pro Ser Asp Phe Thr Tyr Gly Asp Lys130 135 140Pro Pro Val Ile Phe Val Pro Gly Thr Gly Ser Tyr Gly Gly Ile Ser145 150 155Phe Gly Ser Asn Leu Arg Lys Leu Leu Thr Gly Val Ser Tyr Ala Asp160 165 170Pro Val Trp Leu Asn Val Pro Asp Ala Leu Leu Arg Asp Ala Gln Thr175 180 185 190Asn Gly Glu Phe Val Ala Tyr Ala Ile Asn Tyr Ile Ser Gly Ile Ser195 200 205Gly Asp Ala Asn Val Ser Val Val Ser Trp Ser Gln Gly Gly Leu Asp210 215 220Thr Gln Trp Ala Phe Thr Tyr Trp Pro Ser Thr Arg Ala Leu Val Ser225 230 235Asp Phe Val Pro Val Ser Pro Asp Phe His Gly Thr Val Leu Ala Asn240 245 250Val Ile Cys Leu Asn Pro Gly Ala Gly Gly Val Gly Leu Gly Pro Cys255 260 265 270Ala Pro Ala Val Leu Gln Gln Glu Tyr Asn Ser Asn Phe Val Thr Ala275 280 285Leu Arg Ala Ala Gly Gly Ala Asp Ala Tyr Val Pro Thr Thr Ser Val290 295 300
Phe Ser Gly Phe Leu Asp Glu Ile Val Gln Pro Gln Ser Gly Thr Gly305 310 315Ala Ser Ala Tyr Ile Asn Asp Ala Arg Gly Val Gly Thr Thr Asn Ala320 325 330Glu Val Gln Val Val Cys Lys Gly Lys Gly Pro Ala Gly Gly Phe Tyr335 340 345 350Thr His Glu Ser Leu Leu Val Asn Pro Leu Thr Tyr Ala Leu Leu Val355 360 365Asp Ala Leu Thr His Asp Gly Pro Gly Ser Val Asp Arg Leu Asp Leu370 375 380Asp Thr Val Cys Ser Thr Val Val Ala Pro Gly Leu Gly Leu Asp Ala385 390 395Leu Leu Glu Ile Glu Gly Val Asn Val Leu Ala Ala Val Asn Leu Leu400 405 410Thr Tyr Ser Asp Arg Arg Leu Ala Glu Pro Ala Leu Met Ser Tyr Ala415 420 425 430Ala<210>9<211>555<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(555)<400>9atg cgc ttc gcc acc gcc gcc acc gcc ctc gcc ctc acc ggc ttc tgc48Met Arg Phe Ala Thr Ala Ala Thr Ala Leu Ala Leu Thr Gly Phe Cys1 5 10 15agc gcc gcc gtc ctg ccg cgc gcc acc gag cac aag gtc tac gtc gac96Ser Ala Ala Val Leu Pro Arg Ala Thr Glu His Lys Val Tyr Val Asp20 25 30act tcc aag tgc gcc gac aac ggc cgc acc ctg ccg cag atc tac ggc144Thr Ser Lys Cys Ala Asp Asn Gly Arg Thr Leu Pro Gln Ile Tyr Gly35 40 45atc tcc aac tcg acc tcg cag gac ttc acc gac ccg cag cgc ttc gac192Ile Ser Asn Ser Thr Ser Gln Asp Phe Thr Asp Pro Gln Arg Phe Asp50 55 60ggg ccc acc ttc acc ttc acc gtg ccc gcc tac tac cag ggc cac ctc240Gly Pro Thr Phe Thr Phe Thr Val Pro Ala Tyr Tyr Gln Gly His Leu65 70 75 80tgg ctg tac aac agc gac gac cag gcc gcc tcg agc ggt gac aac acc288
Trp Leu Tyr Asn Ser Asp Asp Gln Ala Ala Ser Ser Gly Asp Asn Thr85 90 95ccc ctg aac gtc cag ggc gtc gac ttc tac ttc tac gac cag ccc acc336Pro Leu Asn Val Gln Gly Val Asp Phe Tyr Phe Tyr Asp Gln Pro Thr100 105 110gac gtc gag cgc aac cag gcc acc gtg ccc gct gag ggc gac gcc aac384Asp Val Glu Arg Asn Gln Ala Thr Val Pro Ala Glu Gly Asp Ala Asn115 120 125cag gac ggc cag gtg tac agc gtt ccc gac ccc atc act gcc gtc cgc432Gln Asp Gly Gln Val Tyr Ser Val Pro Asp Pro Ile Thr Ala Val Arg130 135 140ttc gcc agc acc cct agc agc acc ttc atc gag ggc aag agc ggc ggg480Phe Ala Ser Thr Pro Ser Ser Thr Phe Ile Glu Gly Lys Ser Gly Gly145 150 155 160cac tct gta cag cac cca gga ggg cga cgc tct gta cgt cta cta ctg528His Ser Val Gln His Pro Gly Gly Arg Arg Ser Val Arg Leu Leu Leu165 170 175cga gga gtg gcc cgt cca gaa cta gag555Arg Gly Val Ala Arg Pro Glu Leu Glu180 185<210>10<211>185<212>PRT<213>Botryosphaeria rhodina<400>10Met Arg Phe Ala Thr Ala Ala Thr Ala Leu Ala Leu Thr Gly Phe Cys1 5 10 15Ser Ala Ala Val Leu Pro Arg Ala Thr Glu His Lys Val Tyr Val Asp20 25 30Thr Ser Lys Cys Ala Asp Asn Gly Arg Thr Leu Pro Gln Ile Tyr Gly35 40 45Ile Ser Asn Ser Thr Ser Gln Asp Phe Thr Asp Pro Gln Arg Phe Asp50 55 60Gly Pro Thr Phe Thr Phe Thr Val Pro Ala Tyr Tyr Gln Gly His Leu65 70 75 80Trp Leu Tyr Asn Ser Asp Asp Gln Ala Ala Ser Ser Gly Asp Asn Thr85 90 95Pro Leu Asn Val Gln Gly Val Asp Phe Tyr Phe Tyr Asp Gln Pro Thr100 105 110Asp Val Glu Arg Asn Gln Ala Thr Val Pro Ala Glu Gly Asp Ala Asn115 120 125Gln Asp Gly Gln Val Tyr Ser Val Pro Asp Pro Ile Thr Ala Val Arg
130 135 140Phe Ala Ser Thr Pro Ser Ser Thr Phe Ile Glu Gly Lys Ser Gly Gly145 150 155 160His Ser Val Gln His Pro Gly Gly Arg Arg Ser Val Arg Leu Leu Leu165 170 175Arg Gly Val Ala Arg Pro Glu Leu Glu180 185<210>11<211>702<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(7 02)<220>
<221>trahsit_peptide<222>(1)..(48)<220>
<221>misc_feature<222>(1)..(702)<223>前肽<220>
<221>mat_peptide<222>(49)..(702)<400>11atg aag ggt ctc ttc gct att ctt gcc acg gct tcg gtc gtc tct gcc48Met Lys Gly Leu Phe Ala Ile Leu Ala Thr Ala Ser Val Val Ser Ala-15 -10 -5 -1cac gcc acc tgg cag gag ctc tgg gtt ggt act gag gac aag gag gga96His Ala Thr Trp Gln Glu Leu Trp Val Gly Thr Glu Asp Lys Glu Gly1 5 10 15act tgc atc cgc ctt cct cag agc aac agc ccc gtc acc gat gtc acc144Thr Cys Ile Arg Leu Pro Gln Ser Asn Ser Pro Val Thr Asp Val Thr20 25 30tcc aac gac atc cgc tgc aac gcc agc ccc agc gct gcc tcg acc act192Ser Asn Asp Ile Arg Cys Asn Ala Ser Pro Ser Ala Ala Ser Thr Thr35 40 45tgc tcc gtt gcc gcc ggc ggt tca ctg acg gtt gag atg cac cag cag240Cys Ser Val Ala Ala Gly Gly Ser Leu Thr Val Glu Met His Gln Gln50 55 60ccc aac gac cgc agc tgc gac aac gag gcc atc ggt ggc aac cac ttc288Pro Asn Asp Arg Ser Cys Asp Asn Glu Ala Ile Gly Gly Asn His Phe65 70 75 80ggc cca gtc atg atc tac atg tcc aag gtc gac gac gcc gcc act gcc336
Gly Pro Val Met Ile Tyr Met Ser Lys Val Asp Asp Ala Ala Thr Ala85 90 95gat ggc tct ggc gac tgg ttc aag gtc gct cag gac acc tac aac ggc384Asp Gly Ser Gly Asp Trp Phe Lys Val Ala Gln Asp Thr Tyr Asn Gly100 105 110act gag gct agc tgg ggt acc gag atc ctc aac gcc aac tgc ggc aag432Thr Glu Ala Ser Trp Gly Thr Glu Ile Leu Asn Ala Asn Cys Gly Lys115 120 125cgc gcc ttc acc gtc ccc aag tct ctc ccg tcg ggc gac tac ctc gtc480Arg Ala Phe Thr Val Pro Lys Ser Leu Pro Ser Gly Asp Tyr Leu Val130 135 140cgc gcc gag gcg ctg gcc ctg cac agc gca ggt agc gag ggc ggt gct528Arg Ala Glu Ala Leu Ala Leu His Ser Ala Gly Ser Glu Gly Gly Ala145 150 155 160cag ttc tac atg agc tgc tac cag gtc acc gtc acc ggc ggc ggc agc576Gln Phe Tyr Met Ser Cys Tyr Gln Val Thr Val Thr Gly Gly Gly Ser165 170 175gcc acc ccg tcc ccg acc gtc aag ttc cct ggc gcc tac agc gcc gac624Ala Thr Pro Ser Pro Thr Val Lys Phe Pro Gly Ala Tyr Ser Ala Asp180 185 190gat gct ggt atc ctc atc aac atc tac cag acc ccg ctg acg tac gag672Asp Ala Gly Ile Leu Ile Asn Ile Tyr Gln Thr Pro Leu Thr Tyr Glu195 200 205gcc cct ggc ccg gct gtc tgg agc ggt aac702Ala Pro Gly Pro Ala Val Trp Ser Gly Asn210 215<210>12<211>234<212>PRT<213>Botryosphaeria rhodina<400>12Met Lys Gly Leu Phe Ala Ile Leu Ala Thr Ala Ser Val Val Ser Ala-15 -10 -5 -1His Ala Thr Trp Gln Glu Leu Trp Val Gly Thr Glu Asp Lys Glu Gly1 5 10 15Thr Cys Ile Arg Leu Pro Gln Ser Asn Ser Pro Val Thr Asp Val Thr20 25 30Ser Asn Asp Ile Arg Cys Asn Ala Ser Pro Ser Ala Ala Ser Thr Thr35 40 45Cys Ser Val Ala Ala Gly Gly Ser Leu Thr Val Glu Met His Gln Gln50 55 60Pro Asn Asp Arg Ser Cys Asp Asn Glu Ala Ile Gly Gly Asn His Phe65 70 75 80
Gly Pro Val Met Ile Tyr Met Ser Lys Val Asp Asp Ala Ala Thr Ala85 90 95Asp Gly Ser Gly Asp Trp Phe Lys Val Ala Gln Asp Thr Tyr Asn Gly100 105 110Thr Glu Ala Ser Trp Gly Thr Glu Ile Leu Asn Ala Asn Cys Gly Lys115 120 125Arg Ala Phe Thr Val Pro Lys Ser Leu Pro Ser Gly Asp Tyr Leu Val130 135 140Arg Ala Glu Ala Leu Ala Leu His Ser Ala Gly Ser Glu Gly Gly Ala145 150 155 160Gln Phe Tyr Met Ser Cys Tyr Gln Val Thr Val Thr Gly Gly Gly Ser165 170 175Ala Thr Pro Ser Pro Thr Val Lys Phe Pro Gly Ala Tyr Ser Ala Asp180 185 190Asp Ala Gly Ile Leu Ile Asn Ile Tyr Gln Thr Pro Leu Thr Tyr Glu195 200 205Ala Pro Gly Pro Ala Val Trp Ser Gly Asn210 215<210>13<211>786<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(786)<220>
<221>transit_peptide<222>(1)..(39)<220>
<221>misc_feature<222>(1)..(786)<223>前肽<220>
<221>mat_peptide<222>(40)..(786)<400>13atg ttc ttc tcc caa aag ctc atc gcg gcc gtc gcc gcc ctc ccc gac48Met Phe Phe Ser Gln Lys Leu Ile Ala Ala Val Ala Ala Leu Pro Asp-10 -5 -1 1cat gac ttc ggc cca cta ctt ctg tcc gca act cat cgt caa cgg cga96His Asp Phe Gly Pro Leu Leu Leu Ser Ala Thr His Arg Gln Arg Arg5 10 15
acc tcc gag caa tgg gaa tac gtc cgc gaa acc tct cag ggc tac gag144Thr Ser Glu Gln Trp Glu Tyr Val Arg Glu Thr Ser Gln Gly Tyr Glu20 25 30 35ccg caa tac act ccg gac atc ctc acc tcc aac gac ctg cgc tgc aac192Pro Gln Tyr Thr Pro Asp Ile Leu Thr Ser Asn Asp Leu Arg Cys Asn40 45 50acg gac agc ctc gcc gcc gct gcc aac acc aag gtc gcg tcc gtc gcg240Thr Asp Ser Leu Ala Ala Ala Ala Asn Thr Lys Val Ala Ser Val Ala55 60 65gcc ggc gac acc gtc tcc ttc gtc acc gac tac ggc gcc aag gtg cag288Ala Gly Asp Thr Val Ser Phe Val Thr Asp Tyr Gly Ala Lys Val Gln70 75 80cac ccg ggc ccg ctg acg ttc tgg atg tcg cag gcg ccg ggc ggg gat336His Pro Gly Pro Leu Thr Phe Trp Met Ser Gln Ala Pro Gly Gly Asp85 90 95gta acc aca tac gat ggc tca ggc gat tgg ttc aag atc ggc gtc gtg384Val Thr Thr Tyr Asp Gly Ser Gly Asp Trp Phe Lys Ile Gly Val Val100 105 110 115ggc tac gac acg ccg ttc gac tcg acg gga acg aac tgg cgc gcc tac432Gly Tyr Asp Thr Pro Phe Asp Ser Thr Gly Thr Asn Trp Arg Ala Tyr120 125 130gat gag ggc acg ttc aac gtg tcc atc ccg aca acg gtg ccg aat ggc480Asp Glu Gly Thr Phe Asn Val Ser Ile Pro Thr Thr Val Pro Asn Gly135 140 145caa tac ttg ctg cgc atc gag cat atc ggc ctg cac cgc ccg tcg acg528Gln Tyr Leu Leu Arg Ile Glu His Ile Gly Leu His Arg Pro Ser Thr150 155 160cgc gag atg ttc ttc aac tgc gcg cag gtt gag gtg acg ggg tcg tcc576Arg Glu Met Phe Phe Asn Cys Ala Gln Val Glu Val Thr Gly Ser Ser165 170 175gcc aca gcg gtg ccg agt gag acg gcg aag att cct gcg gga tct ata624Ala Thr Ala Val Pro Ser Glu Thr Ala Lys Ile Pro Ala Gly Ser Ile180 185 190 195gtg aga gcg atg agt ggg tgt cca agt gga gca tgt ata gta gcc cga672Val Arg Ala Met Ser Gly Cys Pro Ser Gly Ala Cys Ile Val Ala Arg200 205 210gca gct tcc cgt act ctg gcc cag cta ctg ttg atg gtg gtg ttt ttg720Ala Ala Ser Arg Thr Leu Ala Gln Leu Leu Leu Met Val Val Phe Leu215 220 225att ctc agg gct ctg att ctg ctt aaa tgg gcg gga ttt tcc ctt tcc768Ile Leu Arg Ala Leu Ile Leu Leu Lys Trp Ala Gly Phe Ser Leu Ser230 235 240ata tgt tct att gtt gta786Ile Cys Ser Ile Val Val245
<210>14<211>262<212>PRT<213>Botryosphaeria rhodina<400>14Met Phe Phe Ser Gln Lys Leu Ile Ala Ala Val Ala Ala Leu Pro Asp-10 -5 -1 1His Asp Phe Gly Pro Leu Leu Leu Ser Ala Thr His Arg Gln Arg Arg5 10 15Thr Ser Glu Gln Trp Glu Tyr Val Arg Glu Thr Ser Gln Gly Tyr Glu20 25 30 35Pro Gln Tyr Thr Pro Asp Ile Leu Thr Ser Asn Asp Leu Arg Cys Asn40 45 50Thr Asp Ser Leu Ala Ala Ala Ala Asn Thr Lys Val Ala Ser Val Ala55 60 65Ala Gly Asp Thr Val Ser Phe Val Thr Asp Tyr Gly Ala Lys Val Gln70 75 80His Pro Gly Pro Leu Thr Phe Trp Met Ser Gln Ala Pro Gly Gly Asp85 90 95Val Thr Thr Tyr Asp Gly Ser Gly Asp Trp Phe Lys Ile Gly Val Val100 105 110 115Gly Tyr Asp Thr Pro Phe Asp Ser Thr Gly Thr Asn Trp Arg Ala Tyr120 125 130Asp Glu Gly Thr Phe Asn Val Ser Ile Pro Thr Thr Val Pro Asn Gly135 140 145Gln Tyr Leu Leu Arg Ile Glu His Ile Gly Leu His Arg Pro Ser Thr150 155 160Arg Glu Met Phe Phe Asn Cys Ala Gln Val Glu Val Thr Gly Ser Ser165 170 175Ala Thr Ala Val Pro Ser Glu Thr Ala Lys Ile Pro Ala Gly Ser Ile180 185 190 195Val Arg Ala Met Ser Gly Cys Pro Ser Gly Ala Cys Ile Val Ala Arg200 205 210Ala Ala Ser Arg Thr Leu Ala Gln Leu Leu Leu Met Val Val Phe Leu215 220 225Ile Leu Arg Ala Leu Ile Leu Leu Lys Trp Ala Gly Phe Ser Leu Ser230 235 240Ile Cys Ser Ile Val Val245
<210>15<211>819<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(819)<220>
<221>transit_peptide<222>(1)..(54)<220>
<221>misc_feature<222>(1)..(819)<223>前肽<220>
<221>mat_peptide<222>(55)..(819)<400>15atg tct ttc aag tct ctt gct gtt att gcc gct ggt gcg gcc acc gcc48Met Ser Phe Lys Ser Leu Ala Val Ile Ala Ala Gly Ala Ala Thr Ala-15 -10 -5aac gcc cac ggt gtc atc ctg gac atc gtg tct ggc ggc aag acc tac96Asn Ala His Gly Val Ile Leu Asp Ile Val Ser Gly Gly Lys Thr Tyr-1 1 5 10ggt ggc tgg gac gcc agc tac gtc tac tac aac ccc gtc ccc gag gtt144Gly Gly Trp Asp Ala Ser Tyr Val Tyr Tyr Asn Pro Val Pro Glu Val15 20 25 30gct gcc tgg cag tct ggt ggc ttc ggc cac ggc ccc atc gtc ggc acc192Ala Ala Trp Gln Ser Gly Gly Phe Gly His Gly Pro Ile Val Gly Thr35 40 45cag tac tcg acc gct tcc atc aac tgc cac gac gac gct att gcc gct240Gln Tyr Ser Thr Ala Ser Ile Asn Cys His Asp Asp Ala Ile Ala Ala50 55 60ccc atc tac atg gag gcc gcc gcc ggt gac gag atc gcc atc tcc tgg288Pro Ile Tyr Met Glu Ala Ala Ala Gly Asp Glu Ile Ala Ile Ser Trp65 70 75ggt acc cct ggc aac ccc ccc agc gcc tgg ccc acg agc cac cac ggc336Gly Thr Pro Gly Asn Pro Pro Ser Ala Trp Pro Thr Ser His His Gly80 85 90ccc atc att acc tac atg gct cct tgc ggt ggt gct gat gct act ggc384Pro Ile Ile Thr Tyr Met Ala Pro Cys Gly Gly Ala Asp Ala Thr Gly95 100 105 110gac tgc acc tcc ctg aac gtc acc gac ctc gct tgg acc aag gtc tac432Asp Cys Thr Ser Leu Asn Val Thr Asp Leu Ala Trp Thr Lys Val Tyr115 120 125
cag aag ggt ctc atc acc ggc ggt gat gtt gac agc cag gtc tgg gcc480Gln Lys Gly Leu Ile Thr Gly Gly Asp Val Asp Ser Gln Val Trp Ala130 135 140acc gac gag ctc atc tcg aac aac aag acc atg gtc acc atc ccc tcc528Thr Asp Glu Leu Ile Ser Asn Asn Lys Thr Met Val Thr Ile Pro Ser145 150 155tcg ctc gcc ccg ggc aac tac gtc ctc cgc aac gag atc atc gcc ctt576Ser Leu Ala Pro Gly Asn Tyr Val Leu Arg Asn Glu Ile Ile Ala Leu160 165 170cac gcc ggc ggt gag gtc aac ggc ccc cag aac tac ccc cag tgc tac624His Ala Gly Gly Glu Val Asn Gly Pro Gln Asn Tyr Pro Gln Cys Tyr175 180 185 190aac gtc aag atc acc ggc tct ggc tcc gga aag ctt acc gac ggc gtc672Asn Val Lys Ile Thr Gly Ser Gly Ser Gly Lys Leu Thr Asp Gly Val195 200 205aag ggc acc gag ctc tac acc ccc gag gac acc gtc ttc aac atc tac720Lys Gly Thr Glu Leu Tyr Thr Pro Glu Asp Thr Val Phe Asn Ile Tyr210 215 220gcc aac att gac agc tac ccc ttc ccc ggc ccc gag ctc tgg agc ggc768Ala Asn Ile Asp Ser Tyr Pro Phe Pro Gly Pro Glu Leu Trp Ser Gly225 230 235gct tcc tct acc tcc aac gcc acc aag cgc tct ttc cgt acc ttc aag816Ala Ser Ser Thr Ser Asn Ala Thr Lys Arg Ser Phe Arg Thr Phe Lys240 245 250gca819Ala255<210>16<211>273<212>PRT<213>Botryosphaeria rhodina<400>16Met Ser Phe Lys Ser Leu Ala Val Ile Ala Ala Gly Ala Ala Thr Ala-15 -10 -5Asn Ala His Gly Val Ile Leu Asp Ile Val Ser Gly Gly Lys Thr Tyr-1 1 5 10Gly Gly Trp Asp Ala Ser Tyr Val Tyr Tyr Asn Pro Val Pro Glu Val15 20 25 30Ala Ala Trp Gln Ser Gly Gly Phe Gly His Gly Pro Ile Val Gly Thr35 40 45Gln Tyr Ser Thr Ala Ser Ile Asn Cys His Asp Asp Ala Ile Ala Ala50 55 60Pro Ile Tyr Met Glu Ala Ala Ala Gly Asp Glu Ile Ala Ile Ser Trp
65 70 75Gly Thr Pro Gly Asn Pro Pro Ser Ala Trp Pro Thr Ser His His Gly80 85 90Pro Ile Ile Thr Tyr Met Ala Pro Cys Gly Gly Ala Asp Ala Thr Gly95 100 105 110Asp Cys Thr Ser Leu Asn Val Thr Asp Leu Ala Trp Thr Lys Val Tyr115 120 125Gln Lys Gly Leu Ile Thr Gly Gly Asp Val Asp Ser Gln Val Trp Ala130 135 140Thr Asp Glu Leu Ile Ser Asn Asn Lys Thr Met Val Thr Ile Pro Ser145 150 155Ser Leu Ala Pro Gly Asn Tyr Val Leu Arg Asn Glu Ile Ile Ala Leu160 165 170His Ala Gly Gly Glu Val Asn Gly Pro Gln Asn Tyr Pro Gln Cys Tyr175 180 185 190Asn Val Lys Ile Thr Gly Ser Gly Ser Gly Lys Leu Thr Asp Gly Val195 200 205Lys Gly Thr Glu Leu Tyr Thr Pro Glu Asp Thr Val Phe Asn Ile Tyr210 215 220Ala Asn Ile Asp Ser Tyr Pro Phe Pro Gly Pro Glu Leu Trp Ser Gly225 230 235Ala Ser Ser Thr Ser Asn Ala Thr Lys Arg Ser Phe Arg Thr Phe Lys240 245 250Ala255<210>17<211>675<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(675)<220>
<221>sig_peptide<222>(1)..(60)<220>
<221>misc_feature<222>(1)..(675)<223>前肽<220>
<221>mat_peptide<222>(61)..(675)
<400>17atg aag act ttc act act ttc gca ttc gct gcc tct gtg ctg gca cag48Met Lys Thr Phe Thr Thr Phe Ala Phe Ala Ala Ser Val Leu Ala Gln-20 -15 -10 -5gct gtc aac gga cac tac atc ttc caa tac ctc act gcc aac ggc gtg96Ala Val Asn Gly His Tyr Ile Phe Gln Tyr Leu Thr Ala Asn Gly Val-1 1 5 10aag ggt ggt atc tat cag aac att agg gag aac acg aac aac aac tcg144Lys Gly Gly Ile Tyr Gln Asn Ile Arg Glu Asn Thr Asn Asn Asn Ser15 20 25ccc gtg act gat ctc gag tcc aac gac ctc cgc tgc aat gtt ggt ggt192Pro Val Thr Asp Leu Glu Ser Asn Asp Leu Arg Cys Asn Val Gly Gly30 35 40gag gat ggc agc aag act agc acg gtc tcc gtc gct gct ggc agc acc240Glu Asp Gly Ser Lys Thr Ser Thr Val Ser Val Ala Ala Gly Ser Thr45 50 55 60gtc gct ttc act gcc gac atc gcc gtg tac cac cag ggc ccc gtc tct288Val Ala Phe Thr Ala Asp Ile Ala Val Tyr His Gln Gly Pro Val Ser65 70 75ttc tac atg aca aag gtc gac gac gcg gcg gcg gcg gac ggc agc acg336Phe Tyr Met Thr Lys Val Asp Asp Ala Ala Ala Ala Asp Gly Ser Thr80 85 90ccg tgg ttt aag atc aag gac atc gga ccc act ttc tcc aac ggc cag384Pro Trp Phe Lys Ile Lys Asp Ile Gly Pro Thr Phe Ser Asn Gly Gln95 100 105gcg act tgg gac ctc gag acg acg tac aac gtg acc atc ccc aac tgc432Ala Thr Trp Asp Leu Glu Thr Thr Tyr Asn Val Thr Ile Pro Asn Cys110 115 120ctt ccc gcc ggc gag tac ctg ctg cgc atc cag cag ctt ggc atc cac480Leu Pro Ala Gly Glu Tyr Leu Leu Arg Ile Gln Gln Leu Gly Ile His125 130 135 140aac ccg tgg ccg gcc ggc atc ccg caa ttc tac atc tcg tgc gcc cag528Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln145 150 155gtc aag gtc acg ggc agc ggc tcg ggc tcg ccc agc ccg act gtt tcc576Val Lys Val Thr Gly Ser Gly Ser Gly Ser Pro Ser Pro Thr Val Ser160 165 170atc ccc ggc gcg ttc aag gag acg gac ccc ggc tat acc gtc aac att624Ile Pro Gly Ala Phe Lys Glu Thr Asp Pro Gly Tyr Thr Val Asn Ile175 180 185tac aac gac ttc acc aac tat act gtc ccc ggc ccg gag gtg tgg acg672Tyr Asn Asp Phe Thr Asn Tyr Thr Val Pro Gly Pro Glu Val Trp Thr190 195 200tgc675
Cys205<210>18<211>225<212>PRT<213>Botryosphaeria rhodina<400>18Met Lys Thr Phe Thr Thr Phe Ala Phe Ala Ala Ser Val Leu Ala Gln-20 -15 -10 -5Ala Val Asn Gly His Tyr Ile Phe Gln Tyr Leu Thr Ala Asn Gly Val-1 1 5 10Lys Gly Gly Ile Tyr Gln Asn Ile Arg Glu Asn Thr Asn Asn Asn Ser15 20 25Pro Val Thr Asp Leu Glu Ser Asn Asp Leu Arg Cys Asn Val Gly Gly30 35 40Glu Asp Gly Ser Lys Thr Ser Thr Val Ser Val Ala Ala Gly Ser Thr45 50 55 60Val Ala Phe Thr Ala Asp Ile Ala Val Tyr His Gln Gly Pro Val Ser65 70 75Phe Tyr Met Thr Lys Val Asp Asp Ala Ala Ala Ala Asp Gly Ser Thr80 85 90Pro Trp Phe Lys Ile Lys Asp Ile Gly Pro Thr Phe Ser Asn Gly Gln95 100 105Ala Thr Trp Asp Leu Glu Thr Thr Tyr Asn Val Thr Ile Pro Asn Cys110 115 120Leu Pro Ala Gly Glu Tyr Leu Leu Arg Ile Gln Gln Leu Gly Ile His125 130 135 140Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln145 150 155Val Lys Val Thr Gly Ser Gly Ser Gly Ser Pro Ser Pro Thr Val Ser160 165 170Ile Pro Gly Ala Phe Lys Glu Thr Asp Pro Gly Tyr Thr Val Asn Ile175 180 185Tyr Asn Asp Phe Thr Asn Tyr Thr Val Pro Gly Pro Glu Val Trp Thr190 195 200Cys205<210>19<211>729<212>DNA<213>Botryosphaeria rhodina
<220>
<221>CDS<222>(1)..(729)<400>19atg gag tcg gcg tcc aag acg ctg aag cgc gtg acg ctt gag ctg ggt48Met Glu Ser Ala Ser Lys Thr Leu Lys Arg Val Thr Leu Glu Leu Gly1 5 10 15ggc aag gac ccg gcc atc gtg tgc tcg gac gtc gac atc gcg gcg acg96Gly Lys Asp Pro Ala Ile Val Cys Ser Asp Val Asp Ile Ala Ala Thr20 25 30gcc ccc aag gtt gcc acc ctg gcc ttc ctc aac tcg ggt cag atc tgc144Ala Pro Lys Val Ala Thr Leu Ala Phe Leu Asn Ser Gly Gln Ile Cys35 40 45ctg gcc atc aag cgt atc tac gtt cac gag aag atc tac gac gag ttc192Leu Ala Ile Lys Arg Ile Tyr Val His Glu Lys Ile Tyr Asp Glu Phe50 55 60ctc aag gcg tgc gtc gag cac acc aag acg ctc gtg ctc ggc aac ggc240Leu Lys Ala Cys Val Glu His Thr Lys Thr Leu Val Leu Gly Asn Gly65 70 75 80acc gag ccc aac acc ttc ctc ggc ccc gtg cag aac gcc atg cag tac288Thr Glu Pro Asn Thr Phe Leu Gly Pro Val Gln Asn Ala Met Gln Tyr85 90 95gag cgc gtc aag ggc ttc ttc cag gac gtg cac gag cac aag atg aag336Glu Arg Val Lys Gly Phe Phe Gln Asp Val His Glu His Lys Met Lys100 105 110gtg gcc gtc ggc ggc gtc aac gac aag acg ggc ggc tac tac atc acc384Val Ala Val Gly Gly Val Asn Asp Lys Thr Gly Gly Tyr Tyr Ile Thr115 120 125ccg acc atc atc gac aac ccg gcc gag acg agc aag atc gtg acc gag432Pro Thr Ile Ile Asp Asn Pro Ala Glu Thr Ser Lys Ile Val Thr Glu130 135 140gag ccc ttc ggc ccc atc gtg ccg ctg ctc aag tgg agc gac gag agc480Glu Pro Phe Gly Pro Ile Val Pro Leu Leu Lys Trp Ser Asp Glu Ser145 150 155 160gag gtc gtc cac cgc gcc aac gac acc aag atg ggt ctc ggc gcc tcc528Glu Val Val His Arg Ala Asn Asp Thr Lys Met Gly Leu Gly Ala Ser165 170 175gtg tgg agc aac gac ctc gcc cag gcc gag cgc atc gcc cgc cag ctc576Val Trp Ser Asn Asp Leu Ala Gln Ala Glu Arg Ile Ala Arg Gln Leu180 185 190gac gcc ggc agc gtc tgg atc aac act cac ctc gag ctc gac ccc aac624Asp Ala Gly Ser Val Trp Ile Asn Thr His Leu Glu Leu Asp Pro Asn195 200 205gct ccc ttc ggc ggc cac aag gag agc ggt gtt ggc tac gag tgg ggt672
Ala Pro Phe Gly Gly His Lys Glu Ser Gly Val Gly Tyr Glu Trp Gly210 215 220ctt ggt ggc atg aag gcc tac tgc aac gtc cag acc ctg ttc ttg aag720Leu Gly Gly Met Lys Ala Tyr Cys Asn Val Gln Thr Leu Phe Leu Lys225 230 235 240aag aag gtc729Lys Lys Val<210>20<211>243<212>PRT<213>Botryosphaeria rhodina<400>20Met Glu Ser Ala Ser Lys Thr Leu Lys Arg Val Thr Leu Glu Leu Gly1 5 10 15Gly Lys Asp Pro Ala Ile Val Cys Ser Asp Val Asp Ile Ala Ala Thr20 25 30Ala Pro Lys Val Ala Thr Leu Ala Phe Leu Asn Ser Gly Gln Ile Cys35 40 45Leu Ala Ile Lys Arg Ile Tyr Val His Glu Lys Ile Tyr Asp Glu Phe50 55 60Leu Lys Ala Cys Val Glu His Thr Lys Thr Leu Val Leu Gly Asn Gly65 70 75 80Thr Glu Pro Asn Thr Phe Leu Gly Pro Val Gln Asn Ala Met Gln Tyr85 90 95Glu Arg Val Lys Gly Phe Phe Gln Asp Val His Glu His Lys Met Lys100 105 110Val Ala Val Gly Gly Val Asn Asp Lys Thr Gly Gly Tyr Tyr Ile Thr115 120 125Pro Thr Ile Ile Asp Asn Pro Ala Glu Thr Ser Lys Ile Val Thr Glu130 135 140Glu Pro Phe Gly Pro Ile Val Pro Leu Leu Lys Trp Ser Asp Glu Ser145 150 155 160Glu Val Val His Arg Ala Asn Asp Thr Lys Met Gly Leu Gly Ala Ser165 170 175Val Trp Ser Asn Asp Leu Ala Gln Ala Glu Arg Ile Ala Arg Gln Leu180 185 190Asp Ala Gly Ser Val Trp Ile Asn Thr His Leu Glu Leu Asp Pro Asn195 200 205Ala Pro Phe Gly Gly His Lys Glu Ser Gly Val Gly Tyr Glu Trp Gly210 215 220
Leu Gly Gly Met Lys Ala Tyr Cys Asn Val Gln Thr Leu Phe Leu Lys225 230 235 240Lys Lys Val<210>21<211>1300<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(1299)<220>
<221>sig_peptide<222>(1)..(54)<220>
<221>mat_peptide<222>(55)..(1299)<220>
<221>misc_feature<222>(55)..(456)<223>未知域<220>
<221>misc_feature<222>(460)..(579)<223>殼多糖(chitin)結合域<220>
<221>misc_feature<222>(580)..(1299)<223>富含蘇氨酸-絲氨酸的結構域<400>21atg aag ttg gcg gcg tcg ctt ttg ctt gtc gca gcc gcg ctt gcg ggg48Met Lys Leu Ala Ala Ser Leu Leu Leu Val Ala Ala Ala Leu Ala Gly-15 -10 -5gcc ttt gac aac cgc caa tcg cat gca agg gcc ccc gtt ccg cga gac96Ala Phe Asp Asn Arg Gln Ser His Ala Arg Ala Pro Val Pro Arg Asp-1 1 5 10gcc ttc gac aat gct tgc gag acc gtc tac atc acg agt tat gtc tgc144Ala Phe Asp Asn Ala Cys Glu Thr Val Tyr Ile Thr Ser Tyr Val Cys15 20 25 30acc acc ttc gtc gtc cct tcg ctt agc tac acc agc cat gag ttt agc192Thr Thr Phe Val Val Pro Ser Leu Ser Tyr Thr Ser His Glu Phe Ser35 40 45tgc acc act cac ttg acc aac acc acg cgt atc aca tct tcc gga tcc240Cys Thr Thr His Leu Thr Asn Thr Thr Arg Ile Thr Ser Ser Gly Ser50 55 60
acg acc gca gaa act tta act tca ggt cac acg agc tca gag agc cgc288Thr Thr Ala Glu Thr Leu Thr Ser Gly His Thr Ser Ser Glu Ser Arg65 70 75gct att agc ccg aca caa aac tca tcc agc gtt tac ccg agc gac agc336Ala Ile Ser Pro Thr Gln Asn Ser Ser Ser Val Tyr Pro Ser Asp Ser80 85 90cct tca cgt tct gtg tct tca tcc aca ctg tcg cag tct tcc aga acc384Pro Ser Arg Ser Val Ser Ser Ser Thr Leu Ser Gln Ser Ser Arg Thr95 100 105 110gaa aca agc aat aga gac acg agc aat acg tct cac agc gac agc cct432Glu Thr Ser Asn Arg Asp Thr Ser Asn Thr Ser His Ser Asp Ser Pro115 120 125act ccc ggc ccc agc gag gag ccc tgt tgc ggc ccg caa ggc ggt aac480Thr Pro Gly Pro Ser Glu Glu Pro Cys Cys Gly Pro Gln Gly Gly Asn130 135 140cgt cgt tgt ccc cat gga aca tgc tgt tcc aaa aat gga cac tgt ggt528Arg Arg Cys Pro His Gly Thr Cys Cys Ser Lys Asn Gly His Cys Gly145 150 155tcg ggg cca gat ttc tgt ggt gat ggg tgc caa tct tcg tgg gga aac576Ser Gly Pro Asp Phe Cys Gly Asp Gly Cys Gln Ser Ser Trp Gly Asn160 165 170tgt acc aac gac aac agc gat gag ata tct ccc tcg agc agt ccc tca624Cys Thr Asn Asp Asn Ser Asp Glu Ile Ser Pro Ser Ser Ser Pro Ser175 180 185 190aac tac tcg gcg cca gct gca tgg gct cga gtg aaa aga gat gag ttt672Asn Tyr Ser Ala Pro Ala Ala Trp Ala Arg Val Lys Arg Asp Glu Phe195 200 205gac gca ggt gca ttt gaa ctc ttg aca agt ctc aag tac atc gtt gaa720Asp Ala Gly Ala Phe Glu Leu Leu Thr Ser Leu Lys Tyr Ile Val Glu210 215 220ggc acc atg gtg aga acc agc act tgc act tac act cac tgg cac acc768Gly Thr Met Val Arg Thr Ser Thr Cys Thr Tyr Thr His Trp His Thr225 230 235atc tcg act aca tca aag cga acg agt acc atc acc gtc tac att tcg816Ile Ser Thr Thr Ser Lys Arg Thr Ser Thr Ile Thr Val Tyr Ile Ser240 245 250acg tgt cta tca tca aat cca cca gtc acc agc agc agc aca cag tcc864Thr Cys Leu Ser Ser Asn Pro Pro Val Thr Ser Ser Ser Thr Gln Ser255 260 265 270atc tcc tct ctc atc aca tct cct acg ttg gtg tca act tcg agt gtc912Ile Ser Ser Leu Ile Thr Ser Pro Thr Leu Val Ser Thr Ser Ser Val275 280 285att acg aca tcc agc aca tcc caa tac tca agc agt acc tca tgc acc960Ile Thr Thr Ser Ser Thr Ser Gln Tyr Ser Ser Ser Thr Ser Cys Thr
290 295 300tat aca aaa agt tca aac act aca ata ccg tgg tca cca ccc aca agc1008Tyr Thr Lys Ser Ser Asn Thr Thr Ile Pro Trp Ser Pro Pro Thr Ser305 310 315atg tcg ata acc agc tct tca tgc act cgc tca tcg gac tgg aca acc1056Met Ser Ile Thr Ser Ser Ser Cys Thr Arg Ser Ser Asp Trp Thr Thr320 325 330cca aag ccg cca ccc tcg acc tca aca acc ata caa acg aca caa acc1104Pro Lys Pro Pro Pro Ser Thr Ser Thr Thr Ile Gln Thr Thr Gln Thr335 340 345 350ccg gat act ata acg aaa tcg aat act ccc act acg acc aag acc aca1152Pro Asp Thr Ile Thr Lys Ser Asn Thr Pro Thr Thr Thr Lys Thr Thr355 360 365act aag atc tcg att tca att tcc act cca tgg aat act aca tgt acc1200Thr Lys Ile Ser Ile Ser Ile Ser Thr Pro Trp Asn Thr Thr Cys Thr370 375 380tca tca acg aac agc acc aca tcc aca ccc caa acc aca cat aca gcg1248Ser Ser Thr Asn Ser Thr Thr Ser Thr Pro Gln Thr Thr His Thr Ala385 390 395aca gaa cca ccc act tcc agc atc ata gca ata tca agc tcc tct aac1296Thr Glu Pro Pro Thr Ser Ser Ile Ile Ala Ile Ser Ser Ser Ser Asn400 405 410ccg c 1300Pro415<210>22<211>433<212>PRT<213>Botryosphaeria rhodina<400>22Met Lys Leu Ala Ala Ser Leu Leu Leu Val Ala Ala Ala Leu Ala Gly-15 -10 -5Ala Phe Asp Asn Arg Gln Ser His Ala Arg Ala Pro Val Pro Arg Asp-1 1 5 10Ala Phe Asp Asn Ala Cys Glu Thr Val Tyr Ile Thr Ser Tyr Val Cys15 20 25 30Thr Thr Phe Val Val Pro Ser Leu Ser Tyr Thr Ser His Glu Phe Ser35 40 45Cys Thr Thr His Leu Thr Asn Thr Thr Arg Ile Thr Ser Ser Gly Ser50 55 60Thr Thr Ala Glu Thr Leu Thr Ser Gly His Thr Ser Ser Glu Ser Arg65 70 75
Ala Ile Ser Pro Thr Gln Asn Ser Ser Ser Val Tyr Pro Ser Asp Ser80 85 90Pro Ser Arg Ser Val Ser Ser Ser Thr Leu Ser Gln Ser Ser Arg Thr95 100 105 110Glu Thr Ser Asn Arg Asp Thr Ser Asn Thr Ser His Ser Asp Ser Pro115 120 125Thr Pro Gly Pro Ser Glu Glu Pro Cys Cys Gly Pro Gln Gly Gly Asn130 135 140Arg Arg Cys Pro His Gly Thr Cys Cys Ser Lys Asn Gly His Cys Gly145 150 155Ser Gly Pro Asp Phe Cys Gly Asp Gly Cys Gln Ser Ser Trp Gly Asn160 165 170Cys Thr Asn Asp Asn Ser Asp Glu Ile Ser Pro Ser Ser Ser Pro Ser175 180 185 190Asn Tyr Ser Ala Pro Ala Ala Trp Ala Arg Val Lys Arg Asp Glu Phe195 200 205Asp Ala Gly Ala Phe Glu Leu Leu Thr Ser Leu Lys Tyr Ile Val Glu210 215 220Gly Thr Met Val Arg Thr Ser Thr Cys Thr Tyr Thr His Trp His Thr225 230 235Ile Ser Thr Thr Ser Lys Arg Thr Ser Thr Ile Thr Val Tyr Ile Ser240 245 250Thr Cys Leu Ser Ser Asn Pro Pro Val Thr Ser Ser Ser Thr Gln Ser255 260 265 270Ile Ser Ser Leu Ile Thr Ser Pro Thr Leu Val Ser Thr Ser Ser Val275 280 285Ile Thr Thr Ser Ser Thr Ser Gln Tyr Ser Ser Ser Thr Ser Cys Thr290 295 300Tyr Thr Lys Ser Ser Asn Thr Thr Ile Pro Trp Ser Pro Pro Thr Ser305 310 315Met Ser Ile Thr Ser Ser Ser Cys Thr Arg Ser Ser Asp Trp Thr Thr320 325 330Pro Lys Pro Pro Pro Ser Thr Ser Thr Thr Ile Gln Thr Thr Gln Thr335 340 345 350Pro Asp Thr Ile Thr Lys Ser Asn Thr Pro Thr Thr Thr Lys Thr Thr355 360 365Thr Lys Ile Ser Ile Ser Ile Ser Thr Pro Trp Asn Thr Thr Cys Thr370 375 380Ser Ser Thr Asn Ser Thr Thr Ser Thr Pro Gln Thr Thr His Thr Ala385 390 395
Thr Glu Pro Pro Thr Ser Ser Ile Ile Ala Ile Ser Ser Ser Ser Asn400 405 410Pro415<210>23<211>1179<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(1179)<220>
<221>sig_peptide<222>(1)..(48)<220>
<221>mat_peptide<222>(49)..(1179)<400>23atg ctt aag cac atc acc ctt gcg gca ttg gcc tcg atg gcc ttt gcc48Met Leu Lys His Ile Thr Leu Ala Ala Leu Ala Ser Met Ala Phe Ala-15 -10 -5 -1cag aca caa gac ctc aat gcc aca ctc agc ggc att ccc gag ctg tcc96Gln Thr Gln Asp Leu Asn Ala Thr Leu Ser Gly Ile Pro Glu Leu Ser1 5 10 15aat cta acg tca tac tac atc tcg ctc cct gac tcc ctg agc gcg ttg144Asn Leu Thr Ser Tyr Tyr Ile Ser Leu Pro Asp Ser Leu Ser Ala Leu20 25 30tcg gct gcc agg aac atc acc atc ctg gcg cct agt aac aat gcc ttc192Ser Ala Ala Arg Asn Ile Thr Ile Leu Ala Pro Ser Asn Asn Ala Phe35 40 45gag cag ctg ttg agc agc ccc ctc ggc gcg gcg ctg acc aac gac ccg240Glu Gln Leu Leu Ser Ser Pro Leu Gly Ala Ala Leu Thr Asn Asp Pro50 55 60gat ctc gtc caa gcc atg ctt acc tac cac gtg ctc aac ggc agc tac288Asp Leu Val Gln Ala Met Leu Thr Tyr His Val Leu Asn Gly Ser Tyr65 70 75 80agc tcg agc cag atc act gag gac agt caa ttc atc ccc act ctc ctg336Ser Ser Ser Gln Ile Thr Glu Asp Ser Gln Phe Ile Pro Thr Leu Leu85 90 95acc gac cct agg tat acc aat gtt acc ggc ggt cag cgg gtt gag gtg384Thr Asp Pro Arg Tyr Thr Asn Val Thr Gly Gly Gln Arg Val Glu Val100 105 110gag aaa gag gat ggt aac gac gtc ttt tac tcg ggg ctg cgg cag aat432Glu Lys Glu Asp Gly Asn Asp Val Phe Tyr Ser Gly Leu Arg Gln Asn
115 120 125ctg act ttg gga cga agt gac atc aac ttc acc ggc ggt tac atc cac480Leu Thr Leu Gly Arg Ser Asp Ile Asn Phe Thr Gly Gly Tyr Ile His130 135 140atc att gac acc gtc ctc acg ctg cca cca aac gtc agc tcg acg gcc528Ile Ile Asp Thr Val Leu Thr Leu Pro Pro Asn Val Ser Ser Thr Ala145 150 155 160gtg gcc acg aac ctg acg gcg ctc gtc ggg gcg ctg acc aac gcc agc576Val Ala Thr Asn Leu Thr Ala Leu Val Gly Ala Leu Thr Asn Ala Ser165 170 175ctg gtc ggg gcg gtc gac acg acg ccg gac gtg acc atc ttc gcg ccg624Leu Val Gly Ala Val Asp Thr Thr Pro Asp Val Thr Ile Phe Ala Pro180 185 190gcc aac gac gca ttc gct gcc atc ggc tca gtg ctc gac ggc acg tca672Ala Asn Asp Ala Phe Ala Ala Ile Gly Ser Val Leu Asp Gly Thr Ser195 200 205tcg gac gac ctg tcg aac ctg ctc agc tac cac gtc gtc aac ggc acc720Ser Asp Asp Leu Ser Asn Leu Leu Ser Tyr His Val Val Asn Gly Thr210 215 220gtc gcg tac tcg tcg gac ctc cag ggc aac cag acg gtc acg gcg ctc768Val Ala Tyr Ser Ser Asp Leu Gln Gly Asn Gln Thr Val Thr Ala Leu225 230 235 240aac ggc ggc gac ctg acg atc cgc gtg ctg gac gac ggc gac gtc ttc816Asn Gly Gly Asp Leu Thr Ile Arg Val Leu Asp Asp Gly Asp Val Phe245 250 255gtc aac ggc gcg cgc gtg atc att ccg gac atc ctg gtg gcg aac ggt864Val Asn Gly Ala Arg Val Ile Ile Pro Asp Ile Leu Val Ala Asn Gly260 265 270gtg gtg cat gtc atc gac aac gtc ctc aac ccc tcc aat tcc acg tcc912Val Val His Val Ile Asp Asn Val Leu Asn Pro Ser Asn Ser Thr Ser275 280 285ggc ccc agc gac gag aac gac gac agc gga gac gtc cag tac acc ggc960Gly Pro Ser Asp Glu Asn Asp Asp Ser Gly Asp Val Gln Tyr Thr Gly290 295 300gcc acg tcc gcg acc aac gtg ccc ttc act tcc ggc gtg gcc acg gca1008Ala Thr Ser Ala Thr Asn Val Pro Phe Thr Ser Gly Val Ala Thr Ala305 310 315 320acg gcg acc gtc ggc gtc acc ggc acc ggc ggt ggt ggt ggt gcg acg1056Thr Ala Thr Val Gly Val Thr Gly Thr Gly Gly Gly Gly Gly Ala Thr325 330 335ggc acg gcg acg ggc act ggt ggt gcc gcg agc gcg agc gcc tcg ggt1104Gly Thr Ala Thr Gly Thr Gly Gly Ala Ala Ser Ala Ser Ala Ser Gly340 345 350gct gcc gct ggt gtt ggg ctg agt ggt ggg ttg atg ggt gtg gcc ctc1152
Ala Ala Ala Gly Val Gly Leu Ser Gly Gly Leu Met Gly Val Ala Leu355 360 365gcg ttg ggt gca gtc ctg tcg ccg ttg1179Ala Leu Gly Ala Val Leu Ser Pro Leu370 375<210>24<211>393<212>PRT<213>Botryosphaeria rhodina<400>24Met Leu Lys His Ile Thr Leu Ala Ala Leu Ala Ser Met Ala Phe Ala-15 -10 -5 -1Gln Thr Gln Asp Leu Asn Ala Thr Leu Ser Gly Ile Pro Glu Leu Ser1 5 10 15Asn Leu Thr Ser Tyr Tyr Ile Ser Leu Pro Asp Ser Leu Ser Ala Leu20 25 30Ser Ala Ala Arg Asn Ile Thr Ile Leu Ala Pro Ser Asn Asn Ala Phe35 40 45Glu Gln Leu Leu Ser Ser Pro Leu Gly Ala Ala Leu Thr Asn Asp Pro50 55 60Asp Leu Val Gln Ala Met Leu Thr Tyr His Val Leu Asn Gly Ser Tyr65 70 75 80Ser Ser Ser Gln Ile Thr Glu Asp Ser Gln Phe Ile Pro Thr Leu Leu85 90 95Thr Asp Pro Arg Tyr Thr Asn Val Thr Gly Gly Gln Arg Val Glu Val100 105 110Glu Lys Glu Asp Gly Asn Asp Val Phe Tyr Ser Gly Leu Arg Gln Asn115 120 125Leu Thr Leu Gly Arg Ser Asp Ile Asn Phe Thr Gly Gly Tyr Ile His130 135 140Ile Ile Asp Thr Val Leu Thr Leu Pro Pro Asn Val Ser Ser Thr Ala145 150 155 160Val Ala Thr Asn Leu Thr Ala Leu Val Gly Ala Leu Thr Asn Ala Ser165 170 175Leu Val Gly Ala Val Asp Thr Thr Pro Asp Val Thr Ile Phe Ala Pro180 185 190Ala Asn Asp Ala Phe Ala Ala Ile Gly Ser Val Leu Asp Gly Thr Ser195 200 205Ser Asp Asp Leu Ser Asn Leu Leu Ser Tyr His Val Val Asn Gly Thr210 215 220
Val Ala Tyr Ser Ser Asp Leu Gln Gly Asn Gln Thr Val Thr Ala Leu225 230 235 240Asn Gly Gly Asp Leu Thr Ile Arg Val Leu Asp Asp Gly Asp Val Phe245 250 255Val Asn Gly Ala Arg Val Ile Ile Pro Asp Ile Leu Val Ala Asn Gly260 265 270Val Val His Val Ile Asp Asn Val Leu Asn Pro Ser Asn Ser Thr Ser275 280 285Gly Pro Ser Asp Glu Asn Asp Asp Ser Gly Asp Val Gln Tyr Thr Gly290 295 300Ala Thr Ser Ala Thr Asn Val Pro Phe Thr Ser Gly Val Ala Thr Ala305 310 315 320Thr Ala Thr Val Gly Val Thr Gly Thr Gly Gly Gly Gly Gly Ala Thr325 330 335Gly Thr Ala Thr Gly Thr Gly Gly Ala Ala Ser Ala Ser Ala Ser Gly340 345 350Ala Ala Ala Gly Val Gly Leu Ser Gly Gly Leu Met Gly Val Ala Leu355 360 365Ala Leu Gly Ala Val Leu Ser Pro Leu370 375<210>25<211>846<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(846)<220>
<221>sig_peptide<222>(1)..(69)<220>
<221>mat_peptide<222>(70)..(846)<400>25atg cgt ttc aca aag acc act cct ctc ctc ctt atc gcc acc acc ttt48Met Arg Phe Thr Lys Thr Thr Pro Leu Leu Leu Ile Ala Thr Thr Phe-20 -15 -10tcc ctc acc tac gcc gcc gct ctc ccg cct gat gac caa cga ctc cct96Ser Leu Thr Tyr Ala Ala Ala Leu Pro Pro Asp Asp Gln Arg Leu Pro-5 -1 1 5cag cct gtg act gac aac aag gac gcc gcc cca ttc aac ttt aac acc144Gln Pro Val Thr Asp Asn Lys Asp Ala Ala Pro Phe Asn Phe Asn Thr10 15 20 25
gac ggc aac ggc aaa ttc tat tac aat ggg ggc ggc gac gat gac aat192Asp Gly Asn Gly Lys Phe Tyr Tyr Asn Gly Gly Gly Asp Asp Asp Asn30 35 40gac gac gac gac gac gat gat gat gac gat gac gac cag ttc gag gcc240Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Gln Phe Glu Ala45 50 55cca gac tgc gac gac gca gaa gat gtg ttg gag gga gag tgc ggc aat288Pro Asp Cys Asp Asp Ala Glu Asp Val Leu Glu Gly Glu Cys Gly Asn60 65 70ctc ctc aac ggt gaa ggc cgt ccc gtg ctg gag ggt gac ggc agt gta336Leu Leu Asn Gly Glu Gly Arg Pro yal Leu Glu Gly Asp Gly Ser Val75 80 85gcg cag aag ggg gct ccg ccg cgc aag gag cgc atc aag gtg cgc agg384Ala Gln Lys Gly Ala Pro Pro Arg Lys Glu Arg Ile Lys Val Arg Arg90 95 100 105agc ctg aag ctt cat cgt ctt cgt cgt cgc aat gcc atc aag gac gat432Ser Leu Lys Leu His Arg Leu Arg Arg Arg Asn Ala Ile Lys Asp Asp110 115 120gat cat gat cac gac gac aaa gac gac cac gac cat gac cat gat gac480Asp His Asp His Asp Asp Lys Asp Asp His Asp His Asp His Asp Asp125 130 135gac acg ccg gcg gag aag gct cgc gag aag gag gaa gac cgt ctc gaa528Asp Thr Pro Ala Glu Lys Ala Arg Glu Lys Glu Glu Asp Arg Leu Glu140 145 150gac ctg cgg gat gcc gag gag gag gct ttg gag aag ttg aag aag ggc576Asp Leu Arg Asp Ala Glu Glu Glu Ala Leu Glu Lys Leu Lys Lys Gly155 160 165ccg aat cat cgc cgc gat gaa gac gac tcc cca gcg gag cgg gct cgt624Pro Asn His Arg Arg Asp Glu Asp Asp Ser Pro Ala Glu Arg Ala Arg170 175 180 185gag aag gaa gag gac aag aag gaa gat ttg cgg gat gcg gag gag gac672Glu Lys Glu Glu Asp Lys Lys Glu Asp Leu Arg Asp Ala Glu Glu Asp190 195 200cgc ttg gag cgt gag cgc aag aag cag ggt aag ggg cat cca cac gac720Arg Leu Glu Arg Glu Arg Lys Lys Gln Gly Lys Gly His Pro His Asp205 210 215gat gac gac gac gat gat gat act cct gag gag aaa gcc cgc gaa cgc768Asp Asp Asp Asp Asp Asp Asp Thr Pro Glu Glu Lys Ala Arg Glu Arg220 225 230gaa gaa gat cgg ctc gag gac ctg cgt gat gcg gag gac ccg tta gtg816Glu Glu Asp Arg Leu Glu Asp Leu Arg Asp Ala Glu Asp Pro Leu Val235 240 245cga atg caa agg cgg cgc caa cca tct tgc846Arg Met Gln Arg Arg Arg Gln Pro Ser Cys
250 255<210>26<211>282<212>PRT<213>Botryosphaeria rhodina<400>26Met Arg Phe Thr Lys Thr Thr Pro Leu Leu Leu Ile Ala Thr Thr Phe-20 -15 -10Ser Leu Thr Tyr Ala Ala Ala Leu Pro Pro Asp Asp Gln Arg Leu Pro-5 -1 1 5Gln Pro Val Thr Asp Asn Lys Asp Ala Ala Pro Phe Asn Phe Asn Thr10 15 20 25Asp Gly Asn Gly Lys Phe Tyr Tyr Asn Gly Gly Gly Asp Asp Asp Asn30 35 40Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Gln Phe Glu Ala45 50 55Pro Asp Cys Asp Asp Ala Glu Asp Val Leu Glu Gly Glu Cys Gly Asn60 65 70Leu Leu Asn Gly Glu Gly Arg Pro Val Leu Glu Gly Asp Gly Ser Val75 80 85Ala Gln Lys Gly Ala Pro Pro Arg Lys Glu Arg Ile Lys Val Arg Arg90 95 100 105Ser Leu Lys Leu His Arg Leu Arg Arg Arg Asn Ala Ile Lys Asp Asp110 115 120Asp His Asp His Asp Asp Lys Asp Asp His Asp His Asp His Asp Asp125 130 135Asp Thr Pro Ala Glu Lys Ala Arg Glu Lys Glu Glu Asp Arg Leu Glu140 145 150Asp Leu Arg Asp Ala Glu Glu Glu Ala Leu Glu Lys Leu Lys Lys Gly155 160 165Pro Asn His Arg Arg Asp Glu Asp Asp Ser Pro Ala Glu Arg Ala Arg170 175 180 185Glu Lys Glu Glu Asp Lys Lys Glu Asp Leu Arg Asp Ala Glu Glu Asp190 195 200Arg Leu Glu Arg Glu Arg Lys Lys Gln Gly Lys Gly His Pro His Asp205 210 215Asp Asp Asp Asp Asp Asp Asp Thr Pro Glu Glu Lys Ala Arg Glu Arg220 225 230Glu Glu Asp Arg Leu Glu Asp Leu Arg Asp Ala Glu Asp Pro Leu Val235 240 245
Arg Met Gln Arg Arg Arg Gln Pro Ser Cys250 255<210>27<211>801<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(801)<220>
<221>sig_peptide<222>(1)..(57)<220>
<221>misc_feature<222>(1)..(801)<223>前肽<220>
<221>mat_peptide<222>(58)..(801)<220>
<221>misc_feature<222>(729)..(798)<223>跨膜肽<400>27atg cgc ttc ttc tcc acc atc gtc ggc gct gcc gcc ctc att tcg agc48Met Arg Phe Phe Ser Thr Ile Val Gly Ala Ala Ala Leu Ile Ser Ser-15 -10 -5gtc gtt gct cag gac ctc ggc atc acc aag gct ccc tcc tct gtc cag96Val Val Ala Gln Asp Leu Gly Ile Thr Lys Ala Pro Ser Ser Val Gln-1 1 5 10gcc ggc caa acc tac acc att gag tac act gcg ccg gct ggc gcc gct144Ala Gly Gln Thr Tyr Thr Ile Glu Tyr Thr Ala Pro Ala Gly Ala Ala15 20 25gtg tct ctc atc ctg cgc aag ggt gac ccc aac aac ctg gac act ctc192Val Ser Leu Ile Leu Arg Lys Gly Asp Pro Asn Asn Leu Asp Thr Leu30 35 40 45act acc ctg acc tcc aat gcc gaa ggc ggt tct tac gag tgg act gtg240Thr Thr Leu Thr Ser Asn Ala Glu Gly Gly Ser Tyr Glu Trp Thr Val50 55 60gcc agc agc cta gag agc gac gac gac tac gcc atc gag att aag cag288Ala Ser Ser Leu Glu Ser Asp Asp Asp Tyr Ala Ile Glu Ile Lys Gln65 70 75ggc gac gac aac aac tac ttc ggc ccc ttc agc ctc acc ggt ggt tcc336Gly Asp Asp Asn Asn Tyr Phe Gly Pro Phe Ser Leu Thr Gly Gly Ser80 85 90
gcc tcg gcc tct tcg gca tct tcc agc tcc tct gct tct gct tct gcc384Ala Ser Ala Ser Ser Ala Ser Ser Ser Ser Ser Ala Ser Ala Ser Ala95 100 105tct tct tcg gcc tct gcc tct gcc tct gcg tcc gcg tct gct tcg gcc432Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala110 115 120 125tct gcc tcg gct tct ggc tcc gcc agc tcg acc gag agc tcc acc atc480Ser Ala Ser Ala Ser Gly Ser Ala Ser Ser Thr Glu Ser Ser Thr Ile130 135 140act gcc agc gcc tcg ctc tcc tcg gct gcc tcc tcg ctg tcc tcg ctg528Thr Ala Ser Ala Ser Leu Ser Ser Ala Ala Ser Ser Leu Ser Ser Leu145 150 155atc tcg gcc gcc aac tcg acc ctg gcc tcc atc acc agc tcg aac gcg576Ile Ser Ala Ala Asn Ser Thr Leu Ala Ser Ile Thr Ser Ser Asn Ala160 165 170act gcc acc agc agc aag ccg tcc aac ggc act atc agc agc acc ctg624Thr Ala Thr Ser Ser Lys Pro Ser Asn Gly Thr Ile Ser Ser Thr Leu175 180 185cac agc tcg act gcc acc tcc acc tcg tcg tcg tcg tct gag ggc tcg672His Ser Ser Thr Ala Thr Ser Thr Ser Ser Ser Ser Ser Glu Gly Ser190 195 200 205agc tcc tcc ggc gcg tcc gag act gcc agc tcg act ggc ggc gcc cct720Ser Ser Ser Gly Ala Ser Glu Thr Ala Ser Ser Thr Gly Gly Ala Pro210 215 220acc tcc ggt gcc gcc atg ccc agc atg gtc agc ccc atc gcg ctc gtc768Thr Ser Gly Ala Ala Met Pro Ser Met Val Ser Pro Ile Ala Leu Val225 230 235ctc ggc gcc gtt gct gcc atg atc ttc ctc aac801Leu Gly Ala Val Ala Ala Met Ile Phe Leu Asn240 245<210>28<211>267<212>PRT<213>Botryosphaeria rhodina<400>28Met Arg Phe Phe Ser Thr Ile Val Gly Ala Ala Ala Leu Ile Ser Ser-15 -10 -5Val Val Ala Gln Asp Leu Gly Ile Thr Lys Ala Pro Ser Ser Val Gln-1 1 5 10Ala Gly Gln Thr Tyr Thr Ile Glu Tyr Thr Ala Pro Ala Gly Ala Ala15 20 25Val Ser Leu Ile Leu Arg Lys Gly Asp Pro Asn Asn Leu Asp Thr Leu30 35 40 45
Thr Thr Leu Thr Ser Asn Ala Glu Gly Gly Ser Tyr Glu Trp Thr Val50 55 60Ala Ser Ser Leu Glu Ser Asp Asp Asp Tyr Ala Ile Glu Ile Lys Gln65 70 75Gly Asp Asp Asn Asn Tyr Phe Gly Pro Phe Ser Leu Thr Gly Gly Ser80 85 90Ala Ser Ala Ser Ser Ala Ser Ser Ser Ser Ser Ala Ser Ala Ser Ala95 100 105Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala110 115 120 125Ser Ala Ser Ala Ser Gly Ser Ala Ser Ser Thr Glu Ser Ser Thr Ile130 135 140Thr Ala Ser Ala Ser Leu Ser Ser Ala Ala Ser Ser Leu Ser Ser Leu145 150 155Ile Ser Ala Ala Asn Ser Thr Leu Ala Ser Ile Thr Ser Ser Asn Ala160 165 170Thr Ala Thr Ser Ser Lys Pro Ser Asn Gly Thr Ile Ser Ser Thr Leu115 180 185His Ser Ser Thr Ala Thr Ser Thr Ser Ser Ser Ser Ser Glu Gly Ser190 195 200 205Ser Ser Ser Gly Ala Ser Glu Thr Ala Ser Ser Thr Gly Gly Ala Pro210 215 220Thr Ser Gly Ala Ala Met Pro Ser Met Val Ser Pro Ile Ala Leu Val225 230 235Leu Gly Ala Val Ala Ala Met Ile Phe Leu Asn240 245<210>29<211>1065<212>DNA<213>Botryosphaeria rhodina<220>
<221>misc_feature<222>(1)..(1065)<223>cDNA<220>
<221>CDS<222>(109)..(603)<220>
<221>transit_peptide<222>(109)..(156)<220>
<221>misc_feature<222>(109)..(603)<223>前肽<220>
<221>mat_peptide<222>(157)..(603)<400>29ggcacgaggc accataatca ctatcagaac ccaaaccagt cgtttctgat atcaaaccct 60catctaaacc tcatctcaaa ccaaccgaaa aggaccaata aaaccaac atg atg caa117Met Met Gln-15ttc ctc act gtc gcc gcc ctc ttc acc acc gcc gcc ttc gcc tct ccc165Phe Leu Thr Val Ala Ala Leu Phe Thr Thr Ala Ala Phe Ala Ser Pro-10 -5 -1 1atc gca cag gct ccc aac acc cca cct gcc ggc act ccc gtc tac act213Ile Ala Gln Ala Pro Asn Thr Pro Pro Ala Gly Thr Pro Val Tyr Thr5 10 15ccg gcc agc acc ccg atc tac tac ccc ctc aac act ccg gtc aac acg261Pro Ala Ser Thr Pro Ile Tyr Tyr Pro Leu Asn Thr Pro Val Asn Thr20 25 30 35cca gtc gcc act ccc ggc agc ggc agc ggc ccc ggc ttc atc ggc ggc309Pro Val Ala Thr Pro Gly Ser Gly Ser Gly Pro Gly Phe Ile Gly Gly40 45 50ggc tac aac agc ctc ccc gtc tgc ggc ccg cac gcc tac gac ccg cgc357Gly Tyr Asn Ser Leu Pro Val Cys Gly Pro His Ala Tyr Asp Pro Arg55 60 65gcc ttc cac tgc tac gac agc agc gtc ggc tac ggc ggc cag acg tac405Ala Phe His Cys Tyr Asp Ser Ser Val Gly Tyr Gly Gly Gln Thr Tyr70 75 80acc aac atc ctg tgc ccg ctg cag aac ggc gag ccg ctg gcc gcc tgc453Thr Asn Ile Leu Cys Pro Leu Gln Asn Gly Glu Pro Leu Ala Ala Cys85 90 95ggc ccg agc tgc tac gac ccg gag atc ttc acc tgc ggc gcc gac ggc501Gly Pro Ser Cys Tyr Asp Pro Glu Ile Phe Thr Cys Gly Ala Asp Gly100 105 110 115atc ctg tct gtc gcc ggc cag tac gcc acc ccc gcc gcc gct acc ccg549Ile Leu Ser Val Ala Gly Gln Tyr Ala Thr Pro Ala Ala Ala Thr Pro120 125 130atg act ccg gcc ggc gtc ttc cct ccg gcc ggc gcg acg ccg acg ggg597Met Thr Pro Ala Gly Val Phe Pro Pro Ala Gly Ala Thr Pro Thr Gly135 140 145ggc ctc taagcgggat cgtccggaat gacgatcagc tcaagcatgt gtgagcgaga653Gly Leu
gagacagagc atagctactg cgtattaaaa gctgtgaaga ggtgacacgg caatgcacgt713tcgtcttggg catttctttt ggggtttcat ggcgtaggat gctgggcgct tcttgggtgg773tcttatgagc atttaacgtt ccttctacgc ttagagtggc tgcaacgttg atgaatgagg833ggggtgatgg tcgatcagtt gaccgttccg tgtgaaccgt gtcaaacacg tcacacgtcg893ccatgagtcg accacgtcgt tgatgtgcaa aagaacatcg aggatgcaac aaggaaatga953ttaatggaca tcatgtttta agtacataaa gggagatcat gggtagacta aacgaaaagc1013cccctctaat gttaatattt ctcatcttaa aaaaaaaaga ttcatttgtc tc1065<210>30<211>165<212>PRT<213>Botryosphaeria rhodina<400>30Met Met Gln Phe Leu Thr Val Ala Ala Leu Phe Thr Thr Ala Ala Phe-15 -10 -5 -1Ala Ser Pro Ile Ala Gln Ala Pro Asn Thr Pro Pro Ala Gly Thr Pro1 5 10 15Val Tyr Thr Pro Ala Ser Thr Pro Ile Tyr Tyr Pro Leu Asn Thr Pro20 25 30Val Asn Thr Pro Val Ala Thr Pro Gly Ser Gly Ser Gly Pro Gly Phe35 40 45Ile Gly Gly Gly Tyr Asn Ser Leu Pro Val Cys Gly Pro His Ala Tyr50 55 60Asp Pro Arg Ala Phe His Cys Tyr Asp Ser Ser Val Gly Tyr Gly Gly65 70 75 80Gln Thr Tyr Thr Asn Ile Leu Cys Pro Leu Gln Asn Gly Glu Pro Leu85 90 95Ala Ala Cys Gly Pro Ser Cys Tyr Asp Pro Glu Ile Phe Thr Cys Gly100 105 110Ala Asp Gly Ile Leu Ser Val Ala Gly Gln Tyr Ala Thr Pro Ala Ala115 120 125Ala Thr Pro Met Thr Pro Ala Gly Val Phe Pro Pro Ala Gly Ala Thr130 135 140Pro Thr Gly Gly Leu145<210>31<211>660<212>DNA<213>Botryosphaeria rhodina
<220>
<221>CDS<222>(1)..(660)<220>
<221>transit_peptide<222>(1)..(54)<220>
<221>misc_feature<222>(1)..(660)<223>前肽<220>
<221>mat_peptide<222>(55)..(660)<400>31atg aag act ttc gca ttc gcc acc gtg gct gcg ctc agc gct gtt gct48Met Lys Thr Phe Ala Phe Ala Thr Val Ala Ala Leu Ser Ala Val Ala-15 -10 -5acc gcc caa gac ttg ggg ctg ttg ctc tca tcc tgc gcc tcc gat caa96Thr Ala Gln Asp Leu Gly Leu Leu Leu Ser Ser Cys Ala Ser Asp Gln-1 1 5 10ttt cag gaa ctt gga ttg acc gga gtc gac ggt gat ccg tgc aag agc144Phe Gln Glu Leu Gly Leu Thr Gly Val Asp Gly Asp Pro Cys Lys Ser15 20 25 30gat gcg ggc aaa tct tcg tac tat gag tgc tcc tgc acc aag ggt cag192Asp Ala Gly Lys Ser Ser Tyr Tyr Glu Cys Ser Cys Thr Lys Gly Gln35 40 45gag ttt gtc gtc gat tac ctc tgc aaa aac cct gga tcc tgc agc ccc240Glu Phe Val Val Asp Tyr Leu Cys Lys Asn Pro Gly Ser Cys Ser Pro50 55 60agc gac atc cct ggc ttg acg gat act ctc gtc agc ttc tgc aaa tcg288Ser Asp Ile Pro Gly Leu Thr Asp Thr Leu Val Ser Phe Cys Lys Ser65 70 75gtc ggt gtc acc gtc aca gct ccc tcg aac ccg tgc ggt ctc tcc ggc336Val Gly Val Thr Val Thr Ala Pro Ser Asn Pro Cys Gly Leu Ser Gly80 85 90ggt agt agc tct tct gct cct gcg tcc tct gcc aca tcc gct ccc gcc384Gly Ser Ser Ser Ser Ala Pro Ala Ser Ser Ala Thr Ser Ala Pro Ala95 100 105 110acg tcc gcc cct agt tct tca cct gca tcg tcg cca gcc tcc tcg gcg432Thr Ser Ala Pro Ser Ser Ser Pro Ala Ser Ser Pro Ala Ser Ser Ala115 120 125gct tcc tcc gca gcg agc tct gcc ccg agc tat gcc ccc agc tcc gct480Ala Ser Ser Ala Ala Ser Ser Ala Pro Ser Tyr Ala Pro Ser Ser Ala130 135 140gca tca tct cct ccg gcc aca act ccc gcc ggt aca ccc act acc ccg528
Ala Ser Ser Pro Pro Ala Thr Thr Pro Ala Gly Thr Pro Thr Thr Pro145 150 155gct gga acc cct tat ggt act cca gtc ggc acc ccg gcc agc act ccg576Ala Gly Thr Pro Tyr Gly Thr Pro Val Gly Thr Pro Ala Ser Thr Pro160 165 170gct gcc tac act ggt gca gct gca gtt aaa aac gtg gct ggt ggt ctc624Ala Ala Tyr Thr Gly Ala Ala Ala Val Lys Asn Val Ala Gly Gly Leu175 180 185 190gtc ggt gtg gct ggt ttt gct ggc ctc ttc ttc ctc660Val Gly Val Ala Gly Phe Ala Gly Leu Phe Phe Leu195 200<210>32<211>220<212>PRT<213>Botryosphaeria rhodina<400>32Met Lys Thr Phe Ala Phe Ala Thr Val Ala Ala Leu Ser Ala Val Ala-15 -10 -5Thr Ala Gln Asp Leu Gly Leu Leu Leu Ser Ser Cys Ala Ser Asp Gln-1 1 5 10Phe Gln Glu Leu Gly Leu Thr Gly Val Asp Gly Asp Pro Cys Lys Ser15 20 25 30Asp Ala Gly Lys Ser Ser Tyr Tyr Glu Cys Ser Cys Thr Lys Gly Gln35 40 45Glu Phe Val Val Asp Tyr Leu Cys Lys Asn Pro Gly Ser Cys Ser Pro50 55 60Ser Asp Ile Pro Gly Leu Thr Asp Thr Leu Val Ser Phe Cys Lys Ser65 70 75Val Gly Val Thr Val Thr Ala Pro Ser Asn Pro Cys Gly Leu Ser Gly80 85 90Gly Ser Ser Ser Ser Ala Pro Ala Ser Ser Ala Thr Ser Ala Pro Ala95 100 105 110Thr Ser Ala Pro Ser Ser Ser Pro Ala Ser Ser Pro Ala Ser Ser Ala115 120 125Ala Ser Ser Ala Ala Ser Ser Ala Pro Ser Tyr Ala Pro Ser Ser Ala130 135 140Ala Ser Ser Pro Pro Ala Thr Thr Pro Ala Gly Thr Pro Thr Thr Pro145 150 155Ala Gly Thr Pro Tyr Gly Thr Pro Val Gly Thr Pro Ala Ser Thr Pro160 165 170Ala Ala Tyr Thr Gly Ala Ala Ala Val Lys Asn Val Ala Gly Gly Leu
175 180 185190Val Gly Val Ala Gly Phe Ala Gly Leu Phe Phe Leu195 200<210>33<211>1854<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(1854)<220>
<221>sig_peptide<222>(1)..(45)<220>
<221>mat_peptide<222>(46)..(1854)<400>33atg tct ttg ctt ttg ctg ctc agc agc ggc gct att gcg ctc gca caa48Met Ser Leu Leu Leu Leu Leu Ser Ser Gly Ala Ile Ala Leu Ala Gln-15 -10 -5 -1 1cag gtc tat gtg tct gct gat gga cct gct caa tgc acc gca agc cag96Gln Val Tyr Val Ser Ala Asp Gly Pro Ala Gln Cys Thr Ala Ser Gln5 10 15act tat tct gcg act tac gct tct ccg acc tat gcc ttc agc aac ttt144Thr Tyr Ser Ala Thr Tyr Ala Ser Pro Thr Tyr Ala Phe Ser Asn Phe20 25 30tcg ttc acg caa acg gag acg gtc cgg act gct acc tca gtc aag tct192Ser Phe Thr Gln Thr Glu Thr Val Arg Thr Ala Thr Ser Val Lys Ser35 40 45gcg cca gtc aca act tac gcc ccg cca tac gca tcc ctc agc cac ctg240Ala Pro Val Thr Thr Tyr Ala Pro Pro Tyr Ala Ser Leu Ser His Leu50 55 60 65gtt cca gat ctg agc aca acg aca tgg gga aac tgg gat ccc aat gcc288Val Pro Asp Leu Ser Thr Thr Thr Trp Gly Asn Trp Asp Pro Asn Ala70 75 80acg gca act gcc acc gat acc gcc gac ccc tac gga cag gct gcg tgg336Thr Ala Thr Ala Thr Asp Thr Ala Asp Pro Tyr Gly Gln Ala Ala Trp85 90 95tct gct ttg tgg gaa cat gcc agt ctc gcc aac ttt acc ttc agg ggt384Ser Ala Leu Trp Glu His Ala Ser Leu Ala Asn Phe Thr Phe Arg Gly100 105 110ctt tac tca aca acc gtc tcc cca act ccg gtg cct act agt gaa ctt432Leu Tyr Ser Thr Thr Val Ser Pro Thr Pro Val Pro Thr Ser Glu Leu115 120 125
gtt ctg ccg cct cca gaa tat ttc act ccc cag gac tgc tct tac ttc480Val Leu Pro Pro Pro Glu Tyr Phe Thr Pro Gln Asp Cys Ser Tyr Phe130 135 140 145cca gac gac ttc atg ttc gga gtt gca ggc tct gct tcc cag atc gaa528Pro Asp Asp Phe Met Phe Gly Val Ala Gly Ser Ala Ser Gln Ile Glu150 155 160ggg gcc atc gca gac gaa ggg aga aca ccc tct ctc atg gaa att ttg576Gly Ala Ile Ala Asp Glu Gly Arg Thr Pro Ser Leu Met Glu Ile Leu165 170 175atc tct cct tcg acc gga aaa ccc acc aac tac gtc aca aac gag aac624Ile Ser Pro Ser Thr Gly Lys Pro Thr Asn Tyr Val Thr Asn Glu Asn180 185 190tac tac ctg tac aag cag gat atc gag cgt ctg gct gct atg gga gtc672Tyr Tyr Leu Tyr Lys Gln Asp Ile Glu Arg Leu Ala Ala Met Gly Val195 200 205aag tac tat tct ttt act att ccg tgg tct cga atc ttg cca ttc gtg720Lys Tyr Tyr Ser Phe Thr Ile Pro Trp Ser Arg Ile Leu Pro Phe Val210 215 220 225ctt gaa ggc acc ccc ctc aac cag caa ggc ctG gac cac tac gac gat768Leu Glu Gly Thr Pro Leu Asn Gln Gln Gly Leu Asp His Tyr Asp Asp230 235 240ctc att aat ttt gtc ctt gag aag gga atg cag ccg act gtc acc ctg816Leu Ile Asn Phe Val Leu Glu Lys Gly Met Gln Pro Thr Val Thr Leu245 250 255atc cac ttc gac acg cct ctg cag ttc tac gga aac aac tta agc act864Ile His Phe Asp Thr Pro Leu Gln Phe Tyr Gly Asn Asn Leu Ser Thr260 265 270gct gcg gac cct cct ctt att ggt tac acc aac gga gct tat cag aat912Ala Ala Asp Pro Pro Leu Ile Gly Tyr Thr Asn Gly Ala Tyr Gln Asn275 280 285gag acg ttc gag gat gct ttc gtg aac tat ggc aag atc gtc atg act960Glu Thr Phe Glu Asp Ala Phe Val Asn Tyr Gly Lys Ile Val Met Thr290 295 300 305cac ttt gct gac cgt gtt cct gtc tgg ttc act ttc aat gaa ccc tta1008His Phe Ala Asp Arg Val Pro Val Trp Phe Thr Phe Asn Glu Pro Leu310 315 320ctc tat tgt gac aat ggc aag agt gta aac acg gtt gtc aaa gcc cat1056Leu Tyr Cys Asp Asn Gly Lys Ser Val Asn Thr Val Val Lys Ala His325 330 335gcc aga ctc tat cat ttc tat cac gag gag atc aac ggc acc ggc aag1104Ala Arg Leu Tyr His Phe Tyr His Glu Glu Ile Asn Gly Thr Gly Lys340 345 350gtt gga atc aag ttc aac gac aac ttt ggt gta cca cgc gac cct cag1152Val Gly Ile Lys Phe Asn Asp Asn Phe Gly Val Pro Arg Asp Pro Gln355 360 365
gat tcc tcg gat gtg gac gcc gcg aac cat ttc aac gag ttt caa ctg1200Asp Ser Ser Asp Val Asp Ala Ala Asn His Phe Asn Glu Phe Gln Leu370 375 380 385gca aca ttt gcc aac cct atc ttc ctc ggg aag gat tac cct gag gcc1248Ala Thr Phe Ala Asn Pro Ile Phe Leu Gly Lys Asp Tyr Pro Glu Ala390 395 400ttc aag atg aca gtc ccc gat tat gtg ccg ctc tca cag gag gat ttg1296Phe Lys Met Thr Val Pro Asp Tyr Val Pro Leu Ser Gln Glu Asp Leu405 410 415gaa tac atc ggt ggt aca tca gac ttc ctc ggc atc gat ccc tac act1344Glu Tyr Ile Gly Gly Thr Ser Asp Phe Leu Gly Ile Asp Pro Tyr Thr420 425 430gcg aca gtc gta agc ccg ccg cct gat gga att gcg gtt tgc gca gcc1392Ala Thr Val Val Ser Pro Pro Pro Asp Gly Ile Ala Val Cys Ala Ala435 440 445aac aca tcc gac ccc ctc ttc ccc tac tgc gtc gag caa tca acc ttg1440Asn Thr Ser Asp Pro Leu Phe Pro Tyr Cys Val Glu Gln Ser Thr Leu450 455 460 465aca agc acc ggc tgg aac atc ggt tac cgt tcg cag acc tac gtc tac1488Thr Ser Thr Gly Trp Asn Ile Gly Tyr Arg Ser Gln Thr Tyr Val Tyr470 475 480atc acg ccc aag tac ctg cgc acc tac ctg tcc tat ctg tgg aac acc1536Ile Thr Pro Lys Tyr Leu Arg Thr Tyr Leu Ser Tyr Leu Trp Asn Thr485 490 495ttc cag cac cct gtc atg atc act gag ttt ggc tac cct gtg ttc ggc1584Phe Gln His Pro Val Met Ile Thr Glu Phe Gly Tyr Pro Val Phe Gly500 505 510gag gcg gac aag gaa gat ctc tcg gac cag ttg tac gac ctt cct cgc1632Glu Ala Asp Lys Glu Asp Leu Ser Asp Gln Leu Tyr Asp Leu Pro Arg515 520 525agc tac tac tac ctc tct ttc atg agt gag gtg ctc aag gca atc tgg1680Ser Tyr Tyr Tyr Leu Ser Phe Met Ser Glu Val Leu Lys Ala Ile Trp530 535 540 545gag gac aac gtc cac gtc ctt ggg gcg ttc gcg tgg agc ttt gcc gat1728Glu Asp Asn Val His Val Leu Gly Ala Phe Ala Trp Ser Phe Ala Asp550 555 560aac tgg gaa ttc ggt gac tac gcg caa caa ttt ggc att cag gtc gtc1776Asn Trp Glu Phe Gly Asp Tyr Ala Gln Gln Phe Gly Ile Gln Val Val565 570 575aac cgt acg acg caa gag agg tat tat aag aag agt ttc ttc gat ctg1824Asn Arg Thr Thr Gln Glu Arg Tyr Tyr Lys Lys Ser Phe Phe Asp Leu580 585 590gtg gac ttc gtg gcg gcg agg aca aag tct1854Val Asp Phe Val Ala Ala Arg Thr Lys Ser
595600<210>34<211>618<212>PRT<213>Botryosphaeria rhodina<400>34Met Ser Leu Leu Leu Leu Leu Ser Ser Gly Ala Ile Ala Leu Ala Gln-15 -10 -5 -1 1Gln Val Tyr Val Ser Ala Asp Gly Pro Ala Gln Cys Thr Ala Ser Gln5 10 15Thr Tyr Ser Ala Thr Tyr Ala Ser Pro Thr Tyr Ala Phe Ser Asn Phe20 25 30Ser Phe Thr Gln Thr Glu Thr Val Arg Thr Ala Thr Ser Val Lys Ser35 40 45Ala Pro Val Thr Thr Tyr Ala Pro Pro Tyr Ala Ser Leu Ser His Leu50 55 60 65Val Pro Asp Leu Ser Thr Thr Thr Trp Gly Asn Trp Asp Pro Asn Ala70 75 80Thr Ala Thr Ala Thr Asp Thr Ala Asp Pro Tyr Gly Gln Ala Ala Trp85 90 95Ser Ala Leu Trp Glu His Ala Ser Leu Ala Asn Phe Thr Phe Arg Gly100 105 110Leu Tyr Ser Thr Thr Val Ser Pro Thr Pro Val Pro Thr Ser Glu Leu115 120 125Val Leu Pro Pro Pro Glu Tyr Phe Thr Pro Gln Asp Cys Ser Tyr Phe130 135 140 145Pro Asp Asp Phe Met Phe Gly Val Ala Gly Ser Ala Ser Gln Ile Glu150 155 160Gly Ala Ile Ala Asp Glu Gly Arg Thr Pro Ser Leu Met Glu Ile Leu165 170 175Ile Ser Pro Ser Thr Gly Lys Pro Thr Asn Tyr Val Thr Asn Glu Asn180 185 190Tyr Tyr Leu Tyr Lys Gln Asp Ile Glu Arg Leu Ala Ala Met Gly Val195 200 205Lys Tyr Tyr Ser Phe Thr Ile Pro Trp Ser Arg Ile Leu Pro Phe Val210 215 220 225Leu Glu Gly Thr Pro Leu Asn Gln Gln Gly Leu Asp His Tyr Asp Asp230 235 240Leu Ile Asn Phe Val Leu Glu Lys Gly Met Gln Pro Thr Val Thr Leu245 250 255
Ile His Phe Asp Thr Pro Leu Gln Phe Tyr Gly Asn Asn Leu Ser Thr260 265 270Ala Ala Asp Pro Pro Leu Ile Gly Tyr Thr Asn Gly Ala Tyr Gln Asn275 280 285Glu Thr Phe Glu Asp Ala Phe Val Asn Tyr Gly Lys Ile Val Met Thr290 295 300 305His Phe Ala Asp Arg Val Pro Val Trp Phe Thr Phe Asn Glu Pro Leu310 315 320Leu Tyr Cys Asp Asn Gly Lys Ser Val Asn Thr Val Val Lys Ala His325 330 335Ala Arg Leu Tyr His Phe Tyr His Glu Glu Ile Asn Gly Thr Gly Lys340 345 350Val Gly Ile Lys Phe Asn Asp Asn Phe Gly Val Pro Arg Asp Pro Gln355 360 365Asp Ser Ser Asp Val Asp Ala Ala Asn His Phe Asn Glu Phe Gln Leu370 375 380 385Ala Thr Phe Ala Asn Pro Ile Phe Leu Gly Lys Asp Tyr Pro Glu Ala390 395 400Phe Lys Met Thr Val Pro Asp Tyr Val Pro Leu Ser Gln Glu Asp Leu405 410 415Glu Tyr Ile Gly Gly Thr Ser Asp Phe Leu Gly Ile Asp Pro Tyr Thr420 425 430Ala Thr Val Val Ser Pro Pro Pro Asp Gly Ile Ala Val Cys Ala Ala435 440 445Asn Thr Ser Asp Pro Leu Phe Pro Tyr Cys Val Glu Gln Ser Thr Leu450 455 460 465Thr Ser Thr Gly Trp Asn Ile Gly Tyr Arg Ser Gln Thr Tyr Val Tyr470 475 480Ile Thr Pro Lys Tyr Leu Arg Thr Tyr Leu Ser Tyr Leu Trp Asn Thr485 490 495Phe Gln His Pro Val Met Ile Thr Glu Phe Gly Tyr Pro Val Phe Gly500 505 510Glu Ala Asp Lys Glu Asp Leu Ser Asp Gln Leu Tyr Asp Leu Pro Arg515 520 525Ser Tyr Tyr Tyr Leu Ser Phe Met Ser Glu Val Leu Lys Ala Ile Trp530 535 540 545Glu Asp Asn Val His Val Leu Gly Ala Phe Ala Trp Ser Phe Ala Asp550 555 560Asn Trp Glu Phe Gly Asp Tyr Ala Gln Gln Phe Gly Ile Gln Val Val
565 570 575Asn Arg Thr Thr Gln Glu Arg Tyr Tyr Lys Lys Ser Phe Phe Asp Leu580 585 590Val Asp Phe Val Ala Ala Arg Thr Lys Ser595 600<210>35<211>966<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(966)<220>
<221>sig_peptide<222>(1)..(63)<220>
<221>mat_peptide<222>(64)..(966)<400>35atg ttg aat ctg aag atc ctc gcg acc tcg ttc ctc cct ctc ctc ccg48Met Leu Asn Leu Lys Ile Leu Ala Thr Ser Phe Leu Pro Leu Leu Pro-20 -15 -10acc ctg gtg agc gga tat gcc aat ccc ggg gcc tgc tca ggg act tgc96Thr Leu Val Ser Gly Tyr Ala Asn Pro Gly Ala Cys Ser Gly Thr Cys-5 -1 1 5 10gtg aac acg cac gac ccc tcg atc att cgc cgc tcc gat ggc aca tac144Val Asn Thr His Asp Pro Ser Ile Ile Arg Arg Ser Asp Gly Thr Tyr15 20 25ttc cgc ttc tcg acg ggc ggc aag atc gcc atc cac act gcg cca gac192Phe Arg Phe Ser Thr Gly Gly Lys Ile Ala Ile His Thr Ala Pro Asp30 35 40atc acg gga cca tgg act tac aag gga gct gct ctg ccc gac ggc tcg240Ile Thr Gly Pro Trp Thr Tyr Lys Gly Ala Ala Leu Pro Asp Gly Ser45 50 55agc att gac ctc gct ggc aaa gac gac ctc tgg gca ccc agc gtc cac288Ser Ile Asp Leu Ala Gly Lys Asp Asp Leu Trp Ala Pro Ser Val His60 65 70 75cag atc gga agc ctg tac tac ctt tac tac tcg gtg agc acg ttt ggg336Gln Ile Gly Ser Leu Tyr Tyr Leu Tyr Tyr Ser Val Ser Thr Phe Gly80 85 90tcg cag aac tcg gca att gga ctg gcg cgg tcg tcg acg atg gac gtg384Ser Gln Asn Ser Ala Ile Gly Leu Ala Arg Ser Ser Thr Met Asp Val95 100 105ggc agc tgg acg gac gtg gga agc acg ggc atc aag tcg gac tcg tcg432
Gly Ser Trp Thr Asp Val Gly Ser Thr Gly Ile Lys Ser Asp Ser Ser110 115 120aag ccg tac aac gcg att gat ccg gcg ctg atc aac gcc gac ggc acg480Lys Pro Tyr Asn Ala Ile Asp Pro Ala Leu Ile Asn Ala Asp Gly Thr125 130 135tac ctc ctc act ttc ggg tcg ttc tgg aag gac ctg tac cag gtg ccg528Tyr Leu Leu Thr Phe Gly Ser Phe Trp Lys Asp Leu Tyr Gln Val Pro140 145 150 155atg aag acc acg ccg acg gct gca agc ggg tcg gcg tac caa gtg gcg576Met Lys Thr Thr Pro Thr Ala Ala Ser Gly Ser Ala Tyr Gln Val Ala160 165 170tac gac ccg gtc agc acg gcg gaa gag ggc ccg ttc atc ttc aag tac624Tyr Asp Pro Val Ser Thr Ala Glu Glu Gly Pro Phe Ile Phe Lys Tyr175 180 185ggc agc tac tac tac ctc ttc tac tcc aag ggc aag tgc tgc ggc tac672Gly Ser Tyr Tyr Tyr Leu Phe Tyr Ser Lys Gly Lys Cys Cys Gly Tyr190 195 200gac agc tcc agg ccg gcg gcg gga gag gag tac aag atc atg gtc tgc720Asp Ser Ser Arg Pro Ala Ala Gly Glu Glu Tyr Lys Ile Met Val Cys205 210 215cgg tcg tcc aag gcc acg ggc gga ttt gtc gac aag agc gga aca tcg768Arg Ser Ser Lys Ala Thr Gly Gly Phe Val Asp Lys Ser Gly Thr Ser220 225 230 235tgc acc aac gga ggc ggg aca gtc gtt ttg gaa tcg cac ggc aac gtt816Cys Thr Asn Gly Gly Gly Thr Val Val Leu Glu Ser His Gly Asn Val240 245 250tac gga ccc gga ggc caa gga gtc tac gac gat ccc aca tac ggg ccg864Tyr Gly Pro Gly Gly Gln Gly Val Tyr Asp Asp Pro Thr Tyr Gly Pro255 260 265att ctc tac tat cac tac gtc gtc acg acc atc gga tac gcc gac ggc912Ile Leu Tyr Tyr His Tyr Val Val Thr Thr Ile Gly Tyr Ala Asp Gly270 275 280cag aag cag ttc ggg tgg aac aag atc aat ttc tcc agc ggt tgg ccg960Gln Lys Gln Phe Gly Trp Asn Lys Ile Asn Phe Ser Ser Gly Trp Pro285 290 295gtc gtg966Val Val300<210>36<211>322<212>PRT<213>Botryosphaeria rhodina<400>36Met Leu Asn Leu Lys Ile Leu Ala Thr Ser Phe Leu Pro Leu Leu Pro
-20 -15 -10Thr Leu yal Ser Gly Tyr Ala Asn Pro Gly Ala Cys Ser Gly Thr Cys-5 -1 1 5 10Val Asn Thr His Asp Pro Ser Ile Ile Arg Arg Ser Asp Gly Thr Tyr15 20 25Phe Arg Phe Ser Thr Gly Gly Lys Ile Ala Ile His Thr Ala Pro Asp30 35 40Ile Thr Gly Pro Trp Thr Tyr Lys Gly Ala Ala Leu Pro Asp Gly Ser45 50 55Ser Ile Asp Leu Ala Gly Lys Asp Asp Leu Trp Ala Pro Ser Val His60 65 70 75Gln Ile Gly Ser Leu Tyr Tyr Leu Tyr Tyr Ser Val Ser Thr Phe Gly80 85 90Ser Gln Asn Ser Ala Ile Gly Leu Ala Arg Ser Ser Thr Met Asp Val95 100 105Gly Ser Trp Thr Asp Val Gly Ser Thr Gly Ile Lys Ser Asp Ser Ser110 115 120Lys Pro Tyr Asn Ala Ile Asp Pro Ala Leu Ile Asn Ala Asp Gly Thr125 130 135Tyr Leu Leu Thr Phe Gly Ser Phe Trp Lys Asp Leu Tyr Gln Val Pro140 145 150 155Met Lys Thr Thr Pro Thr Ala Ala Ser Gly Ser Ala Tyr Gln Val Ala160 165 170Tyr Asp Pro Val Ser Thr Ala Glu Glu Gly Pro Phe Ile Phe Lys Tyr175 180 185Gly Ser Tyr Tyr Tyr Leu Phe Tyr Ser Lys Gly Lys Cys Cys Gly Tyr190 195 200Asp Ser Ser Arg Pro Ala Ala Gly Glu Glu Tyr Lys Ile Met Val Cys205 210 215Arg Ser Ser Lys Ala Thr Gly Gly Phe Val Asp Lys Ser Gly Thr Ser220 225 230 235Cys Thr Asn Gly Gly Gly Thr Val Val Leu Glu Ser His Gly Asn Val240 245 250Tyr Gly Pro Gly Gly Gln Gly Val Tyr Asp Asp Pro Thr Tyr Gly Pro255 260 265Ile Leu Tyr Tyr His Tyr Val Val Thr Thr Ile Gly Tyr Ala Asp Gly270 275 280Gln Lys Gln Phe Gly Trp Asn Lys Ile Asn Phe Ser Ser Gly Trp Pro285 290 295
Val Val300<210>37<211>1368<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(1368)<220>
<221>sig_peptide<222>(1)..(54)<220>
<221>mat_peptide<222>(55)..(1368)<400>37atg cat ttc cct tcc att tgg agc ctc gcg ctc ctt tca tca tca gcc48Met His Phe Pro Ser Ile Trp Ser Leu Ala Leu Leu Ser Ser Ser Ala-15 -10 -5ctc gcg tcg ctg cag atc gtc ccg ggc gcc aca tgg act gcc acc aac96Leu Ala Ser Leu Gln Ile Val Pro Gly Ala Thr Trp Thr Ala Thr Asn-1 1 5 10acc gga cag cac ctt cag gcc cat ggt acc ggc atc atc aag gtt ggc144Thr Gly Gln His Leu Gln Ala His Gly Thr Gly Ile Ile Lys Val Gly15 20 25 30gac acg tac tac atg atc ggc gag gac aag acg aac ggc acc agt ttc192Asp Thr Tyr Tyr Met Ile Gly Glu Asp Lys Thr Asn Gly Thr Ser Phe35 40 45cag aac gtc aac tgc tac tcg tcc acg aac ctc gtc gaa tgg aag tac240Gln Asn Val Asn Cys Tyr Ser Ser Thr Asn Leu Val Glu Trp Lys Tyr50 55 60gaa ggc gcc ctg ctc tcc cag acg gcc tcg ggc gat ctc ggt ccc agc288Glu Gly Ala Leu Leu Ser Gln Thr Ala Ser Gly Asp Leu Gly Pro Ser65 70 75cgc gtg gtt gag cgt ccc aag gtc atc tac aac gac cag acc agc aag336Arg Val Val Glu Arg Pro Lys Val Ile Tyr Asn Asp Gln Thr Ser Lys80 85 90tac gtg ctc tgg atg cac atc gac tcg tcc gac tac aag gac gcc aag384Tyr Val Leu Trp Met His Ile Asp Ser Ser Asp Tyr Lys Asp Ala Lys95 100 105 110aca ggc gtc gcc tcc ggc gat agc gtt tgc ggc tcc tac gag tac cac432Thr Gly Val Ala Ser Gly Asp Ser Val Cys Gly Ser Tyr Glu Tyr His115 120 125ggc agc ttc cgg ccg ttg ggc ttc cag agc agg gat atg ggc ctg ttc480Gly Ser Phe Arg Pro Leu Gly Phe Gln Ser Arg Asp Met Gly Leu Phe
130 135 140aag gac gat gat ggc aag gcg tac ttg atg acc gaa gac cgt gaa aac528Lys Asp Asp Asp Gly Lys Ala Tyr Leu Met Thr Glu Asp Arg Glu Asn145 150 155ggc ctc cgc atc aac gcc ttg acc gac gac tac ctg aac gtc acc ggc576Gly Leu Arg Ile Asn Ala Leu Thr Asp Asp Tyr Leu Asn Val Thr Gly160 165 170gac tcc tct gtc tac cgc ttc gac gag aag tac gaa tcc ccc gcc atg624Asp Ser Ser Val Tyr Arg Phe Asp Glu Lys Tyr Glu Ser Pro Ala Met175 180 185 190gtc aag gtt gac ggg acc tac tac ctc ttc gcc tcc cag ctt acc ggc672Val Lys Val Asp Gly Thr Tyr Tyr Leu Phe Ala Ser Gln Leu Thr Gly195 200 205tgg aac ccc aac gac aac tac tac gtc aca gcc tcc tcc ctc tcc ggc720Trp Asn Pro Asn Asp Asn Tyr Tyr Val Thr Ala Ser Ser Leu Ser Gly210 215 220ccc tgg acc tcc tgg aag acc ttc gcc gac gtc ggc tcc aac acc tac768Pro Trp Thr Ser Trp Lys Thr Phe Ala Asp Val Gly Ser Asn Thr Tyr225 230 235tcc tcg caa acc tcc ttc atc ctc ccc atc acc ggc agc tcc ggc acg816Ser Ser Gln Thr Ser Phe Ile Leu Pro Ile Thr Gly Ser Ser Gly Thr240 245 250acg tac atg tac cta ggc gac cgc tgg atc agc tcc gcc ctc ttc cgc864Thr Tyr Met Tyr Leu Gly Asp Arg Trp Ile Ser Ser Ala Leu Phe Arg255 260 265 270agc acc tac atc tgg ctg ccg ctc acg atc gac tcc gcc gca aag acc912Ser Thr Tyr Ile Trp Leu Pro Leu Thr Ile Asp Ser Ala Ala Lys Thr275 280 285gca tcc atg aag aac gcc gtc aac tgg gtc ccc gac gtc gcc gcc ggc960Ala Ser Met Lys Asn Ala Val Asn Trp Val Pro Asp Val Ala Ala Gly290 295 300acc tgg gcc gct ggc ccc agc gag acg cag ccg gag ggc gaa gac gcg1008Thr Trp Ala Ala Gly Pro Ser Glu Thr Gln Pro Glu Gly Glu Asp Ala305 310 315acg ctc agc ggc ggc gcg agg acg gtg acc tgc agt ggg tgc agc ggc1056Thr Leu Ser Gly Gly Ala Arg Thr Val Thr Cys Ser Gly Cys Ser Gly320 325 330ggg gag ggg gcc ggg tat ctc ggt ggg acg gac tcg ggc gtc gtg acg1104Gly Glu Gly Ala Gly Tyr Leu Gly Gly Thr Asp Ser Gly Val Val Thr335 340 345 350ttt gcg ggg gtg acg agc gat gcg gcg acg aag tcg tcg gtt cgg gtc1152Phe Ala Gly Val Thr Ser Asp Ala Ala Thr Lys Ser Ser Val Arg Val355 360 365aag tat cag aat ttg gat agc acc gcg cgg tat gcg gat gtg agc gtt1200
Lys Tyr Gln Asn Leu Asp Ser Thr Ala Arg Tyr Ala Asp Val Ser Val370 375 380aat ggc ggc gcg aag cag agg atc gcg ttt ttg ccg acg gcg aac ggg1248Asn Gly Gly Ala Lys Gln Arg Ile Ala Phe Leu Pro Thr Ala Asn Gly385 390 395acg cct ggg agt agc gtt gtg aat ctg gat ttg aag gcg ggc agt gcg1296Thr Pro Gly Ser Ser Val Val Asn Leu Asp Leu Lys Ala Gly Ser Ala400 405 410aat gag gtg gtt att gag ggc gcg aat ggt ggg tgg gga cct gat gtg1344Asn Glu Val Val Ile Glu Gly Ala Asn Gly Gly Trp Gly Pro Asp Val415 420 425 430gat cgg att atg gtg ccg cgg tcg1368Asp Arg Ile Met Val Pro Arg Ser435<210>38<211>456<212>PRT<213>Botryosphaeria rhodina<400>38Met His Phe Pro Ser Ile Trp Ser Leu Ala Leu Leu Ser Ser Ser Ala-15 -10 -5Leu Ala Ser Leu Gln Ile Val Pro Gly Ala Thr Trp Thr Ala Thr Asn-1 1 5 10Thr Gly Gln His Leu Gln Ala His Gly Thr Gly Ile Ile Lys Val Gly15 20 25 30Asp Thr Tyr Tyr Met Ile Gly Glu Asp Lys Thr Asn Gly Thr Ser Phe35 40 45Gln Asn Val Asn Cys Tyr Ser Ser Thr Asn Leu Val Glu Trp Lys Tyr50 55 60Glu Gly Ala Leu Leu Ser Gln Thr Ala Ser Gly Asp Leu Gly Pro Ser65 70 75Arg Val Val Glu Arg Pro Lys Val Ile Tyr Asn Asp Gln Thr Ser Lys80 85 90Tyr Val Leu Trp Met His Ile Asp Ser Ser Asp Tyr Lys Asp Ala Lys95 100 105 110Thr Gly Val Ala Ser Gly Asp Ser Val Cys Gly Ser Tyr Glu Tyr His115 120 125Gly Ser Phe Arg Pro Leu Gly Phe Gln Ser Arg Asp Met Gly Leu Phe130 135 140Lys Asp Asp Asp Gly Lys Ala Tyr Leu Met Thr Glu Asp Arg Glu Asn145 150 155
Gly Leu Arg Ile Asn Ala Leu Thr Asp Asp Tyr Leu Asn Val Thr Gly160 165 170Asp Ser Ser Val Tyr Arg Phe Asp Glu Lys Tyr Glu Ser Pro Ala Met175 180 185 190Val Lys Val Asp Gly Thr Tyr Tyr Leu Phe Ala Ser Gln Leu Thr Gly195 200 205Trp Asn Pro Asn Asp Asn Tyr Tyr Val Thr Ala Ser Ser Leu Ser Gly210 215 220Pro Trp Thr Ser Trp Lys Thr Phe Ala Asp Val Gly Ser Asn Thr Tyr225 230 235Ser Ser Gln Thr Ser Phe Ile Leu Pro Ile Thr Gly Ser Ser Gly Thr240 245 250Thr Tyr Met Tyr Leu Gly Asp Arg Trp Ile Ser Ser Ala Leu Phe Arg255 260 265 270Ser Thr Tyr Ile Trp Leu Pro Leu Thr Ile Asp Ser Ala Ala Lys Thr275 280 285Ala Ser Met Lys Asn Ala Val Asn Trp Val Pro Asp Val Ala Ala Gly290 295 300Thr Trp Ala Ala Gly Pro Ser Glu Thr Gln Pro Glu Gly Glu Asp Ala305 310 315Thr Leu Ser Gly Gly Ala Arg Thr Val Thr Cys Ser Gly Cys Ser Gly320 325 330Gly Glu Gly Ala Gly Tyr Leu Gly Gly Thr Asp Ser Gly Val Val Thr335 340 345 350Phe Ala Gly Val Thr Ser Asp Ala Ala Thr Lys Ser Ser Val Arg Val355 360 365Lys Tyr Gln Asn Leu Asp Ser Thr Ala Arg Tyr Ala Asp Val Ser Val370 375 380Asn Gly Gly Ala Lys Gln Arg Ile Ala Phe Leu Pro Thr Ala Asn Gly385 390 395Thr Pro Gly Ser Ser Val Val Asn Leu Asp Leu Lys Ala Gly Ser Ala400 405 410Asn Glu Val Val Ile Glu Gly Ala Asn Gly Gly Trp Gly Pro Asp Val415 420 425 430Asp Arg Ile Met Val Pro Arg Ser435<210>39<211>1248<212>DNA<213>Botryosphaeria rhodina
<220>
<221>CDS<222>(1)..(1248)<220>
<221>sig_peptide<222>(1)..(60)<220>
<221>mat_peptide<222>(61)..(1248)<400>39atg gca acg cgt gca ctc tct acg ttc gtt ttg gcc aac ttt ctg ggc48Met Ala Thr Arg Ala Leu Ser Thr Phe Val Leu Ala Asn Phe Leu Gly-20 -15 -10 -5tca tgc ctc tct tta gct gtt cca gtc gtg cgc caa agc ggc aaa gtt96Ser Cys Leu Ser Leu Ala Val Pro Val Val Arg Gln Ser Gly Lys Val-1 1 5 10ggc gtc ctt gat gtt tcc atc cca ccc aac agg aac gat gac caa tac144Gly Val Leu Asp Val Ser Ile Pro Pro Asn Arg Asn Asp Asp Gln Tyr15 20 25tac acg gtt gat ctc gat ttc gat ggc caa act gtt ccg gtt ctt ctc192Tyr Thr Val Asp Leu Asp Phe Asp Gly Gln Thr Val Pro Val Leu Leu30 35 40gat act ggc tct gga gat ctc ttc gtt ggg tca aac caa tgc agc acg240Asp Thr Gly Ser Gly Asp Leu Phe Val Gly Ser Asn Gln Cys Ser Thr45 50 55 60act gat cca gac agt gga tgc tac aac agc cca ttt tac caa atc acc288Thr Asp Pro Asp Ser Gly Cys Tyr Asn Ser Pro Phe Tyr Gln Ile Thr65 70 75aat gaa acc gtc atc gtt gcg aac gag acg ttc ggc act gtt gtg gga336Asn Glu Thr Val Ile Val Ala Asn Glu Thr Phe Gly Thr Val Val Gly80 85 90gtt gcc ggc gtg aat gga aat cag tcc atc atg ccc gtt gat ttt gga384Val Ala Gly Val Asn Gly Asn Gln Ser Ile Met Pro Val Asp Phe Gly95 100 105ggc gtt acc att cca gat ctc gcc act ccc ctt ctt tat tat gcg ggc432Gly Val Thr Ile Pro Asp Leu Ala Thr Pro Leu Leu Tyr Tyr Ala Gly110 115 120aag ggc gag ttc cag aat ggg tct ttt gga ggc att ctt ggt gtc tct480Lys Gly Glu Phe Gln Asn Gly Ser Phe Gly Gly Ile Leu Gly Val Ser125 130 135 140ccg cgc aac gtt tct cgc aac tat tac ttc ttc gag cgg ctt cct cca528Pro Arg Asn Val Ser Arg Asn Tyr Tyr Phe Phe Glu Arg Leu Pro Pro145 150 155atc gat gcc atg atc aca gaa ggt ctg ttg gag aag ccc gtc ttc tcg576Ile Asp Ala Met Ile Thr Glu Gly Leu Leu Glu Lys Pro Val Phe Ser
160 165 170ctg acc ctg ccg aga ctg gga gat cct gat tcc ata tcc gga aaa ttg624Leu Thr Leu Pro Arg Leu Gly Asp Pro Asp Ser Ile Ser Gly Lys Leu175 180 185aca ctt ggc gcc atc gag gac gct ccg atc atc gga gac atc tcc tac672Thr Leu Gly Ala Ile Glu Asp Ala Pro Ile Ile Gly Asp Ile Ser Tyr190 195 200aac gaa atc atc gac gca ccc aac tac ggc tac gag gat gcc cgt ctc720Asn Glu Ile Ile Asp Ala Pro Asn Tyr Gly Tyr Glu Asp Ala Arg Leu205 210 215 220gcc ccg atg tcc tgg acc tcc cag ctg gag ggc gtg cgc atg aac gga768Ala Pro Met Ser Trp Thr Ser Gln Leu Glu Gly Val Arg Met Asn Gly225 230 235gtt gag atc aac atg acg cag agc tca atc gac gcg caa ggc cgc tac816Val Glu Ile Asn Met Thr Gln Ser Ser Ile Asp Ala Gln Gly Arg Tyr240 245 250ctc tcc ctc ttc gac tcg ggc gcc caa acc atc ctc ctc cgc tac caa864Leu Ser Leu Phe Asp Ser Gly Ala Gln Thr Ile Leu Leu Arg Tyr Gln255 260 265gaa ttc acc gcc gtc gcc gcg ctc ttc aag ggc aag acg att gtg cag912Glu Phe Thr Ala Val Ala Ala Leu Phe Lys Gly Lys Thr Ile Val Gln270 275 280gac ggc tac gcc gtc tac ttc gac tgc gcc gag ccg cag ctg ctc gag960Asp Gly Tyr Ala Val Tyr Phe Asp Cys Ala Glu Pro Gln Leu Leu Glu285 290 295 300ctg aac tac cac ggc cgc tgg ttc gcc gtc gac ccg ctc gac ttg ata1008Leu Asn Tyr His Gly Arg Trp Phe Ala Val Asp Pro Leu Asp Leu Ile305 310 315atc ccc agc gac cat ggt gtg gtc aac ggg acg gtg atg tgc aag tcc1056Ile Pro Ser Asp His Gly Val Val Asn Gly Thr Val Met Cys Lys Ser320 325 330gcg ctg ggc acg tgg agc agg acg ttt gcg gac tcg att atc ggt gtg1104Ala Leu Gly Thr Trp Ser Arg Thr Phe Ala Asp Ser Ile Ile Gly Val335 340 345ccg ttt atg cgg aat acg ctg agt gtg ttt gat tac gtg acg gag gat1152Pro Phe Met Arg Asn Thr Leu Ser Val Phe Asp Tyr Val Thr Glu Asp350 355 360ttg tac agt gtg cag ccg cgc gtg ggg ttg ggg agc ttg acg gat ggc1200Leu Tyr Ser Val Gln Pro Arg Val Gly Leu Gly Ser Leu Thr Asp Gly365 370 375 380gcg gcg gcg atg gag agg tat gcg ggg ttg tat cag aat agg ttg ttg1248Ala Ala Ala Met Glu Arg Tyr Ala Gly Leu Tyr Gln Asn Arg Leu Leu385 390 395<210>40
<211>416<212>PRT<213>Botryosphaeria rhodina<400>40Met Ala Thr Arg Ala Leu Ser Thr Phe Val Leu Ala Asn Phe Leu Gly-20 -15 -10 -5Ser Cys Leu Ser Leu Ala Val Pro Val Val Arg Gln Ser Gly Lys Val-1 1 5 10Gly Val Leu Asp Val Ser Ile Pro Pro Asn Arg Asn Asp Asp Gln Tyr15 20 25Tyr Thr Val Asp Leu Asp Phe Asp Gly Gln Thr Val Pro Val Leu Leu30 35 40Asp Thr Gly Ser Gly Asp Leu Phe Val Gly Ser Asn Gln Cys Ser Thr45 50 55 60Thr Asp Pro Asp Ser Gly Cys Tyr Asn Ser Pro Phe Tyr Gln Ile Thr65 70 75Asn Glu Thr Val Ile Val Ala Asn Glu Thr Phe Gly Thr Val Val Gly80 85 90Val Ala Gly Val Asn Gly Asn Gln Ser Ile Met Pro Val Asp Phe Gly95 100 105Gly Val Thr Ile Pro Asp Leu Ala Thr Pro Leu Leu Tyr Tyr Ala Gly110 115 120Lys Gly Clu Phe Gln Asn Gly Ser Phe Gly Gly Ile Leu Gly Val Ser125 130 135 140Pro Arg Asn Val Ser Arg Asn Tyr Tyr Phe Phe Glu Arg Leu Pro Pro145 150 155Ile Asp Ala Met Ile Thr Glu Gly Leu Leu Glu Lys Pro Val Phe Ser160 165 170Leu Thr Leu Pro Arg Leu Gly Asp Pro Asp Ser Ile Ser Gly Lys Leu175 180 185Thr Leu Gly Ala Ile Glu Asp Ala Pro Ile Ile Gly Asp Ile Ser Tyr190 195 200Asn Glu Ile Ile Asp Ala Pro Asn Tyr Gly Tyr Glu Asp Ala Arg Leu205 210 215 220Ala Pro Met Ser Trp Thr Ser Gln Leu Glu Gly Val Arg Met Asn Gly225 230 235Val Glu Ile Asn Met Thr Gln Ser Ser Ile Asp Ala Gln Gly Arg Tyr240 245 250Leu Ser Leu Phe Asp Ser Gly Ala Gln Thr Ile Leu Leu Arg Tyr Gln255 260 265
Glu Phe Thr Ala Val Ala Ala Leu Phe Lys Gly Lys Thr Ile Val Gln270 275 280Asp Gly Tyr Ala Val Tyr Phe Asp Cys Ala Glu Pro Gln Leu Leu Glu285 290 295 300Leu Asn Tyr His Gly Arg Trp Phe Ala Val Asp Pro Leu Asp Leu Ile305 310 315Ile Pro Ser Asp His Gly Val Val Asn Gly Thr Val Met Cys Lys Ser320 325 330Ala Leu Gly Thr Trp Ser Arg Thr Phe Ala Asp Ser Ile Ile Gly Val335 340 345Pro Phe Met Arg Asn Thr Leu Ser Val Phe Asp Tyr Val Thr Glu Asp350 355 360Leu Tyr Ser Val Gln Pro Arg Val Gly Leu Gly Ser Leu Thr Asp Gly365 370 375 380Ala Ala Ala Met Glu Arg Tyr Ala Gly Leu Tyr Gln Asn Arg Leu Leu385 390 395<210>41<211>849<212>DNA<213>Botryosphaeria rhodina<220>
<221>CDS<222>(1)..(849)<220>
<221>sig_peptide<222>(1)..(63)<220>
<221>mat_peptide<222>(64)..(849)<400>41atg ctt ccg aaa atc gct ctt cag ggt ggc ctc gtg gct ctg ctg gtg48Met Leu Pro Lys Ile Ala Leu Gln Gly Gly Leu Val Ala Leu Leu Val-20 -15 -10caa aca gcc gca gcc caa gta cga tgc gcc act ccc gat ccc cca aaa96Gln Thr Ala Ala Ala Gln Val Arg Cys Ala Thr Pro Asp Pro Pro Lys-5 -1 1 5 10gag ctg ctg gag cat gca gcg gag atg aaa gcg caa gaa aag gcg atg144Glu Leu Leu Glu His Ala Ala Glu Met Lys Ala Gln Glu Lys Ala Met15 20 25aaa gat gct gga att cag caa gcc cgg gcc cct atc aca atc aat gct192Lys Asp Ala Gly Ile Gln Gln Ala Arg Ala Pro Ile Thr Ile Asn Ala30 35 40
tgg ttc cac gtc atc gct gcc tct gac acc gtt gag gat gcc aac ttg240Trp Phe His Val Ile Ala Ala Ser Asp Thr Val Glu Asp Ala Asn Leu45 50 55act gat gaa atg ctt caa aac caa ctt gag gtg ctc aat tcc aac tac288Thr Asp Glu Met Leu Gln Asn Gln Leu Glu Val Leu Asn Ser Asn Tyr60 65 70 75gct ccg cac gac atc cag ttc aat ctc tcg ggc aca acc agg act gtc336Ala Pro His Asp Ile Gln Phe Asn Leu Ser Gly Thr Thr Arg Thr Val80 85 90aac agc agt tgg tct gac aac acc gat acg ctt gtc atg aag aca caa384Asn Ser Ser Trp Ser Asp Asn Thr Asp Thr Leu Val Met Lys Thr Gln95 100 105ctc cgg aag ggc gat tat gct act ctc aac ttg tat ttc cag agg aaa432Leu Arg Lys Gly Asp Tyr Ala Thr Leu Asn Leu Tyr Phe Gln Arg Lys110 115 120ctc ccg ggt gac tca tca ggt tac tgc acc ttc cct gga atc gtt gaa480Leu Pro Gly Asp Ser Ser Gly Tyr Cys Thr Phe Pro Gly Ile Val Glu125 130 135gag ggg acg cta gac ttc ttc aac gac ggc tgc gtg att gac gcc cag528Glu Gly Thr Leu Asp Phe Phe Asn Asp Gly Cys Val Ile Asp Ala Gln140 145 150 155acc gtg cct gga ggc agc aaa gtc ccg tac aac gag ggg aaa aca gcc576Thr Val Pro Gly Gly Ser Lys Val Pro Tyr Asn Glu Gly Lys Thr Ala160 165 170acc cat gag gtc ggc cac tgg ttc ggt ctc tac cac aca ttt caa ggc624Thr His Glu Val Gly His Trp Phe Gly Leu Tyr His Thr Phe Gln Gly175 180 185ggc tgc aac ggc ggc gac ggt att gac gac acg cca gct caa gca agc672Gly Cys Asn Gly Gly Asp Gly Ile Asp Asp Thr Pro Ala Gln Ala Ser190 195 200tac agc gag ggt tgt ccc gtt ggt agg gac tcg tgt ccg gat ttg cct720Tyr Ser Glu Gly Cys Pro Val Gly Arg Asp Ser Cys Pro Asp Leu Pro205 210 215gga ttg gac ccg att cac aac tac atg gac tat tca gat gac gct tgc768Gly Leu Asp Pro Ile His Asn Tyr Met Asp Tyr Ser Asp Asp Ala Cys220 225 230 235tac gaa gaa ttt act cct gat caa gat gct cgc atg cgg tcc aac tgg816Tyr Glu Glu Phe Thr Pro Asp Gln Asp Ala Arg Met Arg Ser Asn Trp240 245 250gac tac tat cgc gcg gcc gcg cag ggc agt gag849Asp Tyr Tyr Arg Ala Ala Ala Gln Gly Ser Glu255 260<210>42<211>283<212>PRT
<213>Botryosphaeria rhodina<400>42Met Leu Pro Lys Ile Ala Leu Gln Gly Gly Leu Val Ala Leu Leu Val-20 -15 -10Gln Thr Ala Ala Ala Gln Val Arg Cys Ala Thr Pro Asp Pro Pro Lys-5 -1 1 5 10Glu Leu Leu Glu His Ala Ala Glu Met Lys Ala Gln Glu Lys Ala Met15 20 25Lys Asp Ala Gly Ile Gln Gln Ala Arg Ala Pro Ile Thr Ile Asn Ala30 35 40Trp Phe His Val Ile Ala Ala Ser Asp Thr Val Glu Asp Ala Asn Leu45 50 55Thr Asp Glu Met Leu Gln Asn Gln Leu Glu Val Leu Asn Ser Asn Tyr60 65 70 75Ala Pro His Asp Ile Gln Phe Asn Leu Ser Gly Thr Thr Arg Thr Val80 85 90Asn Ser Ser Trp Ser Asp Asn Thr Asp Thr Leu Val Met Lys Thr Gln95 100 105Leu Arg Lys Gly Asp Tyr Ala Thr Leu Asn Leu Tyr Phe Gln Arg Lys110 115 120Leu Pro Gly Asp Ser Ser Gly Tyr Cys Thr Phe Pro Gly Ile Val Glu125 130 135Glu Gly Thr Leu Asp Phe Phe Asn Asp Gly Cys Val Ile Asp Ala Gln140 145 150 155Thr Val Pro Gly Gly Ser Lys Val Pro Tyr Asn Glu Gly Lys Thr Ala160 165 170Thr His Glu Val Gly His Trp Phe Gly Leu Tyr His Thr Phe Gln Gly175 180 185Gly Cys Asn Gly Gly Asp Gly Ile Asp Asp Thr Pro Ala Gln Ala Ser190 195 200Tyr Ser Glu Gly Cys Pro Val Gly Arg Asp Ser Cys Pro Asp Leu Pro205 210 215Gly Leu Asp Pro Ile His Asn Tyr Met Asp Tyr Ser Asp Asp Ala Cys220 225 230 235Tyr Glu Glu Phe Thr Pro Asp Gln Asp Ala Arg Met Arg Ser Asn Trp240 245 250Asp Tyr Tyr Arg Ala Ala Ala Gln Gly Ser Glu255 260<210>43
<211>34<212>DNA<213>人工序列<220>
<223>引物SigA2NotU-P<400>43tcgcgatccg ttttcgcatt tatcgtgaaa cgct 34<210>44<211>33<212>DNA<213>人工序列<220>
<223>引物SigA2NotD-P<400>44ccgcaaacgc tggtgaaagt aaaagatgct gaa 33<210>45<211>20<212>DNA<213>人工序列<220>
<223>引物A<400>45agcgtttgcg gccgcgatcc 20<210>46<211>21<212>DNA<213>人工序列<220>
<223>引物B<400>46ttattcggtc gaaaaggatc c21<210>47<211>34<212>DNA<213>人工序列<220>
<223>引物#166<400>47cgcggatcca ccatggtctc cttcaagtcg attc 34<210>48<211>30<212>DNA<213>人工序列
<220>
<223>引物#167<400>48ccgctcgagt tactgcacgg taatcgtagc 30
權利要求
1.選自下組的分離多肽(a)包含氨基酸序列的多肽,所述氨基酸序列與由SEQ ID NO2,SEQID NO4,SEQ ID NO6,SEQ ID NO8,SEQ ID NO10,SEQ ID NO12,SEQID NO14,SEQ ID NO16,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,SEQ IDNO32,SEQ ID NO34,SEQ ID NO36,SEQ ID NO38,SEQ ID NO40和SEQID NO42構成的組中所包含的成熟多肽的序列具有至少90%的同一性,(b)由核苷酸序列所編碼的多肽,該核苷酸序列在高度嚴緊條件下與選自下組多核苷酸探針雜交(i)核苷酸序列的互補鏈,所述核苷酸序列選自SEQ ID NO1,SEQ IDNO3,SEQ ID NO5,SEQ ID NO7,SEQ ID NO9,SEQ ID NO11,SEQ IDNO13,SEQ ID NO15,SEQ ID NO17,SEQ ID NO19,SEQ ID NO21,SEQID NO23,SEQ ID NO25,SEQ ID NO27,SEQ ID NO29,SEQ ID NO31,SEQ ID NO33,SEQ ID NO35,SEQ ID NO37,SEQ ID NO39和SEQ IDNO41的編碼成熟多肽的區(qū)域,(ii)核苷酸序列中所包含的cDNA序列的互補鏈,所述核苷酸序列選自SEQ ID NO1,SEQ ID NO3,SEQ ID NO5,SEQ ID NO7,SEQ ID NO9,SEQ ID NO11,SEQ ID NO13,SEQ ID NO15,SEQ ID NO17,SEQ IDNO19,SEQ ID NO21,SEQ ID NO23,SEQ ID NO25,SEQ ID NO27,SEQID NO29,SEQ ID NO31,SEQ ID NO33,SEQ ID NO35,SEQ ID NO37,SEQ ID NO39和SEQ ID NO41的編碼成熟多肽的區(qū)域,其中所述多肽具有由SEQ ID NO2,SEQ ID NO4,SEQ ID NO6,SEQID NO8,SEQ ID NO10,SEQ ID NO12,SEQ ID NO14,SEQ ID NO16,SEQID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,SEQ ID NO32,SEQ ID NO34,SEQ IDNO36,SEQ ID NO38,SEQ ID NO40和SEQ ID NO42構成的組中所包含的相應成熟多肽的功能。
2.選自下組的分離的酶(a)包含氨基酸序列的酶,所述氨基酸序列與選自以CBS保藏登錄號274.96保藏的Botryosphaeria rhodina菌株所分泌的木聚糖酶、絲氨酸酯酶、過氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶的氨基酸序列具有至少90%的同一性。(b)由核苷酸序列編碼的多肽,該核苷酸序列在高度嚴緊條件下與選自下列的多核苷酸探針雜交(i)核苷酸序列的互補鏈,所述核苷酸序列包含于以CBS保藏登錄號274.96保藏的Botryosphaeria rhodina菌株中,并編碼成熟酶,該成熟酶選自該菌株所分泌的木聚糖酶、絲氨酸酯酶、過氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶,(ii)核苷酸序列所含cDNA序列的互補鏈,所述核苷酸序列包含于以CBS保藏登錄號274.96保藏的Botryosphaeria rhodina菌株中,并編碼成熟酶,該成熟酶選自該菌株所分泌的木聚糖酶、絲氨酸酯酶、過氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶;其中所述酶具有選自木聚糖酶、絲氨酸酯酶、過氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、內切阿拉伯糖酶和胃蛋白酶肽酶的功能。
3.權利要求1或2的多肽,其選自(a)包含氨基酸序列的多肽,所述氨基酸序列與選自下列的序列具有至少90%的同一性SEQ ID NO2的氨基酸1-291;SEQ ID NO4的1-202;SEQ ID NO6的氨基酸1-352;SEQ ID NO8的氨基酸1-431;SEQ ID NO10的氨基酸1-185;SEQ ID NO12的氨基酸1-218;SEQ ID NO14的氨基酸1-249;SEQ IDNO16的1-255;SEQ ID NO18的氨基酸1-205;SEQ ID NO20的氨基酸1-243;SEQ ID NO22的氨基酸1-415;SEQ ID NO24的氨基酸1-377;SEQID NO26的氨基酸1-259;SEQ ID NO28的氨基酸1-248;SEQ ID NO30的氨基酸1-149;SEQ ID NO32的氨基酸1-202;SEQ ID NO34的氨基酸1-603;SEQ ID NO36的氨基酸1-301;SEQ ID NO38的氨基酸1-438;SEQID NO40的氨基酸1-396;和SEQ ID NO42的氨基酸1-262;(b)由核苷酸序列編碼的多肽,所述核苷酸序列在高度嚴緊條件下與選自下列的多核苷酸雜交(i)核苷酸序列的互補鏈,所述核苷酸序列選自SEQ ID NO1的核苷酸55-927、SEQ ID NO3的核苷酸58-663、SEQ ID NO5的核苷酸55-1110、SEQ ID NO7的核苷酸55-1347、SEQ ID NO9的核苷酸1-555、SEQ IDNO11的核苷酸49-702、SEQ ID NO13的核苷酸40-786、SEQ ID NO15的核苷酸55-819、SEQ ID NO17的核苷酸61-675、SEQ ID NO19的核苷酸1-729、SEQ ID NO21的核苷酸55-1299、SEQ ID NO23的核苷酸49-1179、SEQ ID NO25的核苷酸70-846、SEQ ID NO27的核苷酸58-810、SEQ IDNO31的核苷酸55-660、SEQ ID NO33的核苷酸46-1854、SEQ ID NO35的核苷酸64-966、SEQ ID NO37的核苷酸55-1368、SEQ ID NO39的核苷酸61-1248,和SEQ ID NO41的核苷酸64-849;(ii)核苷酸序列中所包含的cDNA序列的互補鏈,所述核苷酸序列選自SEQ ID NO1的核苷酸55-927、SEQ ID NO3的核苷酸58-663、SEQ IDNO5的核苷酸55-1110、SEQ ID NO7的核苷酸55-1347、SEQ ID NO9的核苷酸1-555、SEQ ID NO11的核苷酸49-702、SEQ ID NO13的核苷酸40-786、SEQ ID NO15的核苷酸55-819、SEQ ID NO17的核苷酸61-675、SEQ ID NO19的核苷酸1-729、SEQ ID NO21的核苷酸55-1299、SEQ IDNO23的核苷酸49-1179、SEQ ID NO25的核苷酸70-846、SEQ ID NO27的核苷酸58-810、SEQ ID NO31的核苷酸55-660、SEQ ID NO33的核苷酸46-1854、SEQ ID NO35的核苷酸64-966、SEQ ID NO37的核苷酸55-1368、SEQ ID NO39的核苷酸61-1248,和SEQ ID NO41的核苷酸64-849。
4.權利要求3的多肽,其中所述多肽是酶,所述酶選自具有這樣的氨基酸序列的多肽所述氨基酸序列與選自下列的氨基酸序列具有至少95%的同一性SEQ ID NO2的氨基酸1-291;SEQ ID NO4的1-202;SEQ IDNO6的氨基酸1-352;SEQ ID NO8的氨基酸1-431;SEQ ID NO10的氨基酸1-185;SEQ ID NO12的氨基酸1-218;SEQ ID NO14的氨基酸1-249;SEQ ID NO16的1-255;SEQ ID NO18的氨基酸1-205;SEQ ID NO20的氨基酸1-243;SEQ ID NO22的氨基酸1-415;SEQ ID NO24的氨基酸1-377;SEQ ID NO26的氨基酸1-259;SEQ ID NO28的氨基酸1-248;SEQ IDNO30的氨基酸1-149;SEQ ID NO32的氨基酸1-202;SEQ ID NO34的氨基酸1-603;SEQ ID NO36的氨基酸1-301;SEQ ID NO38的氨基酸1-438;SEQ ID NO40的氨基酸1-396;和SEQ ID NO42的氨基酸1-262。
5.權利要求4的多肽,其中該多肽是酶,所述酶選自由這樣的核苷酸序列所編碼的多肽,所述核苷酸序列在極高嚴緊條件下與選自下列的多核苷酸雜交(i)核苷酸序列的互補鏈,所述核苷酸序列選自SEQ ID NO1的核苷酸55-927、SEQ ID NO3的核苷酸58-663、SEQ ID NO5的核苷酸55-1110、SEQ ID NO7的核苷酸55-1347、SEQ ID NO9的核苷酸1-555、SEQ IDNO11的核苷酸49-702、SEQ ID NO13的核苷酸40-786、SEQ ID NO15的核苷酸55-819、SEQ ID NO17的核苷酸61-675、SEQ ID NO19的核苷酸1-729、SEQ ID NO21的核苷酸55-1299、SEQ ID NO23的核苷酸49-1179、SEQ ID NO25的核苷酸70-846、SEQ ID NO27的核苷酸58-810、SEQ IDNO31的核苷酸55-660、SEQ ID NO33的核苷酸46-1854、SEQ ID NO35的核苷酸64-966、SEQ ID NO37的核苷酸55-1368、SEQ ID NO39的核苷酸61-1248,和SEQ ID NO41的核苷酸64-849;和(ii)核苷酸序列中所包含的cDNA序列的互補鏈,所述核苷酸序列選自SEQ ID NO1的核苷酸55-927、SEQ ID NO3的核苷酸58-663、SEQ IDNO5的核苷酸55-1110、SEQ ID NO7的核苷酸55-1347、SEQ ID NO9的核苷酸1-555、SEQ ID NO11的核苷酸49-702、SEQ ID NO13的核苷酸40-786、SEQ ID NO15的核苷酸55-819、SEQ ID NO17的核苷酸61-675、SEQ ID NO19的核苷酸1-729、SEQ ID NO21的核苷酸55-1299、SEQ IDNO23的核苷酸49-1179、SEQ ID NO25的核苷酸70-846、SEQ ID NO27的核苷酸58-810、SEQ ID NO31的核苷酸55-660、SEQ ID NO33的核苷酸46-1854、SEQ ID NO35的核苷酸64-966、SEQ ID NO37的核苷酸55-1368、SEQ ID NO39的核苷酸61-1248,和SEQ ID NO41的核苷酸64-849。
6.權利要求3的多肽,其中所述多核苷酸編碼由選自下列的多肽所組成的多肽SEQ ID NO2的氨基酸1-291;SEQ ID NO4的1-202;SEQ IDNO6的氨基酸1-352;SEQ ID NO8的氨基酸1-431;SEQ ID NO10的氨基酸1-185;SEQ ID NO12的氨基酸1-218;SEQ ID NO14的氨基酸1-249;SEQ ID NO16的1-255;SEQ ID NO18的氨基酸1-205;SEQ ID NO20的氨基酸1-243;SEQ ID NO22的氨基酸1-415;SEQ ID NO24的氨基酸1-377;SEQ ID NO26的氨基酸1-259;SEQ ID NO28的氨基酸1-248;SEQ IDNO30的氨基酸1-149;SEQ ID NO32的氨基酸1-202;SEQ ID NO34的氨基酸1-603;SEQ ID NO36的氨基酸1-301;SEQ ID NO38的氨基酸1-438;SEQ ID NO40的氨基酸1-396;和SEQ ID NO42的氨基酸1-262。
7.權利要求3的多肽,其中所述多肽是GH10木聚糖酶,所述GH10木聚糖酶包含氨基酸序列,所述氨基酸序列與可從以保藏登錄號CBS274.96保藏的Botryosphaeria rhodina獲得的GH10木聚糖酶具有至少90%的同一性。
8.權利要求3的多肽,其中該多肽是包含SEQ ID NO2的氨基酸1-291的GH10木聚糖酶。
9.權利要求3的多肽,其中該多肽是由SEQ ID NO2的氨基酸1-291組成的GH10木聚糖酶。
10.權利要求3的多肽,其中所述多肽是GH11木聚糖酶,所述GH11木聚糖酶包含氨基酸序列,所述氨基酸序列與可從以保藏登錄號CBS274.96保藏的Botryosphaeria rhodina獲得的GH11木聚糖酶具有至少90%的同一性。
11.權利要求3的多肽,其中該多肽是包含SEQ ID NO4的氨基酸1-202的GH11木聚糖酶。
12.權利要求3的多肽,其中該多肽是由SEQ ID NO4的氨基酸1-202組成的GH11木聚糖酶。
13.權利要求3的多肽,其中該多肽是絲氨酸酯酶,所述絲氨酸酯酶包含氨基酸序列,所述氨基酸序列與可從以保藏登錄號CBS 274.96保藏的Botryosphaeria rhodina獲得的絲氨酸酯酶具有至少90%的同一性。
14.權利要求3的多肽,其中該多肽是包含SEQ ID NO6的氨基酸1-352的絲氨酸酯酶。
15.權利要求3的多肽,其中該多肽是由SEQ ID NO6的氨基酸1-352組成的絲氨酸酯酶。
16.權利要求3的多肽,其中該多肽是脂肪酶,所述脂肪酶包含氨基酸序列,所述氨基酸序列與可從以保藏登錄號CBS 274.96保藏的Botryosphaeria rhodina獲得的絲氨酸酯酶具有至少90%的同一性。
17.權利要求3的多肽,其中該多肽是包含SEQ ID NO8的氨基酸1-431的脂肪酶。
18.權利要求3的多肽,其中該多肽是由SEQ ID NO8的氨基酸1-431組成的脂肪酶。
19.權利要求3的多肽,其中該多肽是過氧化物酶,所述過氧化物酶包含與可從以保藏登錄號CBS 274.96保藏的Botryosphaeria rhodina獲得的過氧化物酶具有至少90%的同一性的氨基酸序列。
20.權利要求3的多肽,其中該多肽是包含SEQ ID NO10的氨基酸1-185的過氧化物酶。
21.權利要求3的多肽,其中該多肽是由SEQ ID NO10的氨基酸1-185組成的過氧化物酶。
22.權利要求3的多肽,其中該多肽是GH 61A多肽,所述GH 61A多肽包含氨基酸序列,所述氨基酸序列與可從以保藏登錄號CBS 274.96保藏的Botryosphaeria rhodina獲得的GH 61A多肽具有至少90%的同一性。
23.權利要求3的多肽,其中該多肽是包含SEQ ID NO12的氨基酸1-218的GH 61A多肽。
24.權利要求3的多肽,其中該多肽是由SEQ ID NO12的氨基酸1-218組成的GH 61A多肽。
25.權利要求3的多肽,其中該多肽是GH 61B多肽,所述GH 61B多肽包含氨基酸序列,所述氨基酸序列與可從以保藏登錄號CBS 274.96保藏的Botryosphaeria rhodina獲得的GH 61B多肽具有至少90%的同一性。
26.權利要求3的多肽,其中該多肽是包含SEQ ID NO14的氨基酸1-249的GH 61B多肽。
27.權利要求3的多肽,其中該多肽是由SEQ ID NO14的氨基酸1-249組成的GH 61B多肽。
28.權利要求3的多肽,其中該多肽是GH 61C多肽,所述GH 61C多肽包含氨基酸序列,所述氨基酸序列與可從以保藏登錄號CBS 274.96保藏的Botryosphaeria rhodina獲得的GH 61C多肽具有至少90%的同一性。
29.權利要求3的多肽,其中該多肽是包含SEQ ID NO16的氨基酸1-255的GH 61C多肽。
30.權利要求3的多肽,其中該多肽是由SEQ ID NO16的氨基酸1-255組成的GH 61C多肽。
31.權利要求3的多肽,其中該多肽是GH 61D多肽,所述GH 61D多肽包含氨基酸序列,所述氨基酸序列與可從以保藏登錄號CBS 274.96保藏的Botryosphaeria rhodina獲得的GH 61D多肽具有至少90%的同一性。
32.權利要求3的多肽,其中該多肽是包含SEQ ID NO18的氨基酸1-205的GH 61D多肽。
33.權利要求3的多肽,其中該多肽是由SEQ ID NO18的氨基酸1-205組成的GH 61D多肽。
34.權利要求3的多肽,其中該多肽是β-葡糖苷酶,所述β-葡糖苷酶包含氨基酸序列,所述氨基酸序列與可從以保藏登錄號CBS 274.96保藏的Botryosphaeria rhodina獲得的β-葡糖苷酶具有至少90%的同一性。
35.權利要求3的多肽,其中該多肽是包含SEQ ID NO34的氨基酸1-603的β-葡糖苷酶。
36.權利要求3的多肽,其中該多肽是由SEQ ID NO34的氨基酸1-603組成的β-葡糖苷酶。
37.權利要求3的多肽,其中該多肽是內切阿拉伯糖酶,所述內切阿拉伯糖酶包含氨基酸序列,所述氨基酸序列與可從以保藏登錄號CBS 274.96保藏的Botryosphaeria rhodina獲得的內切阿拉伯糖酶具有至少90%的同一性。
38.權利要求3的多肽,其中該多肽是包含SEQ ID NO36的氨基酸1-301的內切阿拉伯糖酶。
39.權利要求3的多肽,其中該多肽是由SEQ ID NO36的氨基酸1-301組成的內切阿拉伯糖酶。
40.權利要求3的多肽,其中該多肽是內切阿拉伯糖酶,所述內切阿拉伯糖酶包含氨基酸序列,所述氨基酸序列與可從以保藏登錄號CBS 274.96保藏的Botryosphaeria rhodina獲得的內切阿拉伯糖酶具有至少90%的同一性。
41.權利要求3的多肽,其中該多肽是包含SEQ ID NO38的氨基酸1-438的內切阿拉伯糖酶。
42.權利要求3的多肽,其中該多肽是由SEQ ID NO38的氨基酸1-438組成的內切阿拉伯糖酶。
43.權利要求3的多肽,其中該多肽是胃蛋白酶肽酶,所述胃蛋白酶肽酶包含與可從以保藏登錄號CBS 274.96保藏的Botryosphaeria rhodina獲得的胃蛋白酶肽酶具有至少90%的同一性的氨基酸序列。
44.權利要求3的多肽,其中該多肽是包含SEQ ID NO40的氨基酸1-396的胃蛋白酶肽酶。
45.權利要求3的多肽,其中該多肽是由SEQ ID NO40的氨基酸1-396組成的胃蛋白酶肽酶。
46.權利要求3的多肽,其中該多肽是胃蛋白酶肽酶,所述胃蛋白酶肽酶包含氨基酸序列,所述氨基酸序列與可從以保藏登錄號CBS 274.96保藏的Botryosphaeria rhodina獲得的胃蛋白酶肽酶具有至少90%的同一性。
47.權利要求3的多肽,其中該多肽是包含SEQ ID NO42的氨基酸1-262的胃蛋白酶肽酶。
48.權利要求3的多肽,其中該多肽是由SEQ ID NO42的氨基酸1-262組成的胃蛋白酶肽酶。
49.多核苷酸,其包含編碼權利要求3中所定義的多肽的核苷酸序列。
50.核酸構建體,其包含權利要求49中定義的核苷酸序列,該核苷酸序列與一種或多種指導所述多肽在宿主細胞中生產的調控序列可操作地連接。
51.重組表達載體,其包含權利要求50的核酸構建體。
52.重組宿主細胞,其包含權利要求50的核酸構建體。
53.生產權利要求3的多肽的方法,其包含a.培養(yǎng)菌株以產生所述多肽,其中所述菌株的野生型形式能夠產生該多肽;及b.回收該多肽。
54.生產權利要求3的多肽的方法,其包含a.在有助于產生所述多肽的條件下,培養(yǎng)權利要求52中定義的重組宿主細胞;及b.回收該多肽。
55.組合物,其包含權利要求3的多肽和賦形劑。
56.制備權利要求55的組合物的方法,其包含將權利要求1的多肽與賦形劑混合。
57.適于在電子設備中使用的存儲介質,所述電子設備包含權利要求3的多肽的氨基酸序列的信息。
58.適于在電子設備中使用的存儲介質,所述電子設備包含權利要求49的多核苷酸的核酸序列的信息。
全文摘要
本發(fā)明涉及自Botryosphaeria rhodina CBS 274.96分泌的功能性多肽。
文檔編號C12N5/10GK101052721SQ200580034120
公開日2007年10月10日 申請日期2005年8月6日 優(yōu)先權日2004年8月6日
發(fā)明者柯克·M·施諾爾, 萊納·蘭格, 珀尼爾·U·博爾韋格 申請人:諾維信公司