发明领域
本发明涉及编码肿瘤排斥抗原前体的核酸分子。具体地说,本发明涉及一些 基因,这些基因的肿瘤排斥抗原前体特别地被加工成至少一种肿瘤排斥抗原。所 说的肿瘤排斥抗原前体似乎不和其它已知的肿瘤排斥抗原前体的编码序列密切 相关,并且在人类X染色体的Xp区中分离了其编码序列,和与其最密切相关的 基因相反,后者在Xq区发现。
背景和现有技术
哺乳动物免疫系统识别并对异源物质发生反应的过程是一个复杂的过程。此 系统的重要方面是T淋巴细胞或“T细胞”应答,这种应答需要T细胞识别并和 细胞表面分子(称为人类白细胞抗原(“HLA”)或主要组织相容性复合物 (“MHCs”)和肽的复合物相互作用。这些肽来自由也呈递HLA/MHC分子的细 胞加工的大分子。关于这一点,参见Male等,高级免疫学(J.P.Lipincott公司, 1987),尤其是6-10章。 T细胞和HLA/肽复合物的相互作用是受限制的,需要对 HLA分子和肽的特定组合特异性的T细胞。假如特定的T细胞不存在,既使它 的配对复合物存在,也没有T细胞应答。同样,如果缺乏特定的复合物而T细胞 存在,也没有应答。这种机制和免疫系统对外来物质的反应、自体免疫病理和细 胞异常反应有关。大量的工作集中在蛋白质加工成HLA结合肽的机制上。关于 这一点,参见Barinaga,科学257:880(1992);Fremont等,科学257:919 (1992);Matsumura等,科学257:927(1992);Latron等,科学257:964(1992)。
癌症中也已经预示了T细胞识别细胞异常的机制。例如,在PCT申请PCT /US92/04354(1992年5月22日申请,1992年11月26日出版,本文一并参考) 中公开了一个基因家族,其被加工成肽,肽随后在细胞表面表达,导致通过特定 的CTLs胞溶性T-淋巴细胞或以下所称的“CTLs”溶解肿瘤细胞。所说的基因 编码“肿瘤排斥抗原前体“或“TRAP”分子,来源于它们的肽称为“肿瘤排斥 抗原”或是“TRAs”。参见Traversari等,免疫遗传学35:145(1992);关于 这个基因家族的其它信息,参见van der Bruggen等,科学254:1643(1991)。 也参见美国专利申请807,043(1991年12月12日申请,现为美国专利5,342,774, 其全部内容本文一并参考)。在此专利中,公开了“MAGE”肿瘤排斥抗原前体 家族。
在美国专利申请938,334(现为美国专利申请—,1995年4月15日,公开 内容本文一并参考)中解释了MAGE-1基因编码肿瘤排斥抗原前体,这种前体加 工成由HLA-A1分子呈递(presented by)的九肽(nonapeptides)。和HLA-A1结合的 这种九肽遵循满足基序的结合“规则”。这一点参见例如PCT/US93/07421;Falk 等,自然351:290-296(1991);Engelhard,免疫学年度综述12:181-207(1994); Ruppert等,细胞74:929-937(1993);Rotzschke等,自然348:252-254 (1990);Bjorkman,自然329:512-518(1987);Traversari等,实验医学杂志 176:1453-1457(1992)。这些参考文献指出,如果已知特定肽针对特定HLA分 子的特异性,可以预料特定肽和一种HLA分子,而不是其它分子结合。由于不 同个体具有不同的HLA表型,所以这一点是重要的。因此,尽管鉴定特定肽作 为特定HLA分子的配对物具有诊断和治疗效果,但这些只和具有这种特定的HLA 表型的个体有关。由于细胞异常不仅限于一种特定的表型,并且定向治疗需要一 些异常细胞表型的知识,所以需要在此领域进行进一步的工作。
美国专利申请008,446(1993年1月22日申请,本文一并参考)公开了 MAGE-1表达产物加工成第二种TRA的事实。这第二种TRA由HLA-Cw*1601 分子呈递。此说明书显示一个给定的TRAP能生产多个TRAs,每一个都满足和 MHC分子结合的基元规律。
美国专利申请994,928(1992年12月22日申请,本文一并参考)指出了由一 些正常细胞(如黑素细胞)产生的酪氨酸酶,在肿瘤细胞中加工产生由HLA-A2分 子呈递的肽。
美国专利申请08/032,978(1993年3月18日申请,其全部内容本文一并参 考)教导了不是来源于酪氨酸酶的一个第二种TRA由HLA-A2分子呈递。此TRA 来源于TRAP,但其由非MAGE基因编码。此公开内容表明特定的HLA可以呈 递(present)不同来源的TRAs。
美国专利申请08/079,110(1993年6月17日申请,本文一并参考)描述了一 种无关的肿瘤排斥抗原前体,即所谓的“BAGE”前体。此BAGE前体和MAGE 家族无关。
美国专利申请08/096,039和08/250,162(二者的内容本文一并参考)也公开 了无关的TRAP前体GAGE。
上文引用的这些论文、专利、专利申请显示的工作在很大程度上是针对 MAGE基因家族的和非相关BAGE、GAGE和DAGE基因的,表明存在由细胞 表达的不同的、另外的肿瘤排斥抗原前体。
已发现还存在另一个肿瘤排斥抗原前体的基因家族。这些核酸分子和 MAGE家族同源,但这种同源性对通过和如PCT申请PCT/US92/04354和美国专 利5,342,774中所提出的现有的MAGE家族成员在严格条件下杂交来鉴定Xp家 族成员是不够的,并且发现本发明的这些分离的核酸分子全部在X染色体的Xp 臂上,相反以前鉴定的MAGE家族成员则全部在Xq臂上发现。这样,本发明 涉及编码MAGE-Xp肿瘤排斥抗原前体的分离的核酸分子及其用途。
下面公开内容进一步解释了本发明。
优选实施方案的详细描述
实施例1
Muscatelli等在“自然”372:672-676(1994)以及Muscatelli等在美国科 学院学报(5/95)(在出版中)中已描述了粘粒D5和4695,其公开内容本文一并参 考。这些粘粒含有X染色体的Xp臂,将这些粘粒用限制性核酸内切酶EcoRⅠ、 BamHⅠ、HindⅢ和PstⅠ消化,消化完成之后,将DNA转移到尼龙膜上,接着在 琼脂糖凝胶上进行琼脂糖电泳迁移。
然后,在杂交实验中利用基于SEQ ID NO:1(即Xp1序列)的探针,探针的 长度为大约0.45千碱基,并且含有第一外显子(总共73个碱基对)的41个碱基对、 整个第二外显子和第三外显子(总共1603个碱基对)的299个碱基对。这种本文称 为“Xp1”而其它文献称为“Xp”的序列,可以在Muscatelli等的“美国科学 院学报”(5/59)(正在出版)中也可找到,而且,所说序列参照登记号emb82539在 EMBL序列数据库中找到。可以在不迟于1995年2月7日得到。
为了制备0.4kb探针,使用下列引物,即SEQ ID NO:11和SEQ ID NO:12 在Xp1 cDNA上进行PCR。
5′-GTGGTGTCCAGCAGTGTCTC-3’
5′-GTCAGATTGCCTACATGACACAG-3’
具体地说,将此DNA用20xSSC(SSC=0.15M NaCl、0.015M柠檬酸钠, pH值为7)转移到尼龙膜之前,将其用NaOH变性并在凝胶上中和。转移后,将 膜在室温下于6xSSC中冲洗5分钟,置于80℃下暴露1小时,然后,在65℃ 下在6xSSC、10xDenhardt溶液(0.02%Ficoll,0.02%聚乙烯吡咯烷酮,0.02 %BSA)中预处理4小时。
将这种膜在3.5xSSC、1xDenhardt溶液、25mM磷酸钠缓冲液(pH7.0)、 0.5%SDS、2mM EDTA和3x106cpm/mla32P-CTP放射性标记探针中杂交。杂 交在65℃下进行18小时。然后将膜在65℃下,在2xSSC、0.5%SDS、IxDenhardt 的溶液中洗涤4次每次1小时;再在0.2xSSC、0.1%SDS中洗涤30分钟;然后 在0.1xSSC、0.1%SDS中洗涤30分钟。利用柯达X-ARS胶片将此膜用柯达 X-ARS胶片和柯达X-Omatic精细增感屏放射自显影。
杂交后,观察到不同强度的几种信号。其中,分离了来源于粘粒4965的 三个EcoRⅠ片段,它们的长度分别为1.5、2.2、2.5kb,然后将它们克隆到载 体pTZ19R中,以便测序。部分测序表明,每个片段含有和Xp1的第三外显子同 源的序列。这三种序列相对于Xp1的同源性是75%、60%和80%。以下称为基 因MAGE-Xp2、MAGE-Xp3和MAGE-Xp4,分别如SEQ ID NO:2、3和4所 示。
前面的描述,给技术人员提供了很有价值的工具。首先,此实施例鉴定了 编码MAGE-Xp肿瘤排斥抗原前体的分离的核酸分子以及其互补的核酸分子。已 知DNA以双链的形式存在,并且两条链的每一条和另一条互补。核酸杂交技术 已发展到这种程度,即给定DNA的一条链,技术人员可以分离或合成它的互补 链。本发明特别包括使技术人员鉴定X染色体(特别是Xp元件)以及此染色体上 缺损的双链现象。
本领域普通技术人员利用标准方法可以进行这种分析。例如,通过公知的 聚合酶链式反应(PCR),技术人员可以利用下列引物:
用于鉴别Xp2:
5’-TAAAAAAGGTGCCAAGAGCCAC-3’(SEQ ID NO:5);
5’-TGAGGCCCTCAGAGGCTTC-3’(SEQ ID NO:6)。
用于鉴别Xp3:
5’-AGTCTGCTGGTAGGTCACGTA-3’(SEQ ID NO:7);
5’-TCAGGAACTGCACCAACATATTT-3’(SEQ ID NO:8)。
用于鉴别Xp4:
5’-AGGGATACTGCCTCCAGCTC-3’(SEQ ID NO:9);
5-CAGGAACTGCACTAACATCTTC-3’SEQ ID NO:10)。
技术人员按照标准的PCR方案(此处不再重复)利用这些引物。
本文所用的“核酸分子”指具有上文讨论的特性的所有DNA和RNA物种。 基因组和互补DNA(或“cDNA” )都编码特定的蛋白质,如针对MAGE编码 序列的分离的例子所示,这些内容指导技术人员如何获得这两种DNA。
所有编码MAGE-Xp蛋白质的分离的核酸分子(除MAGE-Xp1之外)都包含 在本发明之内。本发明包括在严格条件下与MAGE-Xp2、MAGE-Xp3或 MAGE-Xp4任一杂交的核酸分子。如本文使用的,所指的严格条件包括在65℃ 下用5×106 cpm/ml杂交18小时;然后在65℃下进行4次20分钟的洗涤,每次 使用2xSSC、0.5%SDS和1xDenhardt溶液;接着在0.2xSSC、1%SDS中洗涤 两次(每次20分钟);并且,最后68℃下,在1%SDS、变化浓度的SSC中洗涤 两次,每次进行20分钟。SSC的终浓度不应超过0.5xSSC,更优选的是0.2xSSC, 最优选的是0.1xSSC。
同样地,可以获得RNA分子(如mRNA),并且对于技术人员来说,一旦手 头上有编码序列,可以分离或合成mRNA。
不编码TRAPs的互补序列(如“反义DNA”或mRNA)也是有用的,例如 在探测编码序列以及阻断其表达的方法上是有用的。
很明显,技术人员可以制备细胞系的生物学纯化培养物,这种细胞系由编 码或表达MAGE-Xp分子的核酸序列转染过。可以利用这些培养物作为肿瘤排斥 抗原的来源,或者例如,作为治疗剂。以下讨论了发明的这一方面。
由MAGE-Xp编码序列转染的细胞也可以由其它编码序列转染,其它编码 序列的例子包括细胞因子基因,例如白细胞介素(interleukins)(如Ⅰ1-2或Ⅰ1-4)或主 要组织相容性复合物(MHC)或人类白细胞抗原(HLA)分子。细胞因子基因转染是 有价值的,因为这些基因的表达有希望提高细胞生物学纯培养物的体内治疗效 率。本领域已知为了治疗癌症,向患者施用白细胞介素转染子的治疗方法。在特 定的优选实施方案中,由编码(ⅰ)MAGE-Xp分子、(ⅱ)HLA/MHC分子、(ⅲ)细胞 因子的每种序列转染细胞。
由编码MHC/HLA的序列转染是理想的,这是由于来源于MAGE-Xp的 某些TRAs可以仅由特定的MHC/HLA分子优先地或特别地呈递。这样,当受体 细胞已表达和TRA的呈递相关的MHC/HLA分子时,尽管可以利用进一步的转 化以引起此抗原的过量表达,但额外的转染是不必要的。另一方面,当受体细胞 不正常表达相关的MHC/HLA分子时,希望的是用第二种序列转染。当然,可 以理解用一种额外的序列转染不会妨碍用其它序列的进一步转染。
所用的和本文描述的细胞系相关联的术语“生物学纯的”简单地是指这些 细胞基本没有其它细胞。严格地讲,“细胞系”的定义是“生物学纯的”,它的 引用完全建立在此基础上。
细胞转染要求使用适当的载体,因此本发明包含表达载体,其中,编码兴 趣的MAGE-Xp TRAP的序列可操纵地与启动子连接。此启动子可以是强启动子 (如本领域公知的那些),或差异启动子(即其仅在特异细胞类型中是可操纵的)。这 种表达载体也可以包含病毒或者细菌基因组的全部或一部分(如牛痘病毒或 BCG)。这种载体在疫苗的制备中尤其有用。
这种表达载体可以掺入几种编码序列,只要MAGE-Xp序列包含在其中。 上文讨论的细胞因子和/或HLA基因可以包含在带有TRAP序列的单个载体中。 如果不希望如此,可以提供一种表达系统,其中使用两个或多个不同的载体,载 体中每一个编码序列可操纵地和启动子连接。另外,此启动子可以是强或差异启 动子。共转染是公知的技术,并且本领域技术人员具有这种可以供使用的技术。 可以构建载体以便它们直接编码TRA分子,而不是MAGE-Xp TRAP。这消除 了对翻译后加工的需要。
以上讨论很清楚,这些序列编码“肿瘤排斥抗原前体”(“TRAPs”),接 下来,将这些前体加工成肿瘤排斥抗原(“TRAs”)。也许它们最值得注意的方 面是作为治疗各种癌症的疫苗。有证据表明TRAs在肿瘤细胞上呈递,然后发生 免疫应答和细胞消除(deletion)。本领域的证据表明,当对细胞施用各种TRAs 时,便激发了(mounted)CTL反应,并且使呈递细胞(presenting cell)消除。这是疫 苗的行为特征,因此可以利用TRAPs(其加工成TRAs)和TRAs本身,单独使用或 在合适的药物组合物中使用以作为疫苗。同样,可以以同样的方式,或者单独或 者与其它组分结合或者产生药物组合物来利用呈递细胞,其它的可以用作疫苗的 材料包括表面呈递TRA分子的分离的细胞、TRAP片段、突变的病毒(特别是黄 化形式)和转化的细菌。如本文所用的“片段”指小于TRA的肽,但其具有如上 文所述的作为疫苗所需的性质。另一种疫苗包含TRA和HLA分子的复合物或者 由该复合物组成。本文所描述类型的疫苗可以用于预防,即向患者施用足够量的 疫苗以预防癌症的产生。
和T细胞或B细胞相关的免疫应答的产生进呈递的肿瘤排斥抗原的作用的 特征。关于B细胞应答,其特别和TRA抗体的产生相关,即这种抗体和TRA特 异性结合。此外,TRA分子有足够的大小以给出它们的免疫原性,并且和其特 异结合的抗体是本发明的一部分。这些抗体是多克隆或单克隆的,单克隆抗体可 通过用公知的任一方法制备,这里不必重复。例如,mAba可以通过利用动物模 型(如BalB/C小鼠)或在实验试管中制备(例如,使用EBV转化体)。此外,只要某 些细胞呈递TRA,就可以从癌症感染的患者体内分离出抗血清,也可以产生由 TRA和HLA/MHC分子相互作用限定的抗原表位抗体。
前面综述的公开内容表明称为“肿瘤排斥抗原呈递和识别”的系统有许多 方面。这些现象的识别具有诊断意义,例如,特异性CTL克隆或TRA抗体的存 在,使通过监测患者样品中的CTLs活性、抗体和TRA的结合、或患者样品中相 关的抗TRA CTLs活性以诊断或监测癌症(下文解释)成为可能。同样,核酸分子 表达TRAPs可以通过扩增(如“聚合酶链式反应”)、反义杂交、探针技术等来监 测。各种患者的样品包括体液(例如血液、血清和其它渗出物)、组织和肿瘤,都 可以如此分析。
诊断学的一特别方法是应用目前,用于诊断结核病的标准“结核菌素实验” 的适应性改进实验。此标准皮肤试验用稳定形式的“纯化的蛋白衍生物”或 “PPD”为诊断辅助。以类似的方式,可以在这种皮肤试验中利用本发明的TRAs 作为诊断辅助或监测方法。
本文所用的术语“癌症”包括所有的以癌开始并导致最终的临床表现的生 理事件。肿瘤不以可见的肿瘤从头开始出现;而是出现很多与正常细胞转化成恶 性相关的状态,然后继续生长(如肿瘤,转移等)。此外,认为消退可以是“癌症” 的一部分,因为肿瘤很少自然消失。本发明的诊断方法包括和癌症有关的所有状 态,从最初单一细胞转化成恶性直至肿瘤的整个发育和转移过程以及消退。本文 包括所有这些。
在所有使用“患者”的地方,该术语包括癌症感染的任何物种,包括人类 和非人类(如驯养动物、繁殖原种等)。
本发明也包括治疗方面。施用作为疫苗的TRAPs和TRAs的效果已在上文 讨论。同样,技术人员可以体外开发特异性CTLs,然后向患者施用。可以施用 多克隆或单克隆抗体,这些抗体可以和呈递感兴趣TRA的细胞特异结合。这些 抗体可以和特异的抗肿瘤试剂偶连,这些抗肿瘤试剂包括但不限于氨甲喋呤放射 性碘化合物、毒素(如蓖麻素蛋白)、其它抑细胞或溶细胞药物等等。因此“定向” 抗体治疗法包括在本文之内,通过利用CTLs消除癌细胞的应用也包括在本文 内。
所用的术语和表达被用作描述性术语,但不是限制性的,并且在这些术语 和表达的应用上,无意于排除所示的和描述的特性的任何等同部分或其部分,应 该认识到在本发明的范围内,各种改变是可能的。
序列表 (1)一般信息:
(ⅰ)申请人:Lurquin,Christophe;Boon-Falleur,Thierry
(ⅱ)发明名称:为MAGE-Xp家族成员的分离的核酸分子及其用途
(ⅲ)序列数:12
(Ⅳ)通讯地址:
(A)收信人:Felfe Lynch
(B)街道:805 Third Avenue
(C)城市:纽约市
(D)州:纽约
(F)邮政编码:10022
(ⅴ)计算机可读形式:
(A)介质类型:软盘,3.50英寸,360kb存储量
(B)计算机:IBM
(C)操纵系统:PC-DOS
(D)软件:Wordperfect
(Ⅵ)当前申请的数据:
(A)申请号:PCT/US96/03209
(B)申请日:1996年3月11日
(Ⅵ)在先申请的数据:
(A)申请号:08/403,388
(B)申请日:1995年3月14日
(C)分类:435
(ⅷ)律师/代理人信息:
(A)姓名:Hanson,Norman D.
(B)登记号:30,946
(C)案号/文档号:LUD 5408-PCT
(ⅸ)电信信息:
(A)电话:(212)688-9200
(B)传真:(212)838-3884 (2)SEQ ID NO:1信息
(ⅰ)序列特征:
(A)长度:1866个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅹⅰ)序列描述:SEQ ID NO:1 GAGTGTTGCA ACTGGGCCTG GCATGTTTCA GCGTGGTGTC CAGCAGTGTC TCCCACTCCT 60 TGTGAAGTCT GAGGTTGCAA AAGGACTGTG ATCATATGAA GATCATCCAG GAGTACAACT 120 CGAAATTCTC AGAAAACAGG ACCTTGATGT GAGAGGAGCA GGTTCAGGTA AACAAAGGGC 180 GAGGACCCGA GCGAGCTTAA GGCCAGTGGG GTGCAGCGTC TGGTCAGCCG AGGGTGAATT 240 CTCAGGACTG GTCGGGAGTC AAGGTGCCAC ATCTCCTGCC TTTCTGCTCA CTTTCCTGCC 300 TGTTTTGCCT GACCACAGCC ATCATGCCTC GGGGTCAGAA GAGTAAGCTC CGTGCTCGTG 360 AGAAACGCCG CAAGGCGCGA GAGGAGACCC AGGGTCTCAA GGTTCGTCAC GCCACTGCAG 420 CAGAGAAAGA GGAGTGCCCC TCCTCCTCTC CTGTTTTAGG GGATACTCCC ACAAGCTCCC 480 CTGCTGCTGG CATTCCCCAG AAGCCTCAGG GAGCTCCACC CACCACCACT GCTGCTGCAG 540 CTGTGTCATG TACCGAATCT GACGAAGGTG CCAAATGCCA AGGTGAGGAA AATGCAAGTT 600 TCTCCCAGGC CACAACATCC ACTGAGAGCT CAGTCAAAGA TCCTGTAGCC TGGGAGGCAG 660 GAATGCTGAT GCACTTCATT CTACGTAAGT ATAAAATGAG AGAGCCCATT ATGAAGGCAG 720 ATATGCTGAA GGTTGTTGAT GAAAAGTACA AGGATCACTT CACTGAGATC CTCAATGGAG 780 CCTCTCGCCG CTTGGAGCTC GTCTTTGGCC TTGATTTGAA GGAAGACAAC CCTAGTAGCC 840 ACACCTACAC CCTCGTCAGT AAGCTAAACC TCACCAATGA TGGAAACCTG AGCAATGATT 900 GGGACTTTCC CAGGAATGGG CTTCTGATGC CTCTCCTGGG TGTGATCTTC TTAAAGGGCA 960 ACTCTGCCAC CGAGGAAGAG ATCTGGAAAT TCATGAATGT GTTGGGAGCC TATGATGGAG 1020 AGGAGCACTT AATCTATGGG GAACCCCGTA AGTTCATCAC CCAAGATCTG GTGCAGGAAA 1080 AATATCTGAA GTACGAGCAG GTGCCCAACA GTGATCCCCC ACGCTATCAA TTCCTATGGG 1140 GTCCGAGAGC CTATGCTGAA ACCACCAAGA TGAAAGTCCT CGAGTTTTTG GCCAAGATGA 1200 ATGGTGCCAC TCCCCGTGAC TTCCCATCCC ATTATGAAGA GGCTTTGAGA GATGAGGAAG 1260 AGAGAGCCCA AGTCCGATCC AGTGTTAGAG CCAGGCGTCG CACTACTGCC ACGACTTTTA 1320 GAGCGCGTTC TAGAGCCCCA TTCAGCAGGT CCTCCCACCC CATGTGAGAA CTCAGGCAGA 1380 TTGTTCACTT TGTTTTTGTG GCAAGATGCC AACCTTTTGA AGTAGTGAGC AGCCAAGATA 1440 TGGCTAGAGA GATCATCATA TATATCTCCT TTGTGTTCCT GTTAAACATT AGTATCTTTC 1500 AAGTGTTTTT CTTTTAATAG AATGTTTATT TAGAGTTGGG ATCTATGTCT ATGAGCGACA 1560 TGGATCACAC ATTTATTGGT GCTGCCAGCT TTAAGCATAA GAGTTTTGAT ATTCTATATT 1620 TTTCAAATCC TTGAATCTTT TTTGGGTTGA AGAAGAAGAA AGCATAGCTT TAGAATAGAG 1680 ATTTTCTCAG AAATGTGTGA AGAACCTCAC ACAACATAAT TGGAGTCTTA AAATAGAGGA 1740 AGAGTAAGCA AAGCATGTCA AGTTTTTGTT TTCTGCATTC AGTTTTGTTT TTGTAAAATC 1800 CAAAGATACA TACCTGGTTG TTTTTAGCCT TTTCAAGAAT GCAGATAAAA TAAATAGTAA 1860 TAAATT 1866 (2)SEQ ID NO:2信息
(ⅰ)序列特征:
(A)长度:461个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅹⅰ)序列描述:SEQ ID NO:2 GCTGCGGCTG CGGGTGTTTC ATCCACAAAA TCTAAAAAAG GTGCCAAGAG CCACCAAGGT 60 GAGAAAAATG CAAGTTCCTC CCAGGCCTCA ACATCCACTA AGAGCCCAAG CGAAGATCCT 120 CTAACCAGGA AGTCAGGGTC GTTGGTGCAG TTCCTGTTGT ACAAGTATAA AATAAAAAAG 180 TCCGTTACAA AGGGAGAAAT GCTGAAAATT GTTGGCAAAA GGTTCAGGGA GCACTTCCCT 240 GAGATCCTCA AGAAAGCCTC TGAGGGCCTC AGTGTTGTCT TTGGCCTTGA GCTGAATAAA 300 GTCAACCCCA ACGGCCACAC TTACACCTTC ATCGACAAGG TAGACCTCAC TGATGAGGAA 360 TCCCTGCTCA GTTCCTGGGA CTTTCCCAGG AGAAAGCTTC TGATGCCTCT CCTGGGTGTG 420 ATCTTCTTAA ATGGCAACTC AGCTACTGAG GAAGAGATCTG 461 (2)SEQ IDNO3信息
(ⅰ)序列特征:
(A)长度:476个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅹⅰ)序列描述:SEQ ID NO:3 ATCACTGCAA CTAACAAGAA AAAAGTATCC TTTTCATCCC CTCTTATTTT GGGGGCTACT 60 ATCCAGAAAA AGTCTGCTGG TAGGTCACGT AGTGCTCTCA AGAAGCCTCA GAGAGCACTA 120 TCCACCACTA CATCTGTAGA TGTTTCTTAC AAAAAGTCAT ACAAGGGAGC CAACAGCAAA 180 ATTGAGAAAA AGCAAAGCTT CTCTCAGGGT CTATCCTCCA CTGTGCAGTC TCACACAGAC 240 CCTCTAACCA TGAAGACAAA TATGTTGGTG CAGTTCCTGA TGGAAATGTA CAAGATGAAA 300 AAGCCCATTA TGAAAGCAGA TATGCTAAAA ATTGTCCAAA AAAGCCATAA GAATTGCTTC 360 CCTGAGATCC TTAAAAAAGC TTCTTTCAAC ATGGAGGTGG TGTTTGGTGT TGATTTAAAG 420 AAAGTTGATT CTACCAAGGA CTCCTATGTC CTTGTCAGCA AAATGGATCT CCCCAA 476 (2)SEQ ID NO:4信息
(ⅰ)序列特征:
(A)长度:687个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅹⅰ)序列描述:SEQ ID NO:4 CATCACCTGC CCTTCTGCCT ACACTCCTGC CTGCTGTGCC TAACCACAGC CATCATGCCT 60 CGGGGTCAGA AGAGTAAGCT CCGTGCCCGT GAGAAACGCC AGCGGACCCG TGGTCAGACC 120 CAGGATCTCA AGGTTGGTCA GCCTACTGCA GCAGAGAAAG AAGAGTCTCC TTCCTCTTCC 180 TCATCTGTTT TGAGGGATAC TGCCTCCAGC TCCCTTGCTT TTGGCATTCC CCAGGAGCCT 240 CAGAGAGAGC CACCCACCAC CTCTGCTGCT GCAGCTATGT CATGCACTGG ATCTGATAAA 300 GGCGACGAGA GCCAAGATGA GGAAAATGCA AGTTCCTCCC AGGCCTCAAC ATCCACTGAG 360 AGATCACTCA AAGATTCTCT AACCAGGAAG ACGAAGATGT TAGTGCAGTT CCTGCTGTAC 420 AAGTATAAAA TGAAAGAGCC CACTACAAAG GCAGAAATGC TGAAGATCAT CAGCAAAAAG 480 TACAAGGAGC ACTTCCCTGA GATCTTCAGG AAAGTCTCTC AGCGCACGGA GCTGGTCTTT 540 GGCCTTGCCT TGAAGGAGGT CAACCCCACC ACTCACTCCT ACATCCTCGT CAGCATGCTA 600 GGCCCCAACG ATGGAAACCA GAGCAGTGCC TGGACCCTTC CAAGGAATGG GCTTCTGATG 660 CCTCTACTGA GTGTGATCTT CTTAAAT 687 (2)关于序列ID NO的信息:5:
(ⅰ)序列特征:
(A)长度:22碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅹⅰ)序列描述:SEQ ID NO:5 TAAAAAAGGT GCCAAGAGCC AC 22 (2)SEQ ID NO:6信息
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅹⅰ)序列描述:SEQ ID NO:6 TGAGGCCCTC AGAGGCTTTC 20 (2)SEQ ID NO:7信息
(ⅰ)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅹⅰ)序列描述:SEQ ID NO:7 AGTCTGCTGG TAGGTCACGT A 21 (2)SEQ ID NO:8信息
(ⅰ)序列特征:
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅹⅰ)序列描述:SEQ ID NO:8 TCAGGAACTG CACCAACATA TTT 23 (2)SEQ ID NO:9信息
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅹⅰ)序列描述:SEQ ID NO:9 AGGGATACTG CCTCCAGCTC 20 (2)SEQ ID NO:10信息
(ⅰ)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅹⅰ)序列描述:SEQ ID NO:10 CAGGAACTGC ACTAACATCT TC 22 (2)SEQ ID NO:11信息
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅹⅰ)序列描述:SEQ ID NO:11 GTGGTGTCCA GCAGTGTCTC 20 (2)SEQ ID NO:12信息
(ⅰ)序列特征:
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅹⅰ)序列描述:SEQ ID NO:12 GTCAGATTGC CTACATGACA CAG 23