203795. lajstromszámú szabadalom • Eljárás DNS azonosítási vizsgálatok elvégzésére és tesztanyagként használható polinukleotidok előállítására
1 HU 203 795 B 2 konszenzustól. A kereten belül az üres helyek a konszenzussal való egyezést jelölik. Az A, C, G, T betűk a keretben azt jelentik, hogy az ismétlődés megfeleld helyén a jelölt bázis található a konszenzus-szekvenciában megadott bázis helyett. X-A vagy G, Y-C vagy 5 T, —hiányzó nukleotid (a konszenzushoz viszonyítva). A (halszálka) jel olyan helyet jelöl, ahol a szekvenciát pontosan még nem határoztuk meg, de a szekvenáló gélek autoradiogrammjain világosan látszik, hogy a jelölt szekvencia a konszenzus „ismétlődése” (az „is- 10 métlődés” kifejezést itt természetesen a fentiekben megadott közelítő értelemben használjuk). A X33.3, X33.5, X33.10, X33.ll és X33.15 jelű fragmentumokat teljesen, a többit részlegesen szekvenáltuk meg. A „con” alatt, a keret baloldalán látható számok a kérőé- 15 ses ismétlődő szekvencia sorszámát jelentik. Az oszlop legalsó száma a fragmentumban található összes ismétlődések számával egyezik meg. így pl. a X33.1 egy 62 nukleotidból (nt) álló szekvencia - melyet a keret fölött nagybetűvel tüntettünk fel - 26-szoros ismétlődését 20 tartalmazza. Az egyes térképek fölött és alatt kisbetűvel feltüntetett szekvenciák szegélyezőszekvenciák, melyek az ismétlődéseket tartalmazó blokkot sorrendben az 5\ illetve a 3’ oldalon szegélyezik. Ezek a szegélyezőszekvenciák nem ismétlődnek. Más szavak- 25 kai ez a szerkezet olyan random kopolimerrel analóg (ezt a szegélyezőszekvenciák képviselik), amelybe blokk kopolimer egységek (ezek a tandemismétlődések) ékelődtek. (3) Az összes X33-pozitív fragmentum ismétlődő szekvenciájában meglévő rövid, közös „core”-szekvencia felfedezése és azonosítása. Az összes ismétlődő régió ismétlődő egységének szekvenciáját pontmátrix-analízis segítségével, összehasonlítottuk a pAV33.7 jelű plazmidban klónozott 33 bázispáros mioglobinismétlődő egységgel, és annak reverz komplementerével. Találtunk egy rendkívül szembetűnő, rövid egyedi régiót a 33 bázispáros mioglobinismétlődő egségben, amely szekvencia homológiát mutatott a X33-pozitív fragmentumokból levezetett konszenzusismétlődő szekvenciával. Ugyanez a régió megtalálható volt mind a nyolc X33-pozitív fragmentum ismétlődő egységében, s ezt a régiót ezentúl „közös core”-nak nevezzük. A lenti ábra az összehasonlítás eredményét mutatja. Az ábra egészében bemutatja a (2) lépésben meghatározott összes konszenzus-szekvenciát Ezek azok a szekvenciarészletek, amelyek tandemismédődésként fordulnak elő a 33 bázispáros mioglobin-hibridizációs próbában és a humán genomból izolált X33- pozitív fragmentumokban. Az ábrán a 16 nukleotidhosszúságúnak talált közös „core”-régió nagybetűvel van jelölve. közös core-régió 33 bp mioglobin X33.1 X33.3 X33.4 X33.5 X33.6* X33.10 X33.ll X33.15 közös core-régió ctaaagct ccctgtcttgtcctggaaactca xxgggccg catctggggccacaggatgcaggg g aggaagggct gtaggaggtggct cctgggct 5’GGAGGTGGGCAGGAAG aagGGTGGGCAGGAAG GGAGGTGGGCAGGAAX tGgGGaGGGCAGaAAG GGAGGYGGGCAGGAGG GGAGGaGGGCtGGAGG GGA-GTGGGCAGGcAG GGtGGTGGG’cAGGAAG aGAGGTGGGCAGGtGG GGAGGTGGGCAGGAXG gaccgaggt tggagtgtgtgcctgcttccctt gggtggag v aacccccgcgtgxaggggcaccca agggctccgg gactgtccccgaa cagtgaggc-3’ X-A vagy G, Y-C vagy T, —hiányzó nukleotid * Ez egy trimer szekvencia, ezért a szegélyezőrégiók is hozzájárulnak a „core”-hoz. Az ábrán látható, hogy a bekeretezett 16 nukleotidos részlet jó egyezést mutat a különböző szekvenciák között. A 16 nukleotid közül 8 az összes felsorolt szekvenciában azonos helyen megtalálható (100%-os homológja), s egy kilencedik X is mindenhol közös, ami azt jelenti, hogy ezen a helyen az összes szekvenciában vagy A, vagy G szerepel. Ezt a kilenc nukleotidot a közös „core”-régiót bemutató utolsó sorban aláhúzással jelöltük. Kisbetűkkel jelöltük az egyes tandemismétlődő szekvenciák további részét képező szegélyezőrégiókat. Az egyes konszenzusismétlődő szekvenciák kezdő/végpontját „v ” jellel jelöltük; a X33.4 és X33.15 fragmentumokban az ismétlődés kezdő- és végpontja nem esik egybe, ezért ezeket külön-külön ” jellel jelöltük. Belátható, hogy a közös „core’’-régió meghatározása csak rendkívül kifinomult számítógépes analízis segítségével volt lehetséges, mivel az sok 50 esetben nem található meg a 33-pozitív fragmentumok egyeden konszenzusismédődő egységén belül, és a mioglobingén ismétlődő szekvenciájában is pontosan két egymást követő 33 bázispáros ismédődés határán található. 55 A következő táblázat (1. táblázat) megadja a fent említett polinukleoddok jellemző adatait, s ezzel azt is illusztrálja, hogy a megadott definíciók milyen mértékben szűkítik a találmány tárgyát képező polinukleoti- 1 dók körét 60 10