203795. lajstromszámú szabadalom • Eljárás DNS azonosítási vizsgálatok elvégzésére és tesztanyagként használható polinukleotidok előállítására
1 HU 203 795 B 2 természetesen a „core” fogalmának meglehetősen szűk értelmezése, mivel így minden esetben egy, vagy egynéhány olyan „core”-t kapunk, amely 6,7...16 nukleotidhosszúságú (azért „egynéhányat”, mert bizonyos esetekben több mint egy azonos hosszúságú szekvenciarészlet is mutathatja a legnagyobb, például 100%-os homológiát). Mivel felfedeztük, hogy az így definiált „core”-szekvenciák meglehetősen különbözhetnek egymástól, tágabb értelemben a „core”-szekvenciák különbözhetnek egymástól oly mértékben, hogy az összes n darab ismétlődő egységben található „core”szekvencia átlagosan legalább 70%-os homológiát mutasson a fenti értelemben definiált „core”-szekvenciával. Az ismétlődő egységen belül található szegélyezőszekvenciákat (J és K) nem vesszük figyelembe a homológia kiszámításánál, az összehasonlítás kizárlólag a „core”- szekvenciarészletekre vonatkozik. Az ily módon definiált „core”-ok különböző hosszúságúak lehetnek, és „keverten” is előfordulhatnak, ami azt jelenti, hogy egy miniszatellit-fragmentumon belül a „core” az egyik ismétlődő egységen belül (mondjuk) a (2) képlettel megadott GGGCAGGAXG szekvenciával homológ, míg a másik egység „core”-ja (mondjuk) a (3) képlettel megadott GGGCAGGTGG szekvencia homológja. „Core”-variánsokról tehát inkább a különböző (core) a szekvenciák közötti homológiák kapcsán beszélhetünk, nem pedig kizárólag a „core”-ok összehasonlításakor. A fentiekben megadott „első” definíciót tehát a fenti meggondolások alapján adtuk meg, annyiban egyszerűsítve, hogy a „core” 6-tól 12-16 nukleotidig bármilyen hosszúságú szekvenciarészlet lehet, ahogy azt a (2)—(5) képletek mutatják. Hasonlók vonatkoznak a variánsok definiálására is. A „második” definíció a „core”-t egymást követő hibridizációs lépések alapján definiálja, melyek mindegyike új miniszatellit-ffagmentumok azonosítását eredményezheti. Könnyen belátható, hogy amennyiben elégséges számú hibridizációs vizsgálatot hajtunk végre humán genomi DNS-ből előállított, megfelelően sok mintát tartalmazó génkönyvtárakon, és megfelelő számú hibridizálő fragmentet vetünk alá vizsgálatnak, ezekből hibridizációs próbákat készítünk, majd a készített próbákkal ismét hibridizációs vizsgálatokat végzünk az eredeti génkönyvtárakon, majd ezeket a lépéseket elméletileg végtelenszer megismételjük, egy olyan konszenzus-„core”-szekvenciacsaládhoz kell hogy jussunk, melyek széleskörűen előfordulnak miniszatellit-DNS-régiókban. A gyakorlatban nem szükséges a fenti lépéseket nagyon sokszor megismételni, és nagyon sok DNS-mintát sem kell ahhoz megvizsgálni, hogy eljussunk egy megfelelően széleskörűen elterjedt konszenzus-„core"-régióhoz, ezért a definícióba (önkényesen) csak 3 hibridizációs lépést foglaltunk bele. A „harmadik” definícióban W jelenti a „core”-szekvenciát, és a definíció megfogalmazása annak lehetőségét veti fel, hogy eljuthatunk egy meglehetősen kiterjedten előforduló „core”-hoz oly módon is, hogy a konszenzus-„core”-szekvenciában olyan változtatásokat hajtunk végre, amely a szekvenciának legfeljebb 25%-át érinti (például 16 nukleotid közül legfeljebb 4-et). Amennyiben a „core”-régiót ily módon egy legfeljebb 16 nukleotidból álló és legfeljebb 25%-os eltérést tartalmazó szekvenciarészletként definiáljuk, akkor a W jelű „core” (definíció szerint) ennek a régiónak egy legalább 6 egymást követő nukleotidból álló szekvenciarészletét jelenti. A „negyedik” definíció a konszenzus-„core” képletének egy megváltoztatott meghatározását (6) tartalmazza, amelyhez szintetikus polinukleotidokkal folytatott vizsgálataink során jutottunk. Ezek a vizsgálatok további, rövidebb „core”-szekvenciákra vonatkozó meghatározásokhoz vezettek. Ezek szerint, előnyösen a következő egymást követő (5’—>3’) nukleotidokból álló szekvencia: PGGGCWG (7) minden ismétlődő egységben konzervált P és W jelentése pedig azonos a fenti negyedik definícióban megadottal. P előnyösen T; W pedig előnyösen A. Szintén előnyösen az egymást követő (5’->3’) nukleotidokból álló szekvencia: TGGGCA (8) konzervált minden ismétlődő egységben. A találmány tárgyát képezik továbbá olyan polinukleotidok, melyek legalább három olyan ismétlődő egységet tartalmaznak, melyek magukban foglalják a következő 5’—>3’ irányban egymást követő nukleotidokból álló „core”-szekvenciát GGPGGGCWGGWXG (7) ahol P-nem G, W-A vagy T és X-A vagy G, vagy ezek változatait, feltéve hogy az összes előforduló „core”-szekvencia, minden ismétlődő egységet beleértve legalább 70%-os homológiát mutat az összes „valódi core”-szekvenciával, melyet azonos számú ismétlődésre a (7) képlet alapján határozhatunk meg, és minden olyan polinukleotidot, melyek szekvenciája komplementer a fentiekben megadottakkal. Minden fenti meghatározásban a „core”-szekvencia legalább 6 nukleotidhosszú, előnyösen legalább 7 vagy 8, és legelőnyösebben 12 vagy több, például 14-16 nukleotidhosszúságú. A (2) képletben megadott GGCAGGAXG-szekvencia (a 3’ vég felőli 10 nukleotid) nagymértékben konszenzus, és különösen ígéretesnek látszik. A „core” előnyösen legalább 6, és még előnyösebben mind a 10 nukleotidját tartalmazza a fenti szekvenciának. A „core”-variánsok előnyösen legalább 75% homológiát tartalmaznak, és még előnyösebben legalább 80, vagy 85%-os homológiát A J és K jelű szegélyezőszekvenciákat előnyösen elhagyjuk, vagy rövidnek választjuk, pl. 0,1 vagy 2 nukleotidnak mindkét oldalon, és J és K együttesen ne haladja meg a 20-at, előnyösebben a 15-öt. A J+core+K összeg által megadott nukleotidszám, egy ismétlődő egységen belül, előnyösen nem haladja meg a 36-ot, előnyösebben a 31-et, és legelőnyösebben a 25-őt. Az ismétlődő egységek száma n, előnyösen legalább 10, célszerűen 10 és 40 közötti, de n elvileg bármely szám lehet egészen 10 000-ig. A H-val és L-lel jelölt szegélyezőszekvenciák szerepe elhanyagolható. El is hagyhatóak, de bármekkorák 5 10 15 20 25 30 35 40 45 50 55 i60 8