Schubert András, Glänzel Wolfgang, Braun Tibor: Tudománymetriai mutatószámok 32 ország természettudományos alapkutatásának összehasonlító elemzéséhez 1976–1980 (A MTAK Informatikai És Tudományelemzési Sorozata 3., 1983)
4 ADATFORRÁSOK ÉS AZ ADATFELDOLGOZÁS MÓDSZEREI - 4.2 A publikációk kiválasztásának és osztályozásának alapelvei
27 ad 1 .Tanulmányunkban az 1976-1980 években megjelent publikációk adatait, ezen belül az 1978-1979 években megjelent publikációk 1980. évi idézettségét dolgoztuk fel. Mivel az SCI* éves kötetei (mind nyomtatott, mind mágnesszalagos formában) országonként és szakterületenként változó mennyiségű (kb. 10—50% közötti) adatot tartalmaznak a tárgyévet megelőző évekből megjelenési, postai és egyéb késések miatt, a publikációkat a megjelenés feltüntetett évszáma szerint naptári évekre bontva elemeztük. Megjegyezzük, hogy az idézettségi mutatószámokat viszont az 1980. évi kötetben található idézetek alapján számoltuk naptári évre való korrekció nélkül. Ezt az indokolja, hogy számunkra az idéző periódus pontos időzítésének semmiféle jelentősége nem volt, csak annak, hogy minden országra azonos legyen. ad 2. A vizsgált időtartamban az SCI több, mint 3500 folyóirat és kb. ugyanannyi többszerzős könyv, ill. konferenciakiadvány (proceedings) anyagát dolgozta föl. Vizsgálatunkban kizárólag a folyóiratokban megjelent publikációkkal foglalkoztunk, és azok közül is csak az általunk relevánsnak tekintett publikációtípusokat vettük figyelembe. Az SCI a publikációkat a következő típusokba sorolja (az egyértelműség kedvéért az angol megjelöléseket használjuk): 1. Articles, reports, technical papers, etc. 2. Reviews and bibliographies 3. Letters, communications, etc. 4. Technical notes 5. Meeting abstracts 6. Discussions, conference items 7. Items about individuals (tributes, obituaries, etc.) 8. Editorials 9. Corrections, errata, etc. E típusok közül munkánk során csak az 1 -4. alatti tételeket vettük figyelembe mint — legalábbis potenciálisan - teljesértékű tudományos információt hordozó publikációkat. ad 3. Az SCI minden publikációhoz megadja azoknak az intézményeknek a nevét és postacímét, amelyeket a szerzők (ill. a kiadó) a cikkben feltüntetettek. A postacím tartalmazza az ország nevét is - ennek alapján rendeltük a publikációkat az egyes országokhoz.Természetesen a társszerzői együttműködés következtében előfordul, hogy egy ország több intézménye, ill. több ország szerepel egy publikációban. Ilyen esetekben a publikációt minden résztvevő országhoz teljesértékű publikációként beszámítottuk, de egy országhoz legfeljebb egyszer. Így pl. ha egy publikáció szerzői között három magyar, két csehszlovák és egy lengyel intézmény munkatársai szerepeltek, ezt Magyarország, Csehszlovákia és Lengyelország számára egyaránt egy-egy publikációként értékeltük. Az ebből adódó átfedések miatt az egyes országok adatai közvetlenül nem összegezhetők. Azokat a publikációkat, amelyekben a szerzők munkahelyét nem tüntették fel, természetesen nem tudtuk az egyes országokhoz hozzárendelni. Az ilyen publikációk száma országonként és szakterületenként változó, de általában nem haladja meg az összes publikáció 5%-át. Ezért úgy véljük, hogy az ilyen publikációkat lényeges torzítás veszélye nélkül a feldolgozásból elhagyhattuk. Ad 4. Amint azt többször hangsúlyoztuk, részben elvi (a publikációs és idézési szokások különbözőségéből eredő), részben gyakorlati (az adatbázis szerkezetéből adódó) okokból tudománymetriai mutatószámaink érdembeni nemzetközi összehasonlítása csak az egyes szakterületeken belül képzelhető el. Az elemzés tárgyát képező mintegy kétmillió publikációt azonban nyüvánvalóan nem lehetett egyenként osztályozni. A publikációk szakterületi osztályozásához ezért a Pinski (1. Narin 5 0 (által kidolgozott és a CHI munkáiban rendszeresen használt módszert hívtuk segítségül. Eszerint először a folyóiratokat csoportosítottuk szakterületük szerint, majd a publikációkhoz annak a folyóiratnak a szakterületét rendeltük hozzá, amelyben megjelent. A folyóiratok szakterület szerinti osztályozásának első lépése az egyes szakterületek legjelentősebb folyóiratait tartalmazó „magok" kiválasztása volt, ezután a teljes folyóirat-halmaz osztályozása a folyóiratok idézettségi kapcsolatain alapuló számítógépes eljárással történt. Ezzel az eljárással az interdiszciplináris folyóiratok is pontosan meghatározható százalékos kulcsok arányában frakcionálhatok az egyes szakterületek között. A módszer elvi alapjai és eredményei Narin művében 5 0