Schubert András, Glänzel Wolfgang, Braun Tibor: Tudománymetriai mutatószámok 32 ország természettudományos alapkutatásának összehasonlító elemzéséhez 1976–1980 (A MTAK Informatikai És Tudományelemzési Sorozata 3., 1983)
4 ADATFORRÁSOK ÉS AZ ADATFELDOLGOZÁS MÓDSZEREI - 4.3 Az idézettségi mutatószámok összehasonlításának statisztikai megbízhatósága
30 A p = 0.95 megbízhatósághoz Wp = 1.96 küszöbérték tartozik. Minthogy |w| *= 1.98 > 1.96 = Wp, a két folyóirat átlagos idézettsége (impact factora) 0.95 megbízhatóság mellett szignifikánsan különbözik. B. Két ország publikációi átlagos idézettségének összehasonlítása valamely szakterületen: az x mintaátlagok (a XI. mutatószám értékei) mellett az 5. fejezet megfelelő táblázataiban és ábráin mindenütt feltüntettük a D(x) szórásokat. A w-statisztika a (2) egyenlet szerint számítható ki. Megjegyezzük, hogy mind az A., mind a B. esetben különböző szakterületekre vonatkozó idézettségi mutatószámok összehasonlítása formálisan ugyan elvégezhető, de az ilyen összehasonlítások tartalmilag nem mérvadóak. Példa: Hasonlítsuk össze Ausztria és Magyarország átlagos idézettségét a matematikai szakterületen. Az összehasonlításhoz szükséges adatok a 8—H táblázat szerint Ausztria x = 0.226 D(x) = 0.034 Magyarország t = 0.248 D(x) = 0.030. A (2) egyenlet alapján 0.226 - 0.248 \/0.Ö34' J + 0.Ö3Ö 1 -0.485. Mivel |w| = 0.485 < 1.96 = wp (p = 0.95), a két ország matematikai publikációinak átlagos idézettsége közötti eltérés 0.95 megbízhatóság mellett nem tekinthető szignifikánsnak. C. Az átlagos idézettség és az átlagos várható idézettség összehasonlítása: egy publikációhalmaz átlagos idézettségét ilyenkor ahhoz az értékhez hasonlítjuk, amely az illető publikációkat tartalmazó folyóiratok átlagos idézettsége alapján várható lenne. Mivel a vizsgált publikációhalmaz a szóbanforgó folyóiratok összes publikációi halmazának részhalmaza, a két összehasonlított érték nem független egymástól. Ha azonban a vizsgált mintában az összes publikációknak csak kis hányada található (és ez a könyvünkben szereplő 32 országból származó mintákra általában igaz), a függetlenség közelítően fennáll. Ilyenkor továbbá az összes publikáció adataiból számított átlagos várható idézettség szórása elhanyagolható, és a w-statisztika az (1) egyenlet alapján számítható ki. Minden ország összes szakterületére kiszámítottuk és az 5. fejezet XXX-5. táblázataiban (XXX az ország betűkódja), valamint a 8-A - 8-H táblázatokban feltüntettük a w-statisztika értékét. Példa: Vizsgáljuk meg a magyar biológiai, kémiai és matematikai publikációk átlagos idézettségének a várhatótól való eltérését. A HUN—5. táblázat alapján biológia w — 3.219; |w|>1.96; kémia w = -2.877; |w| > 1.96; matematika w = 0.291; |w| < 1.96. Tehát p=0.95 megbízhatóság mellett a matematikai publikációk átlagos idézettsége nem térel szignifikánsan a várhatótól, a biológiai és a kémiai publikációké igen. A w-statisztika előjele szerint a biológiai publikációk idézettsége a várhatónál szignifikánsan nagyobb, míg a kémiai publikációké a vártnál kisebb.