Schubert András, Glänzel Wolfgang, Braun Tibor: Tudománymetriai mutatószámok 32 ország természettudományos alapkutatásának összehasonlító elemzéséhez 1976–1980 (A MTAK Informatikai És Tudományelemzési Sorozata 3., 1983)
4 ADATFORRÁSOK ÉS AZ ADATFELDOLGOZÁS MÓDSZEREI - 4.3 Az idézettségi mutatószámok összehasonlításának statisztikai megbízhatósága
29 p WP 0.5 0.6745 0.6 0.8416 0.7 1.0864 0.8 1.2816 0.9 1.6449 0.95 1.9600 0.99 2.5785 0.999 3.2905 0.9999 3.8906 Ha az (1) egyenlet alapján számított w-statisztika abszolút értéke a kiválasztott p megbízhatósághoz tartozó w„ küszöb alatt marad, akkor a tapasztalati adatok az E (x) = a feltevést p megbízhatóság mellett nem cáfolják, |w| > w p esetén p megbízhatósággal állíthatjuk, hogy az E(x) várható érték a rögzített a értéktől szignifikánsan eltér. A megbízhatóság szintjét az adatok természetétől és az összehasonlítás céljától függően kell megválasztani; könyvünkben az összehasonlításokat 0.95 megbízhatóság mellett végezzük. Ez — más megfogalmazásban - azt jelenti, hogy egymástól legalább 1,96-szoros szórástávolsággal különböző értékeket tekintünk egymástól szignifikánsan különbözőnek. Tekintsünk most egy n és egy m publikációból álló mintát, melyeknek elemei rendre X|, x,, ... x n, ill. yiy 2, ..., y m idézetet kaptak. A kérdés az, hogy az x,y mintaátlagok különbsége alapján szignifikánsan eltérőnek nyilváníthatjuk-e az E(x), E(y) várható értékeket. Az (1) egyenlet helyett most a x -y w= . - • (2) VD 2 (X) + D 2 (y) összefüggés alapján számíthatjuk ki a w-statisztika értékét; az eltérés szignifikanciájáról az előzővel megegyező módon dönthetünk. A w-statisztika kiszámításához szükség van a mintaátlag szórására. Mint ismeretes 7 6, az if mintaátlag D(iT) szórását az x valószínűségi változó D(x) szórásából és az n mintanagyságból a D(if) = D (x) / %/ n összefüggés segítségével számíthatjuk ki. A rendelkezésre álló becslőmódszerek 3 7 közül a tapasztalataink szerint legalkalmasabbal 6 4 számítottuk ki a folyóiratok átlagos idézettségének (impact factorának), valamint az egyes országok (és azon belül az egyes szakterületek) egy publikációra eső átlagos idézettségének szórását. Az 5. fejezet megfelelő táblázataiban az átlagértékek mellett mindenütt feltüntettük azok szórását is. A szórások segítségével pl. a következő összehasonlítások végezhetők el: A. Két folyóirat átlagos idézettségének összehasonlítása: a mintaátlagok (x, y) és szórásaik [D(x), D(y)] az 5.4 részben található táblázatban közvetlenül leolvashatók. A w-statisztika a (2) egyenlet alapján határozható meg. Ha w a kiválasztott p megbízhatósági szinthez tartozó w p küszöbértéknél kisebb, akkor a két folyóirat átlagos idézettsége közötti eltérés nem szignifikáns. Példa: Tekintsük az 5.4 rész folyóiratjegyzékéből a névsor szerinti első két folyóiratot. A két folyóiratnak az összehasonlításhoz szükséges adatai a táblázat szerint: AGRAEFESA x = 0.611 D(x)= 0.078; A VAN LEEUW y = 0.913 D(y)= 0.131. A (2) egyenlet alapján 0.611 -0.913 vfflj7Fnnr = -1.98.