Citationsanalyse

Den citationsanalyse er et felt af bibliometri , som beskæftiger sig med studiet af citationer travlt, der er forholdet mellem citerede og citerer værker, og dens anvendelse som en bibliometrisk undersøgelse metode.

Forskellige indikatorer bruges som bibliometriske parametre, som for det meste beregnes ved hjælp af statistiske metoder, hvorved der antages visse antagelser med hensyn til forfatteres citationsadfærd:

  • Generelt betragtes en akademisk artikel som indflydelsesrig, hvis den ofte citeres af andre forfattere. Citationsværdien bruges her som en indikator, der indstiller citationsfrekvenser i forhold til det samlede antal citerede artikler, hvorved dens udvikling over tid også kan tages i betragtning.
  • Hvis man antager et forhold mellem flere værker, der citeres sammen eller citerer et andet, kan klyngeanalysen bruges til at danne grupper af forfattere og / eller publikationer, der kan beskæftige sig med et underområde af videnskab.
  • Hvis det er muligt at evaluere indholdet af publikationer, er korrespondanceanalysen et passende værktøj til oprettelse af videnskabskort.
Resultat af citationsanalysen: publikationer om outsourcing

Da strukturen i videnskabelige publikationer stort set er standardiseret og indeholder andre data såsom abstracts, fuldtekst, deskriptorer og adresser til forfatterne ud over referencer, bruges citationsanalyse oftere og oftere. Til forskning og analyse af citater er der citationsdatabaser, der giver de nødvendige oplysninger i et åbent format. Da resultaterne af citationsanalyser ofte ikke kan udtrykkes i enkle tal, anvendes metoder til visualisering af information også til at skildre de komplekse citationsrelationer.

Målene med citationsanalysen er

  • indholdsrelateret-tekniske forbindelser mellem personer, institutioner, publikationer, discipliner og deres videnskabelige indflydelse (effekt)
  • Forskningsfokus for videnskabelige artikler og deres udvikling over tid
  • Aktiviteter og aktualitet af forskningsgrupper inden for videnskab samt "hotte" emner og diskussioner
  • banebrydende publikationer, der danner grundlaget for yderligere forskning.
  • Forholdet mellem forskning og industri (citater fra videnskabelig litteratur i patenter)
  • Brug som et evalueringsværktøj til peer reviews
  • Delvist aspekt til vurdering af kvaliteten af ​​det videnskabelige arbejde som beslutningsgrundlag for offentlige forskningsinstitutioner

historie

I 1927 begyndte søskerne Gross at bruge citater som en bibliometrisk datakilde. Navnene på de kemiske tidsskrifter blev bestemt på basis af fodnoter. Jo oftere et magasin blev nævnt, jo højere blev relevansen bedømt. Gross & Gross bemærkede en ulige fordeling. Dette betyder, at nogle få tidsskrifter ofte får flere kilder end andre publikationer.

I 1955 foreslog Eugene Garfiel i sin artikel "Citation indexes for science" 1955 systematisk at registrere citater fra videnskabelige publikationer og dermed gøre citationssammenhænge klare. I 1963 dukkede det første trykte Science Citation Index op , som analyserede 562 tidsskrifter fra 1961 og offentliggjorde 2 millioner citater. I samarbejde med Irving H. Sher resulterede dette i "Journal Impact Factor ". Når vi ser tilbage på de to foregående år, bestemmer dette, hvor ofte artiklerne i et specialtidskrift blev citeret i et andet tidsskrift. Det samlede antal offentliggjorte artikler divideres med det beregnede antal og giver den tilsvarende faktor.

Karl Erik Rosengren udviklede cocitation- forholdet i 1966 . Hvis en forfatter citeres flere gange i løbet af en debat, øges hans citatæller. Hvis to forfattere navngives sammen, styrkes forholdet mellem de to. Denne værdi indikerer, at begge forfattere naturligvis forsker inden for et fælles arbejdsområde. Denne procedure kan også anvendes på dokumenter og vilkår.

Robert K. Merton offentliggjorde Matthew Effect i 1968 . Dette beskriver, at kendte forfattere citeres oftere end ukendte. Merton bemærker, at når den citerede passage bliver mere kendt, nævnes kilden ikke længere, eller kun forfatteren nævnes, hvis den bruges yderligere.

Alan Pritchard opfandt udtrykket bibliometri til kvantitativ måling af videnskabelige publikationer i 1969 . Bøger, artikler og magasiner måles ved hjælp af matematiske og statistiske metoder. For eksempel bestemmer det, hvor ofte en videnskabsmand offentliggør artikler i tidsskrifter. De hidtil præsenterede metoder anvendes også i bibliometri. Bibliometrics er en gren af scientometrics .

Social Sciences Citation Index blev først offentliggjort i 1973 . Dette er en tværfaglig, gebyrbaseret citatdatabase udviklet af Institute for Scientific Information , der ser på mere end 3.100 mest engelsksprogede specialtidskrifter fra mere end 50 samfundsvidenskabelige discipliner.

Henry Small og Irina Marshakova udviklede citatanalyse i 1973.

I 1976 blev Journal Citation Reports udgivet af Institute for Scientific Information. Med denne applikation er det muligt at søge i forskellige litteratur- og citationsdatabaser efter relevant videnskabelig litteratur. Denne service findes i dag under navnet "Web of Science" og drives af Clarivate Analytics som et betalt websted .

Udtrykket "scientometrics" stammer fra bogen med samme navn udgivet af Wassili Nalimow i 1969. Derek de Solla Price grundlagde denne proces med Eugene Garfield i 1978. Ud over bibliometrics kan andre oplysninger såsom antallet af universitetsuddannede også måles. Scientometry er tildelt infometri og ofte også til de videnskabelige videnskaber .

Samme år blev Arts and Humanities Citation Index oprettet , som er en afgiftspligtig citatdatabase, der viser mere end 1.100 specialtidsskrifter inden for kunst og humaniora .

I 1985 udgav Terrence A. Brooks en bog, hvor han præsenterede de forskellige måder at citere på og motivationen til at bruge citater.

I 1988 leverede Kina den kinesiske videnskabelige og tekniske publikationsdatabase (CSTPC), som viser de rapporter, der er offentliggjort i kinesiske videnskabelige tidsskrifter.

Citatgraf

Mange citater og relaterede publikationer kan matematisk beskrives som en graf , der derefter kaldes en citationsgraf (også kendt som citespace ). Blandt andet anvendes metoder til netværksanalyse til analysen . I citatgrafen, publikationer (sædvanligvis videnskabelige artikler) danner knudepunkter , mellem hvilke citater skabe de kanter . Alternativt kan alle artikler i en specialtidskrift kombineres i en node for at sammenligne forskellige tidsskrifter. Andre måder at konstruere grafer ud fra citationsdata er information om medforfatterskab og co- citering . De vigtigste citationsbaserede forhold mellem to publikationer A og B er:

Citeringsmuligheder

Undersøgelser af citationsgrafer afslører forskellige regelmæssigheder og strukturer om forfatteres publiceringsadfærd. Det viser sig, at citatgrafer danner skalafrie og små verdensnetværk . Gennem klyngeanalyse og andre netværksanalyseteknikker kan samfund findes af forskere, der ofte citerer hinanden.

I webometri undersøges linkgrafer over websteder og hyperlinks ( placeringer ) på samme måde som citatgrafen .

Fejlkilder

Resultaterne af citatanalysen kan fordrejes af forfalskede indikatorer som forfatterens publiceringsrate. Forfattere med et stort antal publikationer citeres oftere, hvilket afspejles i statistikken, men det betyder ikke nødvendigvis, at de eller deres bidrag er vigtigere end andre. Nogle forfattere udgiver det samme videnskabelige resultat flere gange under forskellige titler eller på forskellige sprog.

Statistiske artefakter stammer fra det faktum, at ikke alle forfattere tages i betragtning i publikationer med flere forfattere. Vægtningen af ​​de enkelte forfattere efter deres arbejdsdeling kan næppe bruges i analysen, da forfatternes navne ofte er gemt alfabetisk af tekniske årsager. Indtastnings- og transkriptionsfejl, der opstår ved indtastning af navne i heterogene tegnsætssystemer, falder også inden for denne kategori.

Der opstår sammenlignelige sammenligninger, hvis der f.eks. Oprettes ranglister for tidsskrifter, der forsømmer eksisterende information, såsom publiceringscyklusser, publiceringshastighed. Citater fra gennemgangsartikler, der kun tilbyder et overblik, kan næppe filtreres af statistiske automatismer uden en indholdsvurdering.

Uacceptabel brug af matematiske eller statistiske procedurer, hvis forudsætninger ikke er opfyldt eller krænket uden at foretage passende korrektioner, fører til ineffektivitet. Dette kan være et utilstrækkeligt antal dokumenter som i tilfælde af flerdimensionel skalering eller manglen på en normalfordeling eller en uacceptabel datauafhængighed i regressionsanalyse .

At citere egne værker eller af høflighedshensyn betragtes som tvivlsomt, men det er ofte svært at afgøre, om der er faktiske eller mere strategiske grunde.

Forskelle i typen af ​​henvisning i forskellige discipliner, der ikke blev taget i betragtning.

Problem

Da det antages, at gode papirer citeres oftere, bruges antallet af citater, som et videnskabeligt bidrag modtager, ofte som et mål for dets kvalitet . Denne almindelige praksis er dog ikke uden problemer, da vurderingen af ​​indholdet undertiden truer med at blive overset, og rent statistiske kriterier er afgørende. Det faktum, at en bestemt forfatter ofte citeres, kan have en lang række årsager og tillader ikke altid en erklæring om kvaliteten af ​​hans bidrag. Det kan også kaldes for dannelsen Zitierzirkel come ("citerer mig, O zitier 'Jeg elsker dig"), som fordrejer resultatet (også: Zitierkarussell , ondsindet: Zitierkartell ).

Konkrete kritikpunkter fra citationsanalyser

  • Virkningen af ​​et værk målt på antallet af citater i videnskabelige artikler ignorerer den indflydelse, et værk kan have på andre områder (for eksempel i branchen, der ikke offentliggør sine resultater).
  • På grund af Matthew-effekten citeres ofte citerede værker oftere uden at se på indholdet. En undersøgelse foretaget af M. V. Simikin og V. P. Roychowdhury viser, at kun omkring en fjerdedel af de citerede værker endda læses af forfatterne.
  • Nogle citater tilføjes kun for at øge virkningsfaktoren for en forfatter eller en journal. Publikationer er også optimeret til at opnå et stort antal citater i stedet for at optimere kvaliteten.
  • Betydningen af ​​artikler i tidsskrifter og procedurer og monografier varierer betydeligt afhængigt af emnet. Disse forskelle tages ikke i betragtning i citatdatabaser, så individuelle fagområder undervurderes eller overvurderes.
  • De hyppigst citerede papirer er ofte undtagelser, der hovedsageligt citeres, fordi det er almindeligt at citere disse papirer. Andre værker med lige så stor indflydelse citeres imidlertid ikke længere eksplicit, fordi deres indhold er blevet en selvfølge.
  • Beregningen af påvirkningsfaktoren er altid tidsrelateret med en maksimumsperiode på 6 til 8 år (to ph.d.-perioder), hvorved citattoppen når i gennemsnit efter de første to år. Afhængigt af forskningsområdets aktivitet kan denne værdi imidlertid variere meget, hvilket kan føre til fejl i beregningen af ​​virkningsfaktoren og halveringstiden for citationsfrekvensen. Lignende fejl kan opstå, hvis tidsskrifterne for publikationsorganerne ikke tages i betragtning.
  • Forskellige citationsmetoder betyder, at individuelle værker i citationsdatabaser behandles som forskellige publikationer. Så det berømte papir var for eksempel indledende sekventering og analyse af det menneskelige genom i det menneskelige genom-projekt i 2001 ISI oprindeligt opført med forskellige forfattere, så det viste sig ikke blandt de mest citerede papirer.
  • Nogle ikke-engelsksprogede tidsskrifter vises også i en engelsk udgave. Dette tælles dog ofte forkert som et separat magasin.
  • Den målte effekt tager ikke højde for det formål, som publikationen citeres til. For eksempel kan en henvisning bruges til at påpege videnskabelige fejl i den citerede publikation.

Den Science Impact Index (SII) forsøger at komme til et objektivt mål for kvaliteten af forskere forskning ved at overveje mange af disse aspekter gennem vægtning.

Se også

litteratur

Monografier

  • Eugene Garfield : Citation Indexing - Dens teori og anvendelse inden for videnskab, teknologi og humaniora. Wiley, New York NY 1979, ISBN 0-471-02559-3 .
  • Otto Nacke (red.): Citatanalyse og relaterede procedurer . IDIS - Institut for Dokumentation og Information om Social Medicin og Folkesundhed, Bielefeld 1980, ISBN 3-88139-024-3 .
  • Ирина В. Маршакова: Система цитирования научной литературы как средство слежения за развитием науки. Наука, Москва 1988, ISBN 5-02-013311-6 .
  • Henk F. Moed: Citation Analysis in Research Evaluation (= Information Science and Knowledge Management. Vol. 9). Springer, Dordrecht et al. 2005, ISBN 1-4020-3713-9 .

Individuelle repræsentationer

Weblinks

svulme

  1. O. Nacke: citationsanalyse og relaterede metoder. 1980.
  2. Dirk Tunger: Bibliometriske procedurer og metoder som bidrag til trendobservation og anerkendelse inden for naturvidenskab. (PDF) Forschungszentrum Jülich, 2007, s. 33 , tilgængelig den 10. november 2018 .
  3. ^ Eugene Garfield: Citeringsindeks for videnskab . I: Videnskab . bånd 122 , nr. 3159 , 1955, s. 108-111 .
  4. ^ Frank Havemann: Introduktion til bibliometri. (PDF) Society for Science Research Berlin, 2009, s. 9 , tilgængelig den 10. november 2018 .
  5. ^ Frank Havemann: Introduktion til bibliometri. Kokitationsanalyse. (PDF) Gesellschaft für Wissenschaftsforschung Berlin, 2009, s. 32–33 , adgang til den 10. november 2018 .
  6. Databaser - Afklar . I: Afklar . ( clarivate.com [adgang til 10. november 2018]).
  7. ^ Terrence A. Brooks: Private handlinger og offentlige genstande: En undersøgelse af citermotiver . I: Journal of the American Society for Information Science . bånd 36 , nr. 4. juli 1985, ISSN  0002-8231 , s. 223–229 , doi : 10.1002 / asi.4630360402 ( wiley.com [PDF; adgang til 10. november 2018]).
  8. Yishan Wu, Yuntao Pan, Yuhua Zhang, Zheng Ma, Jingan Pang: Kinas videnskabelige og tekniske papirer og citater (CSTPC): Historie, effekt og udsigter . I: Scientometrics . bånd 60 , nr. 3 , 2004, ISSN  0138-9130 , s. 385–397 , doi : 10.1023 / b: scie.0000034381.64865.2b ( springer.com [åbnet 10. november 2018]).
  9. Mikhail V. Simkin, Vwani P. Roychowdhury: Læs inden du citerer! I: Komplekse systemer. Vol. 14, nr. 3, 2003, ISSN  0891-2513 , s. 269-274, arxiv : cond-mat / 0212043 .