Elektronické vědecké články
podle článku Mauricia Ayala-Sáncheze
zpracoval: Jiří Svršek

1. Úvodem

Současné digitální komunikační sítě v podobě elektronické pošty, elektronické archivy odborných článků, webovské servery, FTP servery a podobně, se staly důležitým a živým nástrojem rozvoje vědeckého výzkumu. Nyní lze každý významný objev nebo důležitou vědeckou práci předat vědeckému společenství za méně než 24 hodin a publikovat ještě téhož dne. Navíc neexistují žádná omezení na velikost dokumentu a proto lze vědecké výsledky publikovat se všemi podrobnostmi, dokonce interaktivním způsobem a za velmi nízkou cenu. Nyní již není nutné čekat několik měsíců na publikování vědeckého článku v odborném časopise, ale lze každý článek bezprostředně konzultovat s kýmkoliv ve světě.

2. Historie a vývoj vědeckého publikování

V 17. století probíhala komunikace vědců a intelektuálů osobními dopisy, rukopisy nebo zprávami. Věda v moderním smyslu teprve vznikala a vědců bylo málo. Zprávy o vědeckých objevech si vědci předávali mezi sebou. Například Fermatova práce o teorii pravděpodobnosti vešla ve známost díky jeho korespondenci s Pascalem a díky korespondenci Pascala s Carcavim. Dodnes známá Fermatova věta vešla ve známost jen díky poznámkám v rukopise.

V polovině 15. století byl objeven knihtisk, který umožnil mnohem rychlejší šíření poznání. Do té doby se knihy přepisovaly ručně a z jednoho originálu existovalo nejvýše několik kopií. Díky knihtisku v první polovině 17. století Galileo Galilei rozšířil svůj významný rukopis "Dialog o dvou hlavních světových soustavách". Je zajímavé také poznamenat, že Galileo svůj rukopis napsal skutečně jako dialog a díky tomu vešel ve známost také mezi neodbornou veřejností. Ve druhé polovině 17. století Isaac Newton svým dílem "Principia" dal významný impuls rozvoji vědy. Ve stejné době Královská společnost v Londýně stála u zrodu současné formy vědecké komunikace a hodnocení vědecké práce, když založila první vědecký časopis. Odborné časopisy se na dlouhou dobu staly nejlepším způsobem komunikace vědecké veřejnosti a šíření vědeckého poznání.

Vědecké časopisy dodnes slouží k šíření vědecké práce. Řídí se přesnými pravidly pro publikování: publikovaná práce musí být původní a žádný článek nesmí být publikován ve dvou časopisech. Zodpovědnost za obsahovou správnost článku nese jeho autor. Před publikováním článku je práce analyzována a diskutována odborníky, což zaručuje vysokou odbornou kvalitu a úroveň vědeckých časopisů a odborných publikací. Dnes například existuje asi 50 tisíc výročních mezinárodních publikací o matematice.

Ve druhé polovině 20. století došlo k prudkému rozvoji telekomunikací a výpočetní techniky. Objevila se také první interaktivní komunikace. V roce 1961 proběhl experiment šíření vědeckých článků ve formě preprintů prostřednictvím služby IEGs (Information Exchange Groups). Tuto službu zajišťovaly americké Národní ústavy zdraví (National Institutes of Health), které měly 2500 členů a 80 procent všech zpráv bylo publikováno v tištěných časopisech. Cílem tohoto experimentu bylo zajistit okamžitou komunikaci mezi výzkumníky. V březnu 1967 byl experiment ukončen, protože některé IEG preprinty byly úplnými publikacemi. To však představovalo nebezpečí pro existující tištěné odborné časopisy, jejichž využití by se omezilo. Navíc IEG preprinty porušovaly požadavek většiny odborných časopisů, aby publikované dokumenty nebyly umístěny kdekoliv.

Koncem srpna 1991 Paul Ginsparg prosadil, aby vznikl server pro centralizovanou distribuci elektronických preprintů. Server byl umístěn v Národní laboratoři v Los Alamos (LANL, the Los Alamos National Laboratory) za podpory Americké fyzikální společnosti (APS, the American Physics Society). Původně server využívali výzkumníci teoretické fyziky vysokých energií (hep-th, High Energy Physics - Theory), avšak brzy server začali využívat také fyzikové a matematikové ostatních oborů. Dnešní e-Print servery pronikají do dalších vědeckých oblastí a nejsou ničím omezovány. Server ArXiv [X0] v Národní laboratoři v Los Alamos má dnes 18 zrcadlových serverů a 70 procent všech publikovaných článků bylo také publikováno v odborných časopisech a 20 procent bylo uvedeno na vědeckých konferencích.

3. e-Print servery

Zřejmě jednou z nejvíce přitažlivých vlastností on-line odborných časopisů (dnes je jich více než 500) je možnost systematické konzultace. Každý výzkumník může svoji práci ihned konzultovat se svými kolegy na celém světě. Navíc se v knihovnách šetří fyzický prostor a čas na získání článku. Výzkumník obvykle nemá přístup k veškeré potřebné literatuře v papírové formě a elektronická forma dokumentů mu tuto možnost nabízí. Dnes se často používá slogan "vytiskni si to, co právě používáš". Cena elektronického publikování je nízká, přístup k publikacím je jednoduchý. Například provozní náklady knihovny (knihy, časopisy atd.) ve vědecké instituci tvoří až 1/4 ceny celkových nákladů na odbornou literaturu. e-Print servery jsou nenáročné na provoz, publikování na nich je jednoduché. Navíc k řadě těchto serverů má zdarma přístup také veřejnost. Skvělým příkladem je právě ArXiv [X0]. Nejde tedy o něco, co je uzavřeno na elektronickém médiu nějakého serveru.

Odborné texty (zejména matematické a fyzikální) lze napsat například pomocí publikačního nástroje Adobe Acrobat nebo velmi mocného nástroje LaTeX. Výstupním formátem je obvykle PDF (Portable Document Format), který lze přečíst volně šířeným prohlížečem Adobe Acrobat Reader. Publikační nástroj LaTeX je běžnou součástí operačního Linux a proto je šířen zdarma.

Autor článku [X1] soustředil svoji pozornost na e-Print servery, které mají největší publicitu, jsou vědeckou komunitou nejvíce využívány a mají největší dopad na rychlost a pokrok vědeckého vývoje. Příkladem je Maldacenova práce [X2], která byla po publikování v roce 1998 citována 456 krát nebo Polchinskiho práce [X3], která byla citována 688 krát.

Pokud vydáváte nějakou publikaci, nejvážnějším problémem pro vás jsou finanční náklady a předpokládaný zisk. Řada publikací proto byla donucena publikovat v elektronické formě. Příkladem jsou odborné časopisy Physics Review Letters (PRL) [X4], The Journal of High Energy Physics (JHEP) [X5], Mathematical Physics Electronic Journal (MPEJ] [X6] a Central PubMed[X7].

Na druhé straně náklady jsou tím, co rozhoduje o tom, zda on-line publikování je nebo není zdarma. V rozvojových zemích právě kvůli finančním nákladům je omezen přístup k potřebné odborné literatuře. Tím je omezen vědecký výzkum v těchto zemích, přestože teoretická práce vědců těchto zemí je jistě srovnatelná s výzkumem vědců v nejvyspělejších zemí světa. Ostatně podstatnou část vědců ve Spojených státech amerických a jiných vyspělých zemích tvoří vědci z rozvojových zemí.

Určujícím faktorem pro šíření vědecké práce je zřejmě dostupnost kvalitních informací, které jsou aktuální, vědecky přesné, teoreticky významné, aplikačně využitelné, případně mají pedagogický nebo epistemologický význam. Přístup k informacím dnes lze snadno zajistit elektronickými médii, tedy elektronickou poštou, pomocí e-Print serverů, webovských serverů, elektronické konference odborníků a podobně. Současné elektronické časopisy nebo e-Print servery zdědily od svých papírových předchůdců svůj formát: obsahují pouze text a obrázky. Možná v blízké budoucnosti bude důležitý nejen rigoróznost a vědecký obsah, ale také jeho vzhled. Připomeňme Galileovu práci napsanou formou dialogů. Lze proto očekávat, že užitečným nástrojem budou také multimédia, tedy zvukové a obrazové záznamy, počítačová grafika a modelování. Vědecká práce se tím lépe přiblíží neodborné veřejnosti. Nelze totiž přehlížet fakt, že veřejnost přímo nebo nepřímo rozhoduje o výši prostředků vynaložených na vědecký výzkum financovaný státem a management významných firem rozhoduje o prostředcích vynaložených na vědecký výzkum v těchto firmách.

Autor článku [X1] analyzoval statistiku dynamiky citačního indexu publikovaných článků, která sleduje počet citací článků v jednotlivých letech po publikování. Zjistil, že záleží na tom, zda elektronické časopisy jsou dostupné zdarma nebo nikoliv. Zkoumal podíl I_{#i}(y)/N_p(y), kde I_{#i}(y) je počet, kolikrát byl článek #i citován v roce y, N_p(y) je počet všech článků publikovaných v roce y. Tento podíl klesá k nule pro každý článek #i publikovaný v elektronické databázi SLAC (Stanford Linear Accelerator Center).

4. Možnosti budoucí vědecké komunikace

Pokud je určitá vědecká práce publikována v některém odborném časopise, znamená to, že její myšlenka nebo objev byly registrovány a že skupina odborníků potvrzuje a podporuje daný výzkum. Ve stejné době se informace o objevu dostává do vědeckého společenství. Článek však získává význam pouze tehdy, je-li potvrzen a citován v jiných pracích, tedy pokud je užitečný pro jiné výzkumníky. Práce publikovaná v elektronickém časopise jako e-Print získává stejný význam jako v odborném časopise v okamžiku, kdy je citována jinými autory. Dopad elektronického článku e-Print je tedy usměrněn počtem citací a těmi, kteří tyto citace uvedli.

Přestože proces výběru článků k publikování na e-Print serveru je značně zjednodušený, systém může pracovat bez odborné recenze. Odbornou recenzi zajišťuje samotné vědecké společenství. Autor článku sám musí usoudit, zda jeho práce je významná a sám musí rozhodnout, co bude publikovat. Každý výzkumník si jistě uvědomuje, že publikováním článku dává do hry své postavení a vědeckou prestiž. Vědecké společenství samo rozhodne, nakolik je práce autora článku významná a zda má smysl ji podporovat.

E-print servery jsou systémem, v němž lze určit zodpovědnost za každou publikovanou práci. Přímý přístup ke zdrojovým textům článků přitom není na závadu. Plagiátorství myšlenek nebo nějaká sabotáž (například záměna jména autora) se na e-print serverech nevyskytuje. Vědci si vyměňují své myšlenky prakticky nepřetržitě a důvěryhodnost autorů je tak zajištěna. V posledních letech roste počet významných vědců, kteří používají e-Print servery a dokonce se v pracích objevuje řada citací na články, které byly publikovány pouze na některém e-Print serveru.

Zajímavou otázkou samozřejmě je, jak zjistit důležitost nějakého článku na základě jeho citací. Autor článku [X1] je přesvědčen, že dobrou metodou je použít orientovaný graf. Můžeme si představit, že články A, B jsou reprezentovány uzly grafu. Uzel A bude spojen s uzlem B (A -> B), jestliže článek A cituje článek B. Uzlu B lze přiřadit určitou váhu, jako počet i_B spojení do uzlu B, tedy počet, kolikrát byl článek B citován. Přitom se vylučují citace stejným autorem nebo stejnou skupinou autorů, která článek publikovala. Tento graf může být částečně uspořádán použitím těchto vah. Nejmenší váha je nula a větší váha je nějaké přirozené číslo. Uzly A, B jsou spojeny, jestliže existuje nějaká cesta, která je spojuje (např. A -> Q -> J -> M -> B). Uzel C je podstatný, jestliže je vynuceným uzlem na cestě A -> B. Graf je souvislý, jestliže neobsahuje podstatné uzly, tedy graf neobsahuje články, které propojují izolované subjekty.

Použitím předchozího schématu souvislých grafů lze měřit přijetí a dopad e-Print článků. Použitím váhy i_x lze zhodnotit, zda články publikované na e-Print serverech dosahují úrovně článků publikovaných v odborných časopisech. Elektronická média na rozdíl od klasických odborných časopisů snadno umožňují vytvářet různé statistiky vědeckého publikování, jako je tomu na e-Print serveru Národní laboratoře v Los Alamos [X0].

Odkazy:

[X1]  Mauricio Ayala-Sánchez. Departamento de Matmáticas, Universidad de los Andes, Bogotá, Colombia. 21 Sep 2002. physics/0208068 e-Print archive. Los Alamos National Laboratory. US National Science Foundation.

[1] Paul Ginsparg: Winners and Losers in the Global Research Village. Invited contribution for Conference held at UNESCO HQ, Paris, 19-23 Feb 1996, during session Scientist's View of Electronic Publishing and Issues Raised, 21 Feb 1996.

[N1] Elektronické publikování ve vědě. Natura 1/2000