Elektronické publikování ve vědě v síti Internet se stalo středem zájmu řady pracovních skupin a konferencí, jichž se obvykle účastní představitelé odborných společností, organizací zabývajících se publikováním a také zástupců vědeckých knihoven. Obvykle ale stojí stranou zájmu vědeckých výzkumníků. Jde poněkud o ironii, protože běžný vědec je podstatou vědeckého publikování, jako čtenář, jako autor, často jako posuzovatel, často také jako vydavatel nebo organizátor konferencí a škol. Vědci často chápou vědecké publikování pouze ze své strany a často jsou znepokojeni tím, že se jim "ne-vědci" snaží vměšovat do jejich práce. Je samozřejmě jasné, že řada původních rolí vědecké publikování se elektronickým médiem posouvá a že se objevují role zcela nové.
V principu nové elektronické médium poskytuje jedinečnou příležitost
přehodnotit řadu aspektů současné vědecké komunikace. Vědci se mohou chopit
této příležitosti, aby se rozhodli pro ideální vědecké komunikační médium
v budoucnosti. Vědci přitom nesmí jen naslouchat, ale musí mít rozhodující
hlas, protože jsou jak tvůrci tak uživateli vědeckých informací. Je třeba
také překonat předsudek řady vědců, podle nichž elektronické médium je
pouze zbytečnou duplicitou k dosud používanému papírovému médiu.
První elektronické archivy "e-print archives" se objevily zhruba v polovině roku 1991. Podrobnější informace lze získat v článku P. Ginsparga "First Steps Towards Electronic Research Communication", Computers in Physics, Vol.8, No.4, Jul/Aug 1994, p. 390, původně článek ve Physics Today, June 1992. Později tento autor publikoval články v časopise Computer in Physics, Vol.10, No.1, Jan/Feb 1996, p. 6 a v časopise Science, Vol.271, 9 Feb 1996, p. 767.
První databáze vědeckých informací "Fyzika vysokých energií - teorie" (hep-th, High Energy Physics - Theory) vznikla v srpnu 1991 a byla určena pro malou skupinu asi 200 fyziků, kteří se zabývali tzv. "maticovým modelem" při studiu teorie superstringů a dvojrozměrné gravitace. Během několika měsíců ale původní archív hep-th začalo používat více než 1000 uživatelů a o několik let později více než 4000 uživatelů. Databáze se brzy rozšířila na řadu dalších oblastí fyziky a matematiky. Dnes tato databáze obsahuje vědecké články a přednášky více než 35 tisíc vědeckých pracovníků a výzkumníků a denně vybavuje více než 80 tisíc elektronických transakcí denně.
Elektronická databáze vědeckých publikací je umístěna na [X1] a obsahuje následující oblasti:
* Astrofyzika [astro-ph]
* Fyzika pevných látek [cond-mat]
(neuspořádané systémy a neuronové sítě; fyzika materiálů; mesoskopické
systémy a kvantový Hallův jev; řídká hmota;
statistická mechanika; silně korelované elektrony; supravodivost)
* Obecná teorie relativity a kvantová kosmologie [gr-qc]
* Fyzika vysokých energií - experiment [hep-ex]
* Fyzika vysokých energií - krystalové mřížky [hep-lat]
* Fyzika vysokých energií - fenomenologie [hep-ph]
* Fyzika vysokých energií - teorie [hep-th]
* Matematická fyzika [mat-ph]
* Jaderné experimenty [nucl-ex]
* Fyzika [physics]
(fyzika urychlovačů; atmosférická fyzika a fyzika oceánů; atomová fyzika;
atomové a molekulární shluky; biofyzika; chemická fyzika; klasická fyzika;
výpočetní fyzika; analýza dat, statistika a pravděpodobnost; fyzika kapalin;
obecná fyzika; geofyzika; historie fyziky; přístroje a detektory; lékařská
fyzika; optika; vzdělávání fyziky; fyzika a společnost; plasmová fyzika;
populární fyzika; fyzika kosmu)
* Kvantová fyzika [quant-ph]
* Matematika [math]
(algebraická geometrie; algebraická topologie; teorie kategorií; klasická
analýza; kombinatorika; komplexní proměnné; diferenciální geometrie; dynamické
systémy; funkcionální analýza; obecná topologie; geometrická topologie;
teorie grup; historie a přehled; teorie nekonečných grup; K-teorie a homologie;
lineární algebra; logika; matematická fyzika; metrická geometrie; teorie
čísel; numerická analýza; algebry operátorů; optimalizace a kontrola; teorie
pravděpodobnosti; kvantová algebra; teorie reprezentací; okruhy a algebry;
vědecké výpočty; spektrální teorie; symplektická geometrie)
* Adaptace, šum, samoorganizované systémy [adap-org]
* Chaotická dynamika [chao-dyn]
* Celulární automaty a krystalické plyny [comp-gas]
* Nelineární vědy [nlin-sys]
* Vznik obrazců a solitony [patt-sol]
* Přesně řešitelné a integrovatelné systémy [solv-int]
Všechny databáze na [X1] jsou plně automatizovány (včetně procesu zasílání článků a jejich indexování podle titulů, autorů a abstraktů) a umožňují přístup elektronickou poštou, anonymním FTP a prostřednictvím WWW stránek. Texty jsou dostupné obvykle ve zdrojovém tvaru textového procesoru TeX (také LaTeX nebo jiného klonu), ve formátu dvi (Device Independent) do něhož se překládá zdrojový text, ve formátu postskriptu a ve formátu pdf pro Acrobat Reader verze 3.xx a vyšší. Publikování vědeckých výsledků se tak dramaticky zrychlilo a vyřadil se celý proces distribuce kopií článků mezi vědeckými pracovišti. Výzkumníci navíc mohou vzájemně komunikovat a vytvářet virtuální konference. Publikování se zrychlilo a usnadnilo natolik, že této formě nemůže konkurovat žádné papírové médium.
V této souvislosti je třeba odlišit tuto formu komunikace od konferencí (newsgroups) v síti UseNet nebo od systémů "bulletin board". V elektronických tiskových archivech "e-print" výzkumníci komunikují výlučně prostřednictvím vědeckých abstraktů, které popisují vědecké články určené pro běžné publikování. Jde o velmi formální způsob komunikace, při němž každý záznam je archivován a indexován kvůli jeho udržování v databázi a je kdykoliv později dostupný. Konference (newsgroups) v síti UseNet a systémy typu "bulletin board" naopak představují informační způsob komunikace a podobají se mnohem více běžné komunikaci, kdy záznamy nejsou nijak indexovány a po určité době jsou smazány.
Výzkumníci zabývající se fyzikou vysokých energií udržují určitý postup pro publikování, kdy článek musí být publikován nejdříve v některém odborném časopise jako primárním komunikačním médiu. V ostatních výše zmíněných oblastech matematiky a fyziky se toto pravidlo striktně nedodržuje. To vede k velmi rychlému růstu počtu udržovaných vědeckých článků. Ekonomika je neúprosná a jednoznačně hovoří ve prospěch elektronického publikování. Pevný disk o velikosti jednoho gigabytu lze pořídit dnes za méně než 500 amerických dolarů a tento disk představuje asi 25 tisíc článků včetně obrázků. Při tomto poměru jde o náklady 2 centy na jeden článek. Konečně elektronické publikování má značný politický význam, protože elektronické archivy jsou volně dostupné. Odborníci střední a východní Evropy a rozvojových zemí se tak dostávají k informacím, které by byly pro ně jinak těžko dostupné. V některých zemích světa dokonce elektronické publikace jsou jedinou cestou, jak se k vědeckým informacím dostat, protože odborné časopisy jsou buď z finančních nebo z politických důvodů zcela nedostupné. Navíc vždy bude mnohem levnější zapojit výkonný počítač do sítě Internet než budovat knihovny a prodejny knih.
Systém konvenčních odborných časopisů je méně spravedlivý pro méně majetné vědce a zájemce o vědu. V České republice je cena zahraničních odborných časopisů tak vysoká, že si jejich nákup mohou dovolit jen vědecké instituce a několik jednotlivců. Situace není ani příznivá pro posluchače vysokých škol. Cena matematických nebo fyzikálních skript často přesahuje 100 Kč kvůli velmi nízkému nákladu a cena odborných publikací často přesahuje 200 Kč.
Pokud shrneme:
1. Exponenciální růst použití elektronických sítí je otevřen novým možnostem formální a informační komunikace vědecké komunity a odborné veřejnosti.
2. V některých oblastech fyziky se elektronické archivy již staly primárním způsobem komunikace a publikování vědeckých informací a prakticky nahradily konvenční odborné časopisy (journals). Dobrovolné zasílání a využívání těchto systémů rychle roste. Současná úroveň technologie a konektivity sítí odpovídá podpoře těchto systémů. V budoucnosti zřejmě bude nutné vybudovat nové transkontinentální sítě, které svojí kapacitou umožní současný prudký růst neakademických uživatelů. V opačném případě bude vědecké využití elektronických archivů vyžadovat určité prioritní směrování na sdílené síti nebo dokonce nezávislé sítě.
3. V některých oblastech fyziky otevřená distribuce vědeckých článků
poskytuje výhody jak vědcům ve vyspělých tak v rozvojových zemích.
Před tím, než budeme v úvahách pokračovat, je nutné rozlišit dva velmi rozdílné způsoby publikování, které dříve byly sdruženy pohromadě díky způsobům jejich výroby a distribuce. Pochopení tohoto rozdílu je pro úsilí v oblasti vědeckého publikování zcela klíčové.
Při vědeckém publikování ("esoterickém vědeckém publikování") se snažíme předávat vědecké informace a upevnit naši vědeckou reputaci. Nepublikujeme proto, abychom vydělali peníze ve formě autorského honoráře, který vychází z výše příspěvků čtenářů. Snažíme se o maximální rozšíření naší práce (samozřejmě s naším souhlasem) a bojujeme proti pokusům potlačit toto rozšíření. Na druhé straně při komerčním publikování autor píše články knihy především proto, aby získal přímé finanční zhodnocení. Samozřejmě usiluje o maximální rozšíření své práce, ale současně požaduje, aby každý čtenář za přečtení práce zaplatil. K tomu mu slouží vydavatel, který prostřednictvím distributorů práci prodává.
Pokud vědecký pracovník nepíše své články kvůli tomu, aby bezprostředně
získal peníze za jejich přečtení, pak by také nikdo jiný neměl vydělávat
peníze na přípravě článku k publikování (samozřejmě by se měla vrátit hodnota
jeho práce). V době, kdy jediným médiem pro publikování vědeckých článků
byly odborné časopisy, byly náklady tak vysoké, že každý čtenář musel nutně
za přečtení článků zaplatit.
Obvykle se tvrdí, že odborné časopisy (journals) sehrávají dvojí intelektuální roli: umožňují šíření vědeckých informací a hodnotí kvalitu vědeckých informací pro účely ohodnocení vědecké práce a poskytnutí grantu. Publikování článku v určitém časopise se stalo věcí vědecké prestiže, která se pak zhodnocovala ve finančním ohodnocení vědecké práce.
Kvalita vědecké práce zejména ve fyzice se obvykle hodnotí podle počtu publikovaných článků v odborných časopisech a podle počtu citací určitého publikovaného článku. Odborné časopisy mají přitom různou "váhu" kvality díky své redakční radě, která odmítá publikovat nekvalitní nebo irelevantní články. Redakční rady si obvykle nechávají vypracovat na zaslané články odborný posudek od několika anonymních a nezávislých odborníků. O kvalitě článku obvykle vypovídají doporučující dopisy několika odborníků v dané oblasti.
Určité fyzikální časopisy již při posuzování kvality článku nehrají
žádnou roli. Jejich smyslem je poskytovat informace o vývoji určité vědecké
oblasti.
Můžeme si položit otázku, jak systém, jehož prvotní účel je udržovat vědecké články, může nahradit odborné časopisy, které jsou zdrojem věrohodných informací v určité vědecké oblasti. Elektronické archivy technologicky umožňují autorům publikovat články bez zásahu vydavatele.
Elektronický archiv, který je užíván naprosto volně, může v případě nepochopení jeho vlastností a možností, může způsobit řadu problémů. Příkladem byla elektronická verze časopisu Physical Review Letters Americké fyzikální společnosti. Objevil se problém, zda elektronická verze je identická se svou tištěnou verzí. Proto byl elektronicky publikován každý zbytečný text z papírové verze časopisu. Přechod z papírové na elektronickou verzi časopisu musí vést ke změně struktury a organizace časopisu s využitím všech výhod elektronického formátu. Potřebujeme ještě v době, kdy se zdokonalují technologie elektronické komunikace, papírový odborný časopis se svým drastickým omezením počtu stran a atavistickými požadavky na rychlost publikování? Čtenáři fyzikální literatury dobře vědí, že tato omezení většinou vedou k telegraficky omezeným článkům, které mají význam výlučně pro odborníky v oboru a nikoliv pro širokou odbornou veřejnost.
Nejen ve fyzice, ale snad ve všech oblastech vědy lze dnes pozorovat rostoucí frustraci z pomalosti existujících vydavatelů odborných časopisů. Vědci docházejí k poznání, že elektronické publikování jim dává nové a tvůrčí možnosti. Vydavatelé odborných časopisů kvalitu svých časopisů hodnotí podle počtu publikovaných článků, ale jsou omezeni počtem stran. "Užitečnost", "čitelnost", "nové myšlenky" nejsou nezbytně prvotním kritériem.
Dokonce neziskové organizace a učené společnosti se snadno mohou stát
obětí výhod vědeckého publikování a mohou ztratit svůj původní význam.
Může u nich převážit zajišťování publikování nad potřebami poskytovat tvořivé
intelektuální služby svým členům. Ještě donedávna fyzikové neměli možnost
rozetnout uzavřený kruh vydavatelů a knihovních systémů. Prostředky nezbytné
pro tvorbu a distribuci běžných tištěných časopisů umožňovaly vydavatelům
soustředit se na pouze mechanismy produkce a vyhnout se tlaku na přepracování
intelektuálního obsahu a kvality časopisů.
Jak bylo zmíněno, přechod z papírové na elektronickou formu časopisu bude vyžadovat hlubší promyšlení nových možností.
Nejtíživějším problémem současného schématu publikování je stále rostoucí počet vědců v dané oblasti. Počet odborných článků začíná překračovat fyzické možnosti vědců tyto články sledovat. Skončila doba, kdy fyzik mohl studovat každý měsíc svůj odborný časopis a jen čas od času se podívat, co se děje v ostatních oblastech. Tento idylický stav ještě je v paměti mnoha vědců současné generace. Přesto tato překonaná metoda dosud přetrvává v řadě aspektů současné vědy.
Odborné časopisy dnes již nejsou spolehlivým vodítkem. Čtenář je nucen sám provádět výběr článků pomocí dodatečných kritérií. Jeho základní potřebou je mít co nejrychlejší přístup k potřebným informacím. Proto počátkem 70. let 20. století byl vybudován systém přetiskování článků z fyziky vysokých energií, který potlačil roli konvenčních časopisů. Silný důraz na rychlý přístup pomocí omezujícího filtrování informací čtenářem vedl k prudkému rozvoji elektronických archivů počátkem 90. let 20. století. Tyto archivy brzy nahradily v řadě oblastí konvenční archivní roli odborných časopisů.
Nejvážnějším problémem výběru informací čtenářem je fakt, že značné množství informací se běžným procesem výběru ztratí, pokud čtenář používá jednoprůchodový výběr typu všechno nebo nic. Samozřejmě tento způsob je pro hodnocení výzkumu nebo pro poskytnutí grantu často vyhovující, ale průměrnému čtenáři příliš nepřináší.
V elektronickém prostředí lze snadno implementovat řadu jednoduchých zdokonalení. Neexistují žádné finanční nebo fyzické bariéry širokému rozšíření. Můžeme si představit relativně úplný archiv neznehodnocený nezbytnými prodlevami v dostupnosti. Každý typ informace může být udržován jiným týmem. Archiv lze efektivně rozdělit do sekcí, které jsou řazeny podle rostoucí důležitosti, kvality výzkumu nebo podle jiných užitečných kritérií. Práce lze různě přesouvat podle později doplněných informací nebo podle následného výzkumu. Na rozdíl od neroztříděných článků průměrný čtenář může využít různých kritérií, jako je "základní články" daného tématu za určité dané období. K článkům lze popisující informace doplňovat zpětně, např. "článek vychází z článků a,b,c a vedl k novým článkům x,y,z". Tím čtenář získá lepší orientaci v celé problematice. Začínající čtenář může v dané problematice postupovat od základních článků k článkům rozšiřujícím nebo speciálním. Stejným způsobem lze seřadit doplňky nebo opravy. Články lze seřadit podle významu a čtenář může přeskočit články speciální nebo ležící mimo hlavní téma. Literatura nemusí být vztažena jen k určitému datu, ale může se dále rozšiřovat tak, jak výzkum v dané oblasti pokračuje.
Lze uspořádat také interdisciplinární výzkum (např. pokud se částicový
fyzik zajímá o současnou literaturu o biofyzice nebo dokonce o biochemii)
tak, že čtenář se rychle zorientuje a získá pedagogicky uspořádaný materiál.
Dalšími možnostmi jsou např. moderované komentáře, které lze připojit k
určitým částem článku nebo různé doplňky tak, jak se výzkum vyvíjel daným
směrem.
Zůstane nadšené využití volného přístupu k elektronickým archivům vědeckých článků omezeno jen na izolované skupiny vědeckého společenství? Nemá smysl spekulovat o povaze těchto skupin vědců, ale spíše se zaměřit na budoucí vývoj konvenčního publikování vědeckých článků. Nelze se opírat jen o zkušenosti odborníků, kteří dávají přednost elektronické publikování pomocí standardního textového procesoru a využívají rozumným způsobem své počítačové gramotnosti pro šíření vědeckých informací. Především je třeba poukázat na to, že například ve fyzice společenství autorů a čtenářů článků se vzájemně překrývají.
Vědecké komunity většinou představují relativně malý počet autorů a
mnohem větší počet čtenářů. Tyto komunity dávají přednost zcela odlišnému
modelu publikování pomocí institucí, které chrání autorská práva autorů
článků a šíří časopisy za poplatek těm institucím, které jsou ochotny zaplatit.
Volné elektronické publikování by celý systém od základů změnilo. Ohrozilo
by především instituce, které podporují výzkum investicemi do platů a laboratorního
a vědeckého zařízení. Tyto instituce mají zisk především z ochrany produktů
těchto investic. Současný systém vědeckého publikování v odborných časopisech
zajišťuje autorům plnou ochranu autorských práv a vydavatelům časopisů
vysokou kvalitu obsahu. Časopisy se prodávají za částky, které pokrývají
náklady na výrobu časopisu a na odměny autorům. Je tedy zřejmé, že tito
vydavatelé se budou bránit volnému šíření vědeckých článků. Elektronické
publikování je zde jen doplňkovou formou papírové formy. Přístup k elektronické
formě je omezen a chráněn přístupovými hesly a kódy, které čtenář získá
až po registraci a zaplacení ročního poplatku za časopis. Takto postupuje
americký časopis Science a časopis Science Now [X2].
Cena elektronické formy je pochopitelně nižší než cena formy papírové.
Konvenční vydavatelé odborných časopisů obvykle vyjadřují svoji bezmeznou podporu systému otevřeného šíření informací navzdory jejich možnému ohrožení. Tvrdí, že jejich jediným cílem je šíření vědeckých informací a že nikdy nebudou toto šíření potlačovat.
Hlavním hlediskem ale jsou peníze. Knihovny, které prodávají odborné časopisy jsou na zisku z předplatného závislé. Knihovny mohou brzy zjistit, že fyzikové již mají alternativní zdroj informací z globální elektronické databáze a fyzikové pochopí, že jejich odborné časopisy zaniknou. K této situaci již došlo např. v Indii, kde omezené finanční zdroje nestačily pokrýt náklady na produkci a šíření odborných časopisů.
Fyzikální a matematické elektronické archivy dnes nabízejí široký výběr vysoce kvalitních výstupních formátů (zdrojové texty TeX, LaTeX a dalších klonů, hyperdvi, hyperPostScript s různým rozlišením fontů, pdf pro Adobe Acrobat Reader atd.) a budou schopny podporovat ještě dokonalejší formáty výstupu, jakmile se objeví. Koncový uživatel těchto archivů je schopen odborný text ihned po přenesení na svůj počítač číst a tisknout. Další vývoj se zaměřil na robustní globální zrcadlový systém a na lepší zpracování indexování informací. Další zrcadlové systémy a proxy cache servery zajišťují kratší přístupové časy. O elektronické archivy vědeckých informací má stále vzrůstající zájem také neakademická veřejnost, která nemá finanční prostředky na získání klasických odborných časopisů. Byl vybudován globální záložní systém, který zajišťuje provoz v případě havárie databáze nebo při ztrátě síťové konektivity. Problém indexování a umísťování informací do kategorií v principu souvisí se zájmem knihoven a vědeckých společenství. Jejich zájem je zatím kuriózně malý. Různé amatérské pokusy o násilné vytvoření indexování mohou celý projekt ohrozit. Otázkou proto zůstává, zda vědci a neakademická veřejnost v 21. století budou schopni tyto informace efektivně využívat.
Je třeba také upozornit na závažný problém formátů, v nichž jsou dnes články v elektronickém archivu udržovány. Papírový formát časopisů v knihovnách bude schopen přežít století, jak nám dokazují knihy ze středověku. Navíc časopisy jsou uchovávány v řadě knihoven, takže nehrozí jejich zničení. Žádný elektronický formát nemá podobnou životnost již z prostého důvodu, že žádný takový formát nepřežije více než deset let. V současné době se používají formáty TeX, PostScript, pdf, Microsoft Word a žádné jiné formáty zatím neexistují. Tato situace se ale může během několika let dramaticky změnit a vznikne problém z převodem článků do nových formátů. Lze jen doufat, že věda učiní podobné kroky pro záchranu svých znalostí jako učinila v případě záchrany papírových materiálů před zničením kyselým prostředím, když tyto materiály byly převedeny na mikrofilmy. Zřejmě s vývojem nových formátů budou vyvinuty také automatické převodní programy, které během určité dostatečně krátké doby převedou všechny elektronické texty do nových formátů.
Jednou z možností, jak předejít případné nevratné ztrátě informací v elektronických archivech, je vytvořit konsorcium profesionálních společností a odborných knihoven, které bude technicky schopno zajistit sponzorování globálního vědeckého archivu. Neziskové společnosti mohou pokračovat v organizování vysoce kvalitních vyhledávacích služeb. Komerční vydavatelé budou soutěžit na mnohem realističtějším trhu.
Je obtížné si jen představit, že současný model publikování a udržování vědeckých informacích v odborných knihovnách může přetrvat. Papírové médium se obtížně vyrábí, obtížně se šíří, obtížně se archivuje a obtížně se kopíruje. Papírové médium nutně vyžaduje řadu distribučních míst v podobě odborných knihoven. Elektronické médium nemá žádnou z výše uvedených vlastností a ve srovnání s papírovým médiem je výrazně levnější. Role současných vydavatelů a distributorů bude automatizována. Zůstane však role organizací intelektuálního vlastnictví, které nelze automatizovat z principu a které budou reagovat na potřeby výzkumníků.
Literatura:
[1] P. Ginsparg: Winners and Losers in the Global Research Village. Invited contribution for Conference held at UNESCO HQ, Paris, 19-23 Feb 1996, during session Scientist's View of Electronic Publishing and Issues Raised, 21 Feb 1996.
[X1] e-print archive, Los Alamos National Laboratory.
[X2] Science. The American Association for the Advancement of Science.