Molekulární biologie, 9
zpracoval: Jiří Svršek
12. Základní rysy genetického kódu
Insulin je hormon, který se tvoří ve slinivce břišní a reguluje hladinu krevního cukru. V roce 1953 se po dlouholeté práci podařilo Angličanu Fredericku Sangerovi objasnit chemickou strukturu insulinu. Nebylo sice možné ze Sangerova vzorce zjistit, jak insulin dokáže regulovat hladinu krevního cukru, ale výzkum molekulární biologie tím dosáhl významného pokroku. Insulin je poměrně malá bílkovinná molekula, která může sloužit jako model pro studium větších molekul. Je složena ze dvou polypeptidických řetězců, které dohromady mají 51 aminokyselin (viz příloha 11).
Obvykle mají bílkoviny sto až tři sta aminokyselin a proto je obtížné stanovovat jejich strukturu. Molekuly bílkovin se mohou skládat z jednoho nebo více polypeptidických řetězců. V polypeptidickém řetězci jsou aminokyseliny seřazeny v určitém sledu, který není podřízen žádnému jednoduchému pravidlu. Různé úseky jednoho řetězce nebo různé řetězce mohou být spojeny pomocí disulfidického můstku -S-S- molekul cysteinu, kdy dojde k odštěpení atomů vodíku v thiolové skupině -SH.
Jak se dovíme později, tvorba disulfidických můstků je reakce, která probíhá až po vlastní proteosyntéze. Podstatné pro proteosyntézu je zřejmě pouze to, které aminokyseliny budou vybrány a v jakém sledu budou spojeny do řetězce. Pokyn k tomu je obsažen v určitém úseku nukleové kyseliny a to v příslušném genu pro určitou bílkovinu. Nukleová kyselina používá kódu 4 bází, ale musí nést informaci pro řetězce o 20 různých aminokyselinách. Jde o obdobu Morseovy abecedy, která používá dva znaky (tečku a čárku) pro kódování všech písmen abecedy. V polovině padesátých let 20.století byla poprvé nadhozena otázka genetického kódu, otázka, podle jakého klíče se kód bází překládá na sled aminokyselin. Tento centrální problém molekulární biologie by bylo možno řešit, kdyby byl znám sled bází jednoho genu a současně sled aminokyselin příslušné bílkoviny. Tento případ by odpovídal slavné rosettské desce, na které byl týž text zapsán v řeckém a dvou egyptských písmech. Protože řecké písmo bylo známé, podle této desky bylo možné rozluštit staroegyptské hieroglyfy.
Metodika, kterou použil Sanger při rozřešení struktury insulinu, byla později použita k objasnění sledu aminokyselin v dalších bílkovinách. Příklady bílkovin, které mají sto až dvě stě aminokyselin, jsou enzymy ribonukleasa a lysozym, bílkovinné řetězce červeného krevního barviva hemoglobinu a obalová bílkovina viru tabákové mozaiky. První tři bílkoviny se nacházejí pouze v organismu savců. Bylo téměř beznadějné nalézt dědičné faktory jim odpovídající, protože buněčné jádro organismu savců obsahuje velké množství nukleových kyselin. Vědci proto vkládali naděje do viru tabákové mozaiky, protože jeho nukleová kyselina je poměrně malá a obsahuje malý počet dědičných faktorů. Dlouho však chyběly vhodné metody, které by postupně rozložily nukleovou kyselinu v charakteristické úseky a umožnily stanovit sled bází. Teprve později byly takové metody vypracovány, opět Frederickem Sangerem a jeho týmem. Až v letech 1971 a 1972 se podařilo stanovit celý sled bází určitého genu obalové bílkoviny jednoho bakteriofágu. Tehdy však šlo o prestižní otázku, komu se podaří rozřešit genetický kód. Vědci zvolili nepřímé cesty. Jejich soutěžení vyvrcholilo v letech 1960 až 1963.
Známý americký astrofyzik George Gamow byl již v roce 1954 podnícen zveřejněním Watson-Crickova modelu k tomu, že se snažil jasně formulovat problém genetického kódu a navrhnout jeho řešení. O informační RNA se tehdy ještě nic nevědělo. George Gamow si představoval, že aminokyseliny se budou řadit ve správném sledu na matrici DNA. Prostorový vzor válce DNA měl určit, které aminokyseliny se napojí na které místo. Tento vzor závisel na sledu bází v pramenech DNA. Formálně vedl tento návrh k silně se překrývajícímu kódu, tj. sousední skupiny bází, které tvoří záchytná místa pro sousedící aminokyseliny v bílkovině, by měly dvě báze společné. Jak sám Gamow rozpoznal, takový kód by neumožňoval, aby v bílkovinné molekule následovaly po sobě libovolné aminokyseliny.
Toto překrývání lze objasnit na příkladu řeči. Řekněme, že by v české spisovné řeči platilo pravidlo, že každé slovo musí začínat písmenem, kterým končilo předchozí slovo, např.: Jak kód dořešit teoretickým myšlením? Tímto způsobem napsat celý odstavec by bylo velice obtížné. Gamowův kód byl však omezen ještě mnohem více, neboť požadoval, aby na sebe navazující kódová slova se překrývala ve dvou znacích. Biochemici, kteří analyzovali sled aminokyselin v různých bílkovinách však zjistili, že takovéto omezení neexistuje. Ačkoliv byl první pokus o řešení kódu mylný, vedl ke správným úvahám.
Vyjdeme z biochemického zjištění, že bílkoviny nejsou tvořeny přímo na matrici DNA, ale na informační RNA. Informační RNA je posloupnost bází seskupených do slov a každé slovo by mělo kódovat jednu aminokyselinu.
Ze čtyř různých bází lze vytvořit pouze 4^2 = 16 různých dvojskupin (slov). Dva znaky (báze) tedy nejsou dostačující. Pokud ovšem vezmeme trojskupinu (triplet), dostaneme 4^3 = 64 možností, což je více než dostačující.
Crick a jeho spolupracovníci koncem 50.let 20.století navázali na Gamowovy snahy zjistit kód. Vyšli z předpokladu, že trojskupiny sousedních bází kódují jednu aminokyselinu. Pokud si představíme báze seřazené v řetězci, vnucuje se otázka, jakým způsobem buňka při čtení řetězce rozpozná, kde začíná trojskupina a kde končí. Jedna možnost by byla, že hranice mezi kódovými slovy (trojskupinami) jsou vyznačeny nějakým znakem. Crick a Brenner však hledali možnosti kódu bez tohoto znaku. Ve struktuře RNA totiž nebyl žádný záchytný bod pro takový znak. Oba vědci vypracovali schéma, podle něhož by byly akceptovány jen určité trojskupiny bází. Vyloučené trojskupiny byly složeny z bází povolených trojskupin. Např. pokud by AGA a ACC byly povolené, pak GAA a AAC by byly nepovolené, neboť obsahují kombinace bází v povolených trojskupinách. Čtecí mechanismus by pak snadno poznal, zda čte správnou nebo nesprávnou trojskupinu a kdyby četl nesprávnou trojskupinu, posunul by se o jednu nebo dvě báze. Použitím kombinatoriky se vypočetlo, že z původních 64 možných trojskupin je 20 trojskupin povolených a 44 zakázaných. Tento výsledek byl v souhlase s tím, že pro výstavbu bílkovin je použito právě 20 aminokyselin. Navíc tento kód nijak neomezoval sled aminokyselin. Přesto však tento kód nebyl experimentálně potvrzen.
Oba příklady teoretického řešení vedly k formulaci následujících otázek:
1. Následují kódovací slova v nukleové kyselině ve stejném sledu, jako aminokyseliny v příslušné bílkovině (tzv. podmínka kolinearity)?
Tato podmínka kolinearity se na první pohled jeví jako samozřejmá. Avšak v žádném případě není svázána se všemi mechanismy předpokladu a musí být experimentálně potvrzena.
2. Mají všechna kódovací slova stejnou délku? Určuje vždy stejný počet bází jednu aminokyselinu?
V případě Morseovy abecedy vidíme, že ani tato podmínka nemusí být samozřejmá. Pokud ovšem kódovací slova mají stejnou délku, musí mít nejméně tři báze.
3. Jaký je vzájemný vztah sousedících kódových slov? Jsou oddělena nějakým zvláštním znakem, jsou bezprostředně za sebou nebo se překrývají?
Z diskuse o Gamowově kódu víme, že "silně se překrývající" kód neodpovídá známým sledům aminokyselin v bílkovinách. Trojznakový kód se slabým překrýváním (jednoho znaku) však zamítnout zcela nelze.
4. Existuje pro jednu aminokyselinu více kódovacích slov nebo odpovídá jednomu kódovacímu slovu více aminokyselin nebo je vztah prostý?
První případ, kdy je více kódovacích slov pro jednu aminokyselinu, odpovídá tzv. degenerovanému kódu. Pokud uvážíme tripletový kód, je taková degenerace možná, protože máme k dispozici 64 kódovacích slov pro 20 aminokyselin. Případ kódu, kdy jednomu kódovému slovu odpovídá více aminokyselin je málo pravděpodobný z čistě biologického hlediska. Změna jedné aminokyseliny v bílkovině znamená ztrátu fyziologické funkce. Bylo by tedy nelogické, aby existoval precizní mechanismus pro předání přesného sledu bází při replikaci DNA a poté následovala volnost při sestavování bílkovin.
5. Existuje vůbec univerzální společný kód pro všechny organismy? Je genetický kód na naší planetě univerzální?
Opakem by bylo, kdyby určitá skupina bází nukleové kyseliny znamenala u kvasinek aminokyselinu cystein a u člověka glutamin. Téměř všichni badatetelé věřili nebo alespoň doufali v to, co vyjádřil francouzský molekulární biolog Monod slovy: "Co platí pro E.coli, platí i pro slony."
Přímá metoda, která by umožnila porovnat sled bází v nukleové kyselině se sledem aminokyselin v bílkovině, byla velmi obtížná. Jednou z nejdůležitějších a nejúspěšnějších metod se proto stalo vyvolávání mutací. Mutace, dědičné změny, musí spočívat na změnách v dědičném materiálu, tedy na změnách DNA. Pokud si představíme sled bází v nukleové kyselině jako řetězec písmen, která dávají určitý smysl, vidíme následující možnosti změny struktury tohoto řetězce:
1. | nukleotidický | původní informace, "divoký" typ |
2. | nukidický | výpadek úseku, tzv. delece |
3. | nukeotidický | výpadek jednoho znaku, bodová mutace |
4. | nukteotidický | záměna jednoho znaku, bodová mutace |
5. | nukleot. | chybná interpunkce, předčasné ukončení slova |
V posledním typu mutace samozřejmě musíme předpokládat, že v genetickém kódu skutečně existuje něco jako interpunkční znaménko. I když nemůžeme nukleové kyseliny analyzovat tak, abychom prokázali různé změny, lze stanovit typ mutace podle výsledků křížení a podle důsledků tohoto křížení na syntézu bílkovin.
Angličtí badatelé Brenner a Crick provedli dva významné pokusy, pomocí nichž se snažili zodpovědět otázku kolinearity kódu a délky kódovacího slova. V obou případech použili fág T4, který napadá baktérie E.coli. Tento fág patří k DNA virům, u kterých lze provádět pokusy křížení.
Na stavbě T-fágu nás zajímá především ta bílkovinná část, která zaujímá největší podíl ve fágové částici a je proto v infikované buňce produkována v největším množství. Jde o bílkovinu "hlavičky" fágu, tedy o membránu, která obaluje DNA fágu. Tuto obalovou bílkovinu budeme v našem textu označovat symbolicky, jako POLYPEPTIDICKÝ řetězec. Bylo zjištěno, že skutečně existují mutace interpunkčního znaku, které vedou k předčasnému přerušení syntézy tohoto polypeptidického řetězce, avšak jenom s použitím určitých kmenů E.coli jako hostitelů. Musíme tedy jednak rozlišovat mezi normální a mutovanou DNA fágů a jednak mezi variantami při mechanismu čtení v hostitelské buňce. Zatímco normální fág nemá žádné nároky na čtecí mechanismus buňky, je mutovaný fág odkázán na "přátelské" kmeny baktérií, pokud chce vytvořit potomstvo. V buňce "nepřátelského" kmene E.coli vznikne neúplná bílkovina a tento zlomek polypeptidického řetězce není schopen plnit svoji funkci při výstavbě buněčné stěny fága. Účinek mutace je tedy pro fágy smrtelný (letální) a k této situaci dojde, pokud je hostitelskou buňkou nepřátelský kmen E.coli.
přátelský kmen E. coli | nepřátelský kmen E. coli | |
divoký typ fágu | POLYPEPTIDICKÝ | POLYPEPTIDICKÝ |
mutovaný fág | POLYPEPTIDICKÝ | POLYPEP (neschopný života) |
Tento typ fágových mutant lze pěstovat pouze v buňkách přátelského kmene E.coli. Pokud chceme ověřit dědičný defekt, použijeme nepřátelského kmene E.coli.
Brenner a jeho spolupracovníci připravili velký počet mutant fágu T4. Během růstu fágů živili infikované baktérie chemicky pozměněnými stavebními složkami nukleových kyselin. Zabudování těchto stavebních složek vedlo k záměně bází ve fágové DNA a tím k bodovým mutacím. Poté začala namáhavá práce genetického mapování. Křížily se dva mutované fágy a stanovilo se s jakou četností vzniknou rekombinací fágy divokého typu. Podle toho bylo možno určit odstup mutací na DNA. K rekombinaci dojde o to častěji, čím více jsou od sebe vzdálena místa mutací. S tímto principem jsme se již seznámili při mapování chromosomů mouchy Drosophily. Fágový genetik však pracuje s rozlišovací schopností o řád vyšší než u Drosophily. U ní se mapovaly geny, kdežto u fágů lze mapovat mutační místa v rámci jednoho genu. V konečné fázi vede tato analýza k vytvoření genové mapy, na níž je znázorněn sled mutačních míst:
začátek 1 2 3 4 5 6 konec
--*-------*---*--------*---*-------*--*----------*----
Tento sled musí být srovnán s lineární strukturou výsledného polypeptidického řetězce. K tomuto účelu byla každá kultura E.coli nepřátelského kmene infikována mutantou fágu a nově vzniklé bílkoviny se označili přidáním radioaktivních aminokyselin. Místo kompletního polypeptidického řetězce byl u mutant syntetizován vždy jen jeho zlomek. Biochemickým i metodami bylo stanoveno, které části celkového řetězce byly v daném zlomku obsaženy. Schematicky byl získán výsledek:
začátek 1 2 3 4 5 6 konec
-----------*-----*-*---*---*-----*-*-----*----------------------
mutanta 1 P O L|
mutanta 2 P O L Y|
mutanta 3 P O L Y P E|
mutanta 4 P O L Y P E P T|
mutanta 5 P O L Y P E P T I D I|
mutanta 6 P O L Y P E P T I D I C|
divoký typ P O L Y P E P T I D I C K Ý|
Výsledek ukázal, že struktura genu a struktura bílkovinného řetězce jsou vzájemně kolineární. Pokud vezmeme jako příklad mutantu 3, získáme řetězec POLYPE. Nezískáme však např. dva řetězce POLYPE a DICKÝ. Z toho se vyvodilo, že v bakteriální buňce se čte sled bází od jednoho konce a vše, co se nachází za bodem ukončení se ignoruje. Z chemického hlediska začíná syntéza na tom konci řetězce, kde je volná aminoskupina a končí se na tom konci řetězce, kde je volná karboxylová skupina.
Jakmile bylo známo, že gen a polypeptidický řetězec jsou při kódování kolineární, hledala se hranice mezi kódovacími slovy. Předpokladem bylo, že všechna kódovací slova jsou stejně dlouhá.
V jednom z nejduchaplnějších pokusů molekulární biologie prokázali Crick, Brenner a Barnett, že se používá odpočítávacího tripletového kódu. Pokus byl postaven na abstraktním formalismu, v duchu Mendelovy tradice, s minimem fyzikálních nebo chemických měrných hodnot. Při objasnění pokusu lze opět využít analogie řeči. Šlo o fág T4 a jeho gen rII, který ovlivňuje vzhled plaků. Již při pohledu na Petriho misky poznáme, zda tento gen je funkční nebo defektní, tedy zda jde o fágy divokého typu nebo o mutanty rII. Báze v nukleové kyselině můžeme znázornit jako písmena, aminokyseliny jako slova se třemi písmeny (jedna aminokyselina je kódována třemi bázemi):
divoký typ: KDO ZNÁ KÓD PRO TEN GEN
Šťastnou náhodou molekulární biologové zjistili, že akridinová oranž je chemikálie, která vyvolává mutace (viz příloha 12). Tuto molekulu si lze představit jako plochý disk, který se vsunuje mezi báze dvoušroubovice DNA. Při replikaci DNA může vést přítomnost akridinové oranže ke dvěma typům poškození. Buď dojde ke ztrátě jednoho páru bází nebo je tam vsunut jeden pár bází navíc. Oba jevy musí mít značné důsledky, pokud platí odpočítávací kód:
ztráta báze: KDO ZNÁ KÓP ROT ENG ...
přidání báze: KDO ZNÁ OKÓ DPR OTE NGE ...
V obou případech následuje po chybném místě nesrozumitelná změť slov. Pokud však sjednotíme pozitivní a negativní chybné místo, věta se opět do určité míry upraví, ovšem za předpokladu, že obě místa leží dosti blízko u sebe (přidání znaku 'O' a ztráta znaku 'D'):
dvojnásobná vyrovnávací mutanta: KDO ZNÁ OKÓ PRO TEN GEN
Podle tohoto kompenzujícího chování mutant, které jednotlivě vedou k defektu, lze čistě biologickými metodami zařadit mutace do dvou tříd, plus a minus. Do jedné třídy patří mutanty, u kterých báze chybí, do druhé třídy mutanty, u kterých je báze přidána. Zatím však neexistuje žádná biochemická metoda, která by prokázala chybějící nebo přidanou bázi. Tato skutečnost však není znepokojující, protože myšlenkovým pochodem lze dojít k závěru i bez této znalosti. Zajímá nás, co se stane, když se v rII genu spojí dvě mutace stejné třídy, tedy v našem případě dvě písmena se přidají nebo vypadnou. Opět získáme nesrozumitelnou změť slov. Co se stane, když se přidají nebo vypadnou tři písmena (ztráta písmen 'Á','Ó','R')?
trojnásobná mutanta: KDO ZNK DPO TEN GEN
Vidíme, že se částečně smysl věty dostavil. Příčina je v tom, že při vypadnutí nebo přidání jednoho písmena jsou postižena všechna ostatní slova, protože se poruší rozdělení na slova, "čtecí rastr". Pokud vypadnou nebo se přidají tři znaky, čtecí rastr se zachová a dojde jen k místnímu poškození smyslu věty.
Pokusy jednoznačně prokázaly, že při akumulaci tří nebo šesti mutací v genu stejné třídy mohla být obnovena funkce bílkoviny divokého typu. Jiné počty mutací k obnově funkce nikdy nevedly.
Provedené pokusy sice nerozluštily ani jedno slovo genetického kódu, ale vedly k důležitým závěrům. Otázka, zda se slova kódu překrývají, nebyla experimentálně zodpovězena, ačkoliv se v uvedených příkladech předpokládalo, že se nepřekrývají. Odpověď na tuto otázku byla získána v klinické praxi. Srpkovitá anémie je lidská choroba a dispozice k této chorobě se dědí jako jednoduchý dědičný faktor podle Mendelových pravidel. V klinickém testu se prokázalo, že červené krvinky anemických pacientů se ohýbají do tvaru srpečku. Dochází k tomu v žilní krvi, kde je obsah kyslíku nízký. Při zvýšené nabídce kyslíku krvinky zaujmou opět normální kulatou formu. Podmínky v žilách působí zřejmě to, že deformované červené krvinky odumírají rychleji než krvinky normální, což vede k anémii. Samo srpkovité ztvarování krvinek je vyvoláno krystalizací hemoglobinu (viz příloha 6) v buňce. Musí tedy existovat nějaký rozdíl v hemoglobinu, který se dějí jako jednoduchý faktor. Elektroforéza hemoglobinu přinesla poznatek, že hemoglobin srpkovitých buněk putoval ke kladnému pólu pomaleji, než hemoglobin normálních buněk, což znamená, že molekula hemoglobinu musí mít menší negativní náboj. V polypeptidických řetězcích existují neutrální, kyselé (záporně nabité) a zásadité (kladně nabité) aminokyseliny. Záměna aminokyselin v řetězci může vést ke změně elektroforetického chování bílkoviny. Molekula hemoglobinu je složena ze čtyř polypeptidických řetězců, dvou řetězců alfa, dvou řetězců beta. Tyto řetězce byly proteolytickým enzymem trypsinem rozštěpeny na zlomky a testovalo se, zda nedošlo k záměně aminokyselin. Prokázalo se, že abnormální hemoglobin srpkovitých buněk má v poloze 6 řetězce beta valin místo kyseliny glutamové. Protože valin má neutrální náboj a kyselina glutamová záporný, vysvětlily se tím výsledky elektroforézy.
Abnormální hemoglobin musel kdysi vzniknout mutací a jeho nositelé mají malou změnu ve struktuře DNA. Z hlediska možného překrývání kódovacích slov nás zajímá, zda takové změny v DNA vedou vždy k záměně jedné aminokyseliny. Byla prozkoumána celá řada patologických hemoglobinů a hypotéza se potvrdila:
hemoglobin | |
normální | val his+ leu thr pro glu- glu- lys+ |
srpkovitých buněk S | val his+ leu thr pro val glu- lys+ |
hemoglobin C | val his+ leu thr pro lys+ glu- lys+ |
Hb G San José | val his+ leu thr pro glu- gly lys+ |
Situace byla ještě jasnější po prozkoumání mutant viru tabákové mozaiky. Badatelé Gierer a Mundry z Tubingen totiž zjistili, že ve zkumavce lze pomocí kyseliny dusité vyvolat chemické změny u bází vyčištěné RNA viru TMV, které se geneticky projevily jako mutace. Bylo možné vypěstovat virové potomstvo takto pozměněné RNA, virové částice vyčistit a studovat záměnu aminokyselin v obalové bílkovině. Tyto analýzy provedl Wittnan v Tubungen a dospěl k výsledku, že ve většině případů, kdy bylo možno vůbec prokázat změnu obalové bílkoviny, došlo k záměně jediné aminokyseliny. Méně častější byla záměna dvou aminokyselin, ale nikdy to nebyly dvě sousední aminokyseliny.
Ze všech těchto výsledků byl vyvozen závěr, že záměna jediné báze v nukleové kyselině vede k záměně jediné aminokyseliny v řetězci. Vzhledem k tomu by nebyl překrývající kód příliš pravděpodobný. Kdyby totiž jedna báze příslušela dvěma sousedním slovům kódu, museli bychom pozorovat současnou záměnu dvou sousedních aminokyselin vyvolanou jediným mutačním krokem. Přestože byl zpracován rozsáhlý materiál, nebyl tento jev nikdy pozorován.
Obecné základní rysy genetického kódu jsou tedy pevně stanoveny. Informace pro tvorbu bílkovin je uložena v nukleové kyselině ve sledu bází. Čte se z jednoho konce. Báze jsou odpočítávány od určitého startovního bodu a rozdělovány do tripletů. Jeden triplet kóduje jednu aminokyselinu. Triplety se vzájemně nepřekrývají, tedy sousední triplety nesdílejí žádnou bázi. Všechny tyto skutečnosti byly zjištěny bez biochemických analýz nukleových kyselin. Nyní nás tedy zajímá skutečná kódovací tabulka. Které triplety bází určují jednotlivé aminokyseliny?
13. Rozřešení genetického kódu
Snem molekulárních biologů je "systém in vitro", směs buněčných součástí a chemických látek, s nimiž lze uskutečnit životní pochody ve zkumavce. Často jsme hovořili o "čtecím mechanismu" buňky, který při syntéze bílkovin překládá sled bází v informační RNA, takže aminokyseliny jsou spojovány ve správném sledu v polypeptidické řetězce. Tento čtecí mechanismus bylo možno poznat blíže jen tak, že se vědci snažili jej izolovat z buněk a nechat pracovat ve zkumavce.
Kultivační médium, ve kterém jsme pěstovali buňky E.coli se odstředí a získá se ve formě bělavé pasty. Po přidání práškovitého oxidu hlinitého se směs rozetře ve třecí misce, přičemž oxid hlinitý mechanicky rozruší buněčné stěny a buněčný obsah přejde do přidaného solného roztoku. Při dalším odstředění se oxid hlinitý odstraní a rozbité buněčné stěny klesnou na dno kyvety. Supernatant je opaleskující tekutina, která obsahuje všechny rozpustné části E.coli. Opalescence je způsobena ribosomy, které jsou natolik velké, že rozptylují světlo. K takovému extraktu lze přidat radioaktivně značené aminokyseliny a sledovat jejich začlenění do polypeptidů. Nejdříve se extrakt nechá inkubovat asi půl hodiny při teplotě 37 stupňů Celsia. Potom se přidá k reakční směsi koncentrovaná kyselina, čímž se bílkoviny a nukleové kyseliny vysrážejí, kdežto malé molekuly, jako jsou aminokyseliny, zůstanou v roztoku. Pokud zjistíme radioaktivitu v sedimentu, signalizuje to, že se přidané aminokyseliny začlenily do polypeptidů. Při popsaném uspořádání pokusu se pozoruje jen zcela nepatrné zabudování radioaktivně značených aminokyselin. Proto lze systematicky zkoumat, které další látky jsou nutné při proteosyntéze ve zkumavce. Buněčný extrakt lze rozložit na součásti a do reakční směsi dát pouze ty, které jsou nutné. Tímto způsobem se získal seznam látek a částic, které se využívají při syntéze bílkovin:
1. roztok solí, obsahující ionty hořčíku
2. aminokyseliny
3. trifosfáty ATP a GTP jako zdroje energie
4. ribosomy
5. informační RNA
6. skupina transferových RNA
7. skupina enzymů, které aktivují aminokyseliny
V organelách ribosomech jsou aminokyseliny spojovány v polypeptidické řetězce. Ionty hořčíku jsou nezbytné k tomu, aby obě podjednotky ribosomu držely pohromadě. Guanosintrifosfát GTP je zdrojem energie při slučovací reakci. Přidaná RNA, např. z viru tabákové mozaiky, se naváže na ribosomy a účinkuje jako informační RNA. Vlastní informační RNA, která je přítomna při extrakci buněk, je rychle odbourána, takže syntéza vlastních bílkovin buňky ustane. Pokud přidáme enzym ribonukleasu, rozštěpí se téměř okamžitě informační RNA a proteosyntéza se zastaví. Jaký je však význam ATP, transferové RNA a aktivačních enzymů?
Objev informační RNA vedl ke zjištění, že k řazení aminokyselin nedochází přímo na genu, ale na jeho kopii, molekule RNA. Ikdyž přijmeme platnost tripletového kódu, narazíme na spoustu nesnází. Není jasné, jakým způsobem aminokyselina nalezne příslušný triplet bází, který je pro ni určen. Párování bází v DNA bylo objasněno vytvořením vodíkových můstků mezi atomy heterocyklů. Aminokyseliny však mají rozmanitou strukturu a bylo proto nemožné si představit, že by chemicky rozmanitá skupina aminokyselin měla nějaký přímý vztah k bázím nukleových kyselin. Francis Crick vyslovil názor, že prostorové těžkosti by se odstranily, pokud by v buňce existovaly "adaptorové molekuly", jejichž jeden konec by odpovídal kódovacímu slovu informační RNA a druhý konec by prostorově odpovídal příslušné aminokyselině. Tyto molekuly by pak sloužily pro přenos molekuly aminokyseliny k rostoucímu polypeptidickému řetězci. Po zapojení aminokyseliny do řetězce by byly opět k dispozici pro další molekulu.
Crickova hypotéza byla později biochemiky přesvědčivě potvrzena. Zjistilo se, že radioaktivně značené aminokyseliny se nezabudují přímo do bílkovin, ale nejprve se napojí na poměrně malé molekuly RNA. Protože tyto molekuly slouží pro přenos aminokyselin, byly označeny jako transferové ribonukleové kyseliny tRNA (viz příloha 5).
K napojení aminokyseliny na transferovou RNA je zapotřebí chemické energie, kterou dodá ATP. Ke každé aminokyselině náleží alespoň jeden vhodný typ transferové RNA, tedy existuje nejméně dvacet různých tRNA. Napojování aminokyselin na tRNA se uskutečňuje prostřednictvím enzymů, kterých musí být také nejméně dvacet. Tyto enzymy byly označeny jako aktivační enzymy (aktivace spočívá v tom, že způsobují, aby látky byly schopné reagovat).
Transferová RNA se připojí k ribosomu pouze tehdy, když na informační RNA se nachází příslušné kódovací slovo, tripletový kodon. Rozpoznání se děje prostřednictvím tripletu tRNA, který je komplementární kódovacímu slovu (antikodon). Aminokyselina je pak přenesena z tRNA na rostoucí polypeptidický řetězec, tRNA se uvolní a může se znovu použít. Američan Nirenberg a Němec Matthaei, kteří společně pracovali v Bethesdě v Marylandu (USA) zjistili, že přidání RNA viru TMV k extraktu E.coli mnohonásobně zvýší rychlost zabudování aminokyselin. Zřejmě tato RNA byla první přirozená informační RNA, která byla získána v čistém stavu z vyčištěných kompletních částic viru tabákové mozaiky. Ve zkumavce však nevznikla obalová bílkovina TMV. Nebyl znám ani sled bází této RNA, takže nebylo možno očekávat velké závěry.
Tehdy přišel vědcům vhod pokrok v biochemii nukleových kyselin. V pracovní skupině Ochoy v New Yorku byl objeven enzym, který uměl spojovat stavební složky RNA v řetězové molekuly bez matrice DNA. Z jakých bází byly tyto umělé RNA sestaveny záviselo jen na tom, jaké báze byly enzymu nabídnuty. Enzym byl schopen spojit do řetězce RNA např. pouze stavební složky U.
Význam tohoto enzymu v buňce nebyl tehdy vysvětlen, ale bylo možné ho využít pro tvorbu umělé RNA se známým sledem bází.
Nirenberg a Matthhaei získali od přátel RNA složenou pouze z báze U a zajímali se, zda extrakt z E.coli vytvoří odpovídající bílkovinný řetězec. Nabídli v bezbuněčném systému vždy devatenáct neoznačených aminokyselin a jednu radioaktivně označenou. Zjistili, že se do polypeptidického řetězce zabudoval fenylalanin a vznikl řetězec phe-phe-phe-...
Tato zpráva způsobila velkou senzaci na Mezinárodním biochemickém kongresu v Moskvě roku 1961, protože bylo odhaleno první slovo kódu. Triplet bází UUU kóduje aminokyselinu phe. Začal závod mezi pracovními skupinami Nierenberga v Bethesdě a Ochoy v New Yorku. Cílem bylo připravit co nejvíce různých druhů umělých informačních RNA, vsadit je do bezbuněčného systému a pozorovat, jaké aminokyseliny se vestavějí do polypeptidu. Brzy byly získány výsledky:
UUU fenylalanin
AAA lysin
CCC prolin
GGG nedošlo k vestavění aminokyseliny
Pokud informační RNA obsahovala náhodný sled 60% A a 40% C, vestavěly se aminokyseliny lysin, prolin, threonin, asparagin a histidin. Tyto aminokyseliny byly tedy kódovány triplety, které obsahují A a C nebo také jen A a C. Sled bází v kodonu se však touto metodou nepodařilo zjistit.
Indickému biochemikovu Khoranovi se na univerzitě ve Wisconsinu podařilo rozhodujícím způsobem zlepšit tuto metodu. Určitými dovednými postupy připravil RNA, které měly různé báze v předem určeném sledu, zatímco předtím se připravovaly pouze směsi bází s náhodnými sledy. Jako příklad lze uvést RNA se sledy bází A,G:
A-A-G-A-A-G-A-A-G-A-A-G
A-A-G lysin
---A-G-A arginin
-------G-A-A kyselina glutamová
A-G-A-G-A-G-A-G-A-G-A-G
A-G-A G-A-G arginin - kyselina glutamová
Z těchto výsledků bylo možno vyvodit již řadu důležitých výsledků. Prokázal se znovu odpočítávací tripletový kód. Jedna RNA vystavěná z trojskupin může vést ke třem různým polypeptidům podle tří možných čtecích rastrů (u přirozené RNA se ovšem použije pouze jeden čtecí rastr). U synteticky připravených RNA, u kterých se střídají dvě báze, nehraje čtecí rastr žádnou úlohu, protože se střídají dva triplety a dostaneme tomu odpovídající řetězec ze dvou aminokyselin. Z těchto údajů a z údajů, které byly získány s umělými informačními RNA s neuspořádaným sledem bází, vyplynuly pro uvedené sledy z A a G tyto triplety:
AAG lysin AGA arginin
GAA glutamová kyselina GAG glutamová kyselina
Je jasné, že kód je degenerovaný, neboť více tripletů může znamenat tutéž aminokyselinu. Současně poznáváme i významnou pravidelnost v degeneraci: triplety, které znamenají tutéž aminokyselinu, mají většinou identickou první a často i druhou polohu báze.
Jeden ze spolupracovníků Nirenberga přišel na to, že není nutné, aby proběhl celý proces proteosyntézy, když tripletům přiřazujeme aminokyseliny. Pokud se do systému místo informační RNA vloží pouze trinukleotidy, tedy úseky RNA, které obsahují právě tři báze, umístí se tyto nukleotidy na ribosomy a zprostředkují vazbu správné transferové RNA, na níž je napojena aminokyselina. Odpadne tak slučování, protože tři báze budou kódovat jedinou aminokyselinu. Zjištění genetického kódu je v tomto případě jednodušší, protože lze předem připravit nukleotidy se známým sledem bází. Vazební test pak lze provést rychle a jednoduše. Stačí jen reakční směs zfiltrovat přes membránu, která zadrží ribosomy se vším, co na nich pevně drží, zatímco nenavázané aminokyseliny filtrem projdou. Množství navázané aminonyseliny se zjistí měřením radioaktivity filtru.
Po objevení této techniky byl brzy celý genetický kód objasněn - viz příloha 13.
Objevila se však námitka, zda funkce genetického kódu ve zkumavce má vůbec nějakou souvislost k procesům v živé buňce. Výzkum vedl od biochemie zpět ke genetice. Průzkum mutant již dříve přinesl cenné informace o všeobecných principech genetického kódu. Spolu s biochemickými výsledky měl přispět k tomu, aby odstranil poslední pochybnosti o funkci kódu. Víme již, že mutace spočívají v záměně jedné báze v nukleové kyselině, což se v bílkovině projeví záměnou jedné aminokyseliny. Zatímco záměny bází v nukleových kyselinách jsou chemicky těžko zjistitelné, mohou být záměny aminokyselin dobře analyzovány rozvinutými metodami biochemie proteinů.
Podívejme se na varianty lidského hemoglobinu. Nevíme sice, kdy tyto mutanty vznikly, ale jejich vznik souvisí se záměnami určitých bází v nukleové kyselině. Kódovací slova dvou zaměněných aminokyselin by se měla lišit pouze v jediné bázi. Tento předpoklad byl potvrzen u některých variant hemoglobinu člověka, jak ukazuje následující tabulka.
normální hemoglobin GAA, GAG (kysl. glutamová)
hemoglobin S GUA, GUG (valin)
hemoglobin C AAA, AAG (lysin)
hemoglobin G GGA, GGG (glycin)
Ještě jasnějším příkladem platnosti genetického kódu pro živou buňku bylo studium viru tabákové mozaiky TMV. V roce 1958 učinil Gierer a Mundry z Tubingen důležitý objev. Na RNA viru TMV působili ve zkumavce kyselinou dusitou, pak tímto preparátem potřeli listy tabákových rostlin. Vzniklo mnoho různých genetických odchylek, mutací viru. Když byly jednotlivé mutanty izolovány ze směsi a rozmnoženy odděleně, vytvořily často zcela odlišné chorobné symptomy. Na tomto pokusu bylo nové to, že mutace byla vyvolána ve zkumavce u chemicky vyčištěného dědičného materiálu, RNA, a nikoliv v nepřehledných poměrech živé buňky. Vyplynulo také zcela jasně, na jaké chemické reakci spočívá vyvolání mutace. Kyselina dusitá odštěpuje z bází nukleových kyselin aminoskupiny, čímž cytosin se mění na uracil a z adeninu může přes meziprodukty vzniknout guanin. Libovolné záměny bází se mohou samozřejmě objevit v buňce při spontánních mutacích nebo chybou čtení. Kyselina dusitá je schopna působit pouze v jednom směru, tedy provádět přeměnu cytosinu na uracil a adeninu na guanin. Jediná záměna bází v RNA viru TMV, která obsahuje kolem 6000 bází, je chemicky nezjistitelná, ale může se projevit biologickým účinkem, který spočívá v záměně aminokyseliny v bílkovině. Ve vědecké skupině v Tubingen se Wittman pokusil vypátrat takovou záměnu aminokyselin v obalové bílkovině TMV. První případ byl následující:
CCC ---> UCC, CCU ---> UCU prolin --> serin
CCC ---> CUC, CCU ---> CUU prolin --> leucin
UCU ---> UUU, UCC ---> UUC serin --> fenylalanin
CUU ---> UUU, CUC ---> UUC leucin --> fenylalanin
záměny:
prolin ----> serin -----> fenylalanin
prolin ----> leucin -----> fenylalanin
Lidský hemoglobin a obalový protein viru tabákové mozaiky potvrdily výsledky získané v bezbuněčném systému E.coli. Podobně byl studován také bakteriální enzym syntetasa tryptofanu a jedna bílkovina fágu T4, syntetizovaná na matrici DNA. Opět pozorované záměny souhlasily s tabulkou genetického kódu. Všechny tyto pokusy prokázaly, že tabulka genetického kódu skutečně vystihuje funkci genetického kódu v živé buňce. Tento kód je přitom zcela univerzální.
Jaké kódovací slovo se použije v případě, že kódovací tabulka připouští více slov pro jednu aminokyselinu? Jak vypadají interpunkční znaménka genetického kódu?
K zodpovězení uvedených otázek dopomohli RNA-bakteriofágy. Až do roku 1960 se soudilo, že bakteriofágy vždy obsahují DNA a rostlinné viry obsahují vždy RNA. Vědělo se však již, že živočišné viry mohou obsahovat buď DNA nebo RNA. Mezitím bylo objeveno několik rostlinných virů, které obsahovaly DNA. Jakmile byl objasněn význam informační RNA, začalo plánovité hledání bakteriofágů s RNA. Molekulární biologie viru TMV sice byla již dalece rozpracována, ale mnohé pokusy ztroskotávaly na složitém a biochemicky těžko kontrolovatelném hostitelském organismu, tabákové rostlině. Z odpadů v New Yorku izoloval konečně jeden pracovník Rockfellerova ústavu první RNA-fágy.
Netrvalo dlouho a i jiní badatelé vylovili z vod Tokia, Heidelbergu nebo Mnichova rovněž RNA-fágy. Většina z nich měla podobnou strukturu: byly velmi malé, ne větší, než ribosomy, a jejich obalová bílkovina tvořila polyedrickou slupku.
Brzy se zjistilo, že RNA-fágy nemohou mít více než tři geny. Jeden gen tvořil obalový protein, druhý tvořil "napojovací protein" a třetí enzym replikasu. Tento enzym je odpovědný za RNA-dependentní syntézu RNA v buňkách E.coli infikovaných fágy, která neprobíhá ve zdravých buňkách. Obalová bílkovina je velmi malá a má jen 129 aminokyselin. Díky tomu byl brzy zjištěn sled aminokyselin této bílkoviny u mnoha RNA-fágů. Frederick Sanger, který se proslavil vyřešením struktury insulinu, vypracoval novou metodu pro analýzu sledu bází v molekulách RNA. Tato metoda však nebyla uzpůsobena pro řetězce RNA, které měly více než asi sto bází. Přesto se s její pomocí podařilo nalézt alespoň částečnou odpověď na uvedené otázky. Radioaktivně značená RNA fágu byla ve vhodném roztoku smíchána s ribosomy E.coli. Ribosomy rozpoznají začátky tří genů a upevní se na nich. Nyní se k roztoku přidá enzym ribonukleasa, který odštěpí všechny části RNA, které nejsou chráněny napojenými ribosomy. Tímto způsobem se radioaktivně značené začátky genů zachytí a tyto části RNA lze analyzovat příslušnými metodami. Byly nalezeny následující začátky genů u dvou RNA-fágů:
fág R 17 AGC AUG GCU UCU AAC UUU
Fmet ala ser asn phe
fág Qbeta AUC AUG GCA AAA UUA GAG
Fmet ala lys leu glu
První člen řetězce obou bílkovin je označen jako Fmet, což označuje formylmethionin. Jde o methionin, jehož aminoskupina je blokována zbytkem kyseliny mravenčí a pro tvorbu řetězce s jinými aminokyselinami zůstává volná pouze karboxylová skupina. Tato aminokyselina je používána v bakteriálních buňkách pro označení začátku polypeptidického řetězce. V hotové bílkovině nemá formylmethionin žádnou funkci a formylový zbytek nebo případně celý formylmethionin je později odštěpen enzymy. V našich příkladech je tato iniciační molekula kódována tripletem AUG, v jiných příkladech je kódována tripletem GUG. Oba triplety však v běžném řetězci označují methionin resp. valin. Proto musí být v informační RNA kromě tohoto tripletu ještě další informace, která signalizuje ribosomům, že jde o začátek řetězce. Jsou důkazy, že tato informace je dána již určitým stočením pramene RNA. Iniciační triplety se napojují na vrcholy smyček, aby mohly být snadno nalezeny ribosomy.
Závěrem je třeba říci, jakým způsobem je kódováno zakončení řetězce. Brenner a jeho kolegové zjistili, že k předčasnému ukončení syntézy řetězce vedou kódová slova UAG a UAA. Pro tato kódová slova nebyla v bezbuněčném systému nalezena žádná aminokyselina. Analýzy RNA-fágů prokázaly, že tyto triplety vyznačují konec polypeptidického řetězce. Univerzálnost kódů pro začátek a konec řetězce však zatím nebyla prokázána.
Sledovali jsme tok informací od genů k bílkovinám. Víme již, že sled bází v nukleové kyselině nese dědičnou informaci. Tato informace se z DNA přepisuje na molekulu informační RNA a transferové RNA umožňují zprostředkovat přenos aminokyselin pro tvorbu odpovídajícího polypeptidického řetězce. Vlastní proces překladu probíhá v ribosomech. Jak však z polypeptidického řetězce vzniká fyziologicky funkční bílkovina, která má obvykle sekundární (plošnou) nebo terciární (prostorovou) strukturu? Na tuto otázku může odpovědět fyzikální chemie a termodynamika.
- pokračování -
(c) 1997 Intellectronics