Реферат: Відкриття та характеристика генетичного коду
Триплетність - кожна амінокислота кодується послідовністю із трьох нуклеотидів - триплетом або кодоном (серед 64 кодонів 61 - змістовний і 3 незмістовні кодони - УАА, УГА та УАГ).
Специфічність - один кодон відповідає лише одній амінокислоті.
Виродженість (надлишковість) - одній амінокислоті відповідають кілька кодонів (наприклад серину чи лейцину відповідають 6 кодонів, метионіну - всього 1).
Колінеарність - послідовність нуклеотидів в молекулі і-РНК точно відповідає амінокислотній послідовності у поліпептидному ланцюгу.
Односпрямованість - зчитування інформації в процесі транскрипції і трансляції відбувається лише в напрямку 5' - 3' кінець.
Неперекриваємість - останній нуклеотид попереднього кодону не належить наступному триплету.
Безперервність - між триплетними „словами” відсутні „розділові знаки".
Універсальність - в усіх організмах одні і ті самі амінокислоти кодуються одними і тими ж нуклеотидами (проте така властивість характерна лише для ядерного генетичного коду; мітохондріальний генетичний код має деякі відмінності від ядерного).
Варіанти генетичного коду
Більшість організмів переважно користуються одним варіантом коду, так званим "стандартним кодом" [4], проте це не завжди є правилом. Перший приклад відхилення від стандартного генетичного коду був відкритий в 1979 році при дослідженні генів мітохондрій людини. З того часу було знайдено декілька подібних варіантів [5] including various alternative mitochondrial codes, [6], наприклад, прочитування стоп-кодону стандартного коду UGA як кодону, що визначає триптофан у мікоплазм. У бактерій і архей GUG і UUG часто використовуються як стартові кодони. В деяких випадках гени починають кодувати білок із старт-кодона, який відрізняється від зазвичай використовуваного даним видом [4]. У деяких білках нестандартні амінокислоти, такі як селенцистеин і пірролізін вставляються рибосомою, під час считування стоп-кодону за умовами наявності певних послідовностей в мРНК після кодону. Селенцистеїн часто розглядається як 21-а, а пірролізін 22-й амінокислоти, що входять до складу білків. Незважаючи на ці виключення, у усіх живих організмів генетичний код має загальні риси: кодон складаються з трьох нуклеотидів, де два перших є визначальний, кодони транслюються тРНК і рибосомами в послідовність амінокислот. Відхилення від стандартного генетичного коду [5] [6].
Таблиця прикладів варіантів генетичного коду
Приклад | Кодон | Звичайне значення | Читається як: |
Деякі види дріжджів роду Candida | CUG | Лейцин | Серин |
Мітохондрії, в тому числі і Saccharomyces cerevisiae | CU (U, C, A, G) | Лейцин | Серин |
Мітохондрії вищих рослин | CGG | Аргінін | Триптофан |
Мітохондріїї (у всіх без виключення организмів, що досліджувалися) | UGA | Стоп | Триптофан |
Мітохондірії ссавців, дрозофіли, S. cerevisiae і багатьох найпростіших | AUA | Ізолейцин | Метіонин = Старт |
Прокаріоти | GUG | Валин | Старт |
Еукаріоти (рідко) | CUG | Лейцин | Старт |
Еукаріоти (рідко) | GUG | Валін | Старт |
Прокаріоти (рідко) | UUG | Лейцин | Старт |
Еукаріоти (рідко) | ACG | Треонін | Старт |
Мітохондрії ссавців | AGC, AGU | Серин | Стоп |
Мітохондрії дрозофіли | AGA | Аргінін | Стоп |
Мітохондрії ссавців | AG (A, G) | Аргінін | Стоп |
Генетичний код як система
''Найважчим в проблемі коду було зрозуміти, що код існує. На це знадобилося ціле століття. Коли це зрозуміли, то для того, щоб розібратися в деталях, вистачило які-небудь десять року'' [8].
Проблема генетичного коду - це ключова проблема. У кінці 50-х - початку 60-х років вона приковувала до себе увагу, збуджувала активність умів, спонукала віру у велич і мудрість загадок науки. У широкому сенсі генетичний код - це спосіб запису генетичної інформації в послідовностях нуклеїнових кислот (ДНК або РНК) про структуру поліпептидів (білків). У конкретному сенсі генетичний код - ця відповідність між триплетними кодонами матричної РНК (М-РНК) і амінокислотами кодованого білку, що задається кодовою таблицею.
Розвиток проблеми генетичного коду пройшов в декілька етапів. Предтечами цієї проблеми можна вважати багатьох видатних дослідників. Зокрема, Н.К. Кольцов (1927, 1935) запропонував в загальній формі ідею молекули-гена і матричний принцип її дублювання. Э. Шредингер (1944) явно сформулював необхідність кодування генетичної інформації в структурі генів-молекул.П. Колдуэлл і С. Хиншельвуд (1950) запропонували ідею матричного синтезу білків на ДНК.А. Даунс (1952) сформулював гіпотезу про синтез білків на РНК.
Наукові уявлення про генетичний код як про реальну проблему експерименту і теорії були сформульовані Г.А. Гамовым відразу ж після обгрунтування Дж. Уотсоном і Ф. Криком (1953) моделі будови подвійної спіралі ДНК. Перший етап вивчення проблеми (1953-1961) можна назвати гіпотетичним. З моделі Уотсона-Крика [8] витікало уявлення про лінійну послідовність ДНК - текст, побудований з чотирьох типів нуклеотидів (A, T, G і C - чотири символи алфавіту (або A, Г, Ц і Т)). Але кодовані білки теж мають лінійну первинну структуру - текст, побудований з 20 типів канонічних амінокислот (алфавіт з 20 символів). Тому Г.А. Гамору (1954) відразу ж сформулював ідею генетичного коду в конкретному сенсі - як відповідність двох текстів, записаних за допомогою двох різних алфавітів. Крім того, він запропонував використовувати технічні засоби криптографії (розшифровки невідомих кодів) для вирішення центральної проблеми генетики.
Генетичний код відразу ж придбав вигляд великої загадки природи, ребусу для дотепних. Багато сотень математиків, фізиків, хіміків, біологів, включаючи Г.А. Гамова, Ф. Крику та ін., запропонували гіпотетичні варіанти генетичного коду, які представляють тепер лише історичний інтерес. Реальний код виявився зовсім іншим.
Науковими результатами першого етапу можна вважати [8]:
1) постановку проблеми генетичного коду;
2) формування понять лінійного тексту, алфавіту для нуклеїнових кислот і білків, генетичної інформації, записаної в цих текстах за допомогою символів алфавіту;
3) уявлення про матричну роль РНК в трансляції;
4) поняття про кодони і доказ їх неперекривання;
5) припущення про триплетности кодонів і колінеарності гена і білку, доведене лише надалі, і так далі.
Другий етап (1961-1966) можна назвати експериментальним, оскільки в цей період генетичний код був розшифрований в прямому експерименті [8-11]. У 1961 році Ф. Крик із співробітниками в блискучій роботі показали, що: а) кодони триплетны; б) між ними немає розділових знаків (''ком''); в) гени, що кодують структуру білків (цистроны), мають фіксований початок, орієнтований напрям і фіксований кінець; г) існує невелике число некодуючих триплетів (''нонсенсу'', безглуздих кодонів), а код в цілому сильно вироджений. У 1964 році Ч. Янофски із співробітниками і С. Бреннер із співробітниками показали, що ген і кодований ним білок взаємно коллініарні, тобто є послідовна відповідність між кодонами гена і амінокислотами білка.
Пряма розшифровка генетичного коду in vitro виявилася можливою завдяки техніці білкового синтезу в безклітинних системах [8-10], тобто в клітинних екстрактах, що містять усі необхідні компоненти апарату трансляції (Т-РНК, рибосоми, амінокислоти, ферменти, джерело енергії і так далі), окрім М-РНК. Вводячи в такі системи природні М-РНК або штучні невеликі олигорибонуклеотиды, можна було вивчати специфічність включення мічених амінокислот в поліпептиди, що будуються. М. Ниренберг і Ф. Ледер подавали в безклітинну систему трансляції E. coli різні олигорибонуклеотиды і показали, що індивідуальні фракції тририбонуклеотидов, що асоціюються з рибосомами, зв'язують певні фракції Т-РНК, заряджені певними міченими амінокислотами. За допомогою такого методу генетичний код був розшифрований повністю. Влітку 1966 року на симпозіумі по кількісній біології в Колд-Спринг-Харборе (США) усі отримані дані були зведені Ф. Криком воєдино [9]. Розшифрований генетичний код E. coli, досліджений in vitro, повністю узгоджувався також з іншими незалежними даними, отриманими in vivo і для інших видів. Цей вивід підтверджується також результатами секвенування останніх років, коли знайдено, що тисячі генів і кодованих ними білків дійсно відповідають один одному за правилами генетичного коду.
З 64 можливих триплетів 61 є смисловим кодоном, тобто кодує амінокислоти. Усі кодони триплетні, нерозривні і не перекриваються в тексті, а також не розділені межкодонними знаками (комами). Усі кодони однозначні, тобто кожен кодує єдину амінокислоту. Інакше кажучи, в напрямі кодон - амінокислота генетичний код однозначний.
Зворотна відповідність в напрямі амінокислота - кодон неоднозначно, і ця властивість називається вирожденістю. Окремі амінокислоти кодуються групами (серіями) кодонів-синонімів. 18 серій з 20 містять від двох до шести кодонів, дві серії (Met і Trp) не вироджено, містять по одному кодону. Середня виродженість генетичного коду приблизно три кодони на серію.
Виродженість називається систематичною, якщо кодони-синоніми розрізняються в третій позиції або пуринами (R = A або G), або пиримидинами (Y = U або C), або взагалі будь-якими з чотирьох нуклеотидів (N = A, G, U або C). Цим принципам задовольняють 30 пар кодонів з 32, а також вісім тетрад з 16. Усі ці пари зв'язні, а тетради полнозв'язні. Інші варіанти виродженості називають несистематичними. Вони відносяться до великих серій: Leu і Arg - зв'язні серії, Ser - незв'язна серія, Ile - три кодони, повнозв'язна серія.
Генетичний код містить також знаки пунктуації (початку і кінця) трансляції. Кодони AUG, GUG і UUG у прокариот окрім кодування амінокислот кодують також ініціацію трансляції. Проте однозначність кодування при цьому не порушується, оскільки знаки, що ініціюють, локалізовані в певному оточенні (контексті), здатному утворювати самокомплементарні ''шпильки''. У еукаріот ініціюють триплети AUG і слабіше, - UUG, AUA і ACG. Три ''вакантні'' триплети у E. coli - UAA (ochre), UAG (amber) і UGA (opal) - не кодують амінокислот, а виконують роль термінальних знаків трансляції (стоп-кодонів, нонсенс-кодонов або термінального нонсенсу). У нормі ними закінчуються усі цистрони, тобто трансльовані гени, одиниці трансляції. Мутаційне виникнення нонсенсу усередині гена призводить до передчасної термінації трансляції і обриву білку. Нонсенс теж утворює зв'язну серію.
Розшифровка генетичного коду була одним з найвидатніших наукових відкриттів ХХ століття.