?

Log in

No account? Create an account
Quizzing the Anonymous
Ignoramus et ignorabimus
Hенадежное копирование 
9th-Sep-2018 05:17 pm
thinking
Два года назад я рассуждал, почему с химической точки зрения вполне очевидно, что биополимеры, ответственные за хранение/копирование информации (нуклеиновые кислоты) и метаболизм (белки) должны быть разными (к ним предъявляются слишком разные требования)
https://shkrobius.livejournal.com/576657.html?thread=10477201#t10477201

Втч я предложил, что надежность копирования прото-нуклеиновых кислот с самого начала д. б. > 1е-4, т.к. иначе возникнут ошибки в структуре почти всех белковых комплексов (требующих примерно столько нуклеотидов для кодирования), и машинерия клетки не сможет надежно работать. Меня тут же спросили, почему? - и я не смог дать полностью удовлетворительного ответа.

Я обсуждал этот вопрос с молбиологами, но беседы не "пошли". Химику и молбиологу особенно трудно представить обратную ситуацию, т.к. ДНК и ДНК полимераза специально подобраны, чтобы ошибки копирования были < 1е-6. Так можно обсуждать, как жили бы люди, если бы у них ноги были длиной с милю. Если бы у них были такие ноги, то они бы не жили; конец обсуждения.

***

С тех пор у меня появились некоторые соображения.

Исходная точка рассуждения - аналогия с передачей информации в ненадежных системах коммуникации. Проблема решается дроблением потока информации на небольшие куски и подсчетом контрольных сумм, хешированием и т. д.
https://en.wikipedia.org/wiki/Checksum
Если блок передан с ошибкой, его передают его еще раз, пока не получают точную копию. Это расточительно, но что делать... Вопрос в том, как превратить эту аналогию в реалии репликации генома.

В случае частых ошибок копирование всего генома целиком безнадежно, но можно (по аналогии) копировать его ген за геном и проверять каждый ген отдельно. Точность копирования гена можно определить его транскрипцией, синтезом энзима и проверкой энзима на функциональность. Если энзим функционален - значит кодирующий участок воспроизведен удовлетворительно. К сожалению, невозможно соорудить универсальную "проверялку" функциональности, и потому задача кажется безнадежной. Я вспомнил, что в любом геноме (включая наш собственный)
http://www.pnas.org/content/107/12/5429
http://rspb.royalsocietypublishing.org/content/early/2010/07/03/rspb.2010.1052
https://en.wikipedia.org/wiki/Overlapping_gene
есть немало участков, одновременно кодирующих два белка из-за сдвинутой рамки считывания. Это свойством можно воспользоваться, чтобы сделать биологический аналог контрольной суммы. "Контролем" функционального белка служит белок, синтезированный из той же последовательности, но со сдвинутой рамкой. Если второй (контрольный) белок нефункционален, нефункционален и первый белок. Остается придумать универсальную функцию контрольного белка - но эта функция очевидна из самой задачи.

Репликационная система может работать так. Рядом с каждым кодирующим участком находится некодирующая последовательность. "Контрольный" белок кодирующего участка уникально связывается с этим регуляционным участком. По факту связи между ними можно установить, что репликация регуляционного участка и кодирующей последовательности (для функционального и "контрольного" белка) были успешны. Мы знаем, что материнские последовательности безошибочны. Полимераза создает новые последовательности на основе комплементарных материнских цепочек, и они сразу транскрибируются в два белка. "Контрольные" белки каждой последовательности садятся на регулирующие участки, и служат промотерами дальнейшей репликации. Если промотер не связался с своим участком, геликазы убирают новые цепочки и репликация повторяется, пока не образуется функциональный промотер. Такая репликация продолжается от одной кодирующей последовательности к другой.

Эта репликации далека от того, что существует сегодня, хотя она содержит в себе многие элементы ныне существующей системы. Природа не пошла по пути "контрольных сумм", т.к. гораздо проще повысить надежность полимераз. Зачем же себе такое воображать? Подобной системе может не быть альтернативы, если энзиматические и информационные функции не полностью разделены.

Наверно, химически ненадежная репликация в клетке возможна, хотя она сложна и неэффективна, так как ее необходимо сделать надежной на системном уровне. Я не думаю, что проблема тут в недостатке моего воображения; это объективно трудно.
Comments 
10th-Sep-2018 01:39 am (UTC)
идея хорошая, только вот передача в действительно ненадежных системах точно не через чексумму == это работает только для редких ошибочных блоков, если вероятность ошибки выше определенного %% то слишком всё грустно.

Чексумма нужна для контроля целостности, а так применяется избыточное кодирование с возможным восстановлением данных (так например данные хранятся на СД/ДВД и т.д.)
10th-Sep-2018 03:00 am (UTC)
В GSM (базовом стандарте) трехслойное избыточное кодирование - помехоустойчивый потоковый код с двойной избыточностью (восстановление идет по критерию минимизации числа ошибок в блоке), потом блочный код с исправлением групповых ошибок, потом биты в блоке перемешиваются фиксированной псевдослучайной перестановкой (чтобы разнести оставшиеся групповые ошибки) и кодом соломона-рида.

Дальше кстати в голосовом канале если не сработало никаких коррекций не делается - просто блок и состоянике вокодера сбрасывается - вокодер через несколько блоков свое состояние восстанавливает.

В цифромом канале добавляется еще один уровень кодирования (не помню какой - но скорее всего тот же соломон)
10th-Sep-2018 03:13 am (UTC)
Но подозреваю что как раз подобный уровень устойчивости и сделает мутации принципиально невозможными
10th-Sep-2018 05:09 am (UTC)
Мне это не кажется совсем невозможным, но проще, думаю, иметь несколько копий генома и всё время их восстанавливать по принципу "одинаковые 2 из 3". Проходиться по трём цепочкам и несовпадающее в одной из них исправлять.

Полиплоидные одноклеточные действуют подобным образом, но на уровне гена, а не нуклеотида. Всё время копируют гены с одной цепочки на другую, пока не останутся с одной версией.
10th-Sep-2018 06:36 am (UTC)
При ненадёжных базовых операциях появляется риск неправильно посчитать, кто тут 2 из 3, либо вообще на ровном месте получить из трёх из трёх два из трёх.
10th-Sep-2018 07:21 am (UTC)
Поделить на блоки порядка 3000 нуклеотидов и защитить каждый кодом Рида-Соломона. Регулярно проходить по геному и исправлять ошибки. А может, лучше подойдёт свёрточный код, тогда и на блоки делить не обязательно.
10th-Sep-2018 02:00 pm (UTC)
И как же имплементировать подобный алгоритм на уровне биомолекул? И как он может возникнуть "сам собой"?
10th-Sep-2018 10:49 am (UTC)
Посмотрите James A. Shapiro, Evolution: A view from the 21st Century, 2011. Как пишут молекулярные биологи геном является системой чтения/записи, поэтому разговоры просто про копирование уже несколько устарели.
10th-Sep-2018 02:01 pm (UTC)
Если невозможно достаточно надежное копирование, невозможно и все остальное.
10th-Sep-2018 08:54 pm (UTC)
Почему не предположить, что именно парность синтеза работает как контроль? Например все так устроено, что только две одинаковые единицы добавленные к обеим синтезируемым белкам позволяют перейти к следующему шагу наращивания? (ну или свернуться "свежесинтезированные" участки должны одинаково и тогда не помешают?)
10th-Sep-2018 09:57 pm (UTC)
Насколько я понимаю, есть специальные системы исправления мутаций, который их ищут по известным признакам. Не контрольные суммы, конечно, но в каком-то смысле похоже.
13th-Sep-2018 04:55 am (UTC)
Нет, не похоже. Это очень ограниченный круг мутаций, скажем, сшивки оснований. Опознаются они химически, а не как ошибки самого кода.
11th-Sep-2018 05:51 am (UTC)
Подкину Вам интересный факт: в сперматозоидах активно чудовищное по сравнению другими клетками количество генов, и их белки тем или иным образом важны для функциональности сперматозоида. В яйцеклетках этого не наблюдается. В общем, отцовский геном проходит таким образом дополнительную проверку. Вот вам и многослойное кодирование =)

Edited at 2018-09-11 05:52 am (UTC)
11th-Sep-2018 08:15 pm (UTC)
как-то это неправдоподобно. Получается слишком сильное требование на ген и получаемый из него белок - чтоб не только основной белок был функционален, делал что ему там полагается, но и смещенный из него - то есть в общем случае довольно странный мусор, только по редкой случайности способнй хотя бы не мешаться, - был способен на некоторую активность, хотя бы связаться с участком гена. То есть он должен быть способен связываться вообще а не болтаться поперек всего процесса, не травить все окружающее, и сам этот контрольный ген должен каким-то образом соответствовать этому белку (что совершенно не означает копии оригинала!).

Скорее уж тогда двойное копирование. С получившихся копий днк одновременно делается два продукта (необязательно белка, кстати, может и рнк какой-нибудь, если оторваться от вопроса "а как такая структура смогла возникнуть", допустим что силой мысли Кт-лху), или прямо они сами одновременно поступают в некоторый сравнитель, если не совпадают - все заклинивает насмерть и обе копии дохнут, идут на промпереработку вместе с застрявшей на них сравнивалкой. Только тогда придется держать какую-то совсем-супер-оригинальную копию, мастер рекорд, которая только копируется но никогда не проверяется, чтоб ее не потерять.

13th-Sep-2018 04:53 am (UTC)
Я понимаю, что это Вам звучит странно, но таких белков очень много, а для вирусов это вообще сплошь и рядом (им нужно уместить очень много информации в короткую последовательность).

Увы, в клетке нет ничего похожего на "сравниватель".
This page was loaded Oct 22nd 2019, 9:02 pm GMT.