Eat my Words – Moleküldichtung

body of water wave

Die Bausteine von Proteinen sind Aminosäuren.
Die Bausteine von Steaks sind Worte.

Es gibt 20+1 (Standard-)Aminosäuren plus ein paar, die in der Proteinsynthese nicht regelmäßig vorkommen. Das sind zwei oder drei weitere – je nach Lesart: Zusammen: das Alphabet der Proteine.

Die Aminosäuren werden klassisch in einem Drei-Buchstaben-Code bezeichnet (z. B. Alanin=Ala). Zur Abkürzung gibt es einen Ein-Zeichen-Code (z. B. Alanin=A).

Das Lateinische Alphabet hat 21 Buchstaben
Das Deutsche und das Englische Alphabet haben 26 Buchstaben

Aminosäuren können in ein Alphabet abgebildet werden – und umgekehrt kann ein Alphabet in Aminosäuren abgebildet werden.

Aminosäuren sind die Bausteine von Proteinen.

Proteine werden produziert durch Verkettung von Aminosäuren.

Die Reihenfolge in der Kette wird gesteuert von DNA.

DNA besteht aus Molekülen, die eine definierende Nukleinbase (Adenin, Thymin, Guanin und Cytosin; oft mit A, T, G und C abgekürzt) enthalten. GATTACA, anyone?

Massive und komplexe DNA Synthese (1) ist möglich.

Translation von DNA in Proteine im industriellen Maßstab ist möglich.

Proteinproduktion mit verschiedenen Zellen und Vektorsystemen ist möglich.

Die Voraussage der Tertiärstruktur von Proteinen durch neue Datenverarbeitung ist möglich.

Ich kann also irgendeinen Text in seinem Alphabet in natürlicher Sprache nehmen.

Ich kann eine Translationstabelle entwickeln.
Ich kann den Text in eine Sequenz von Aminosäuren übersetzen.
Ich kann die Aminosäuresequenz in eine DNA-Sequenz rückübersetzen.

Ich kann die DNA-Sequenz des Textes in einem biologischen Produktionssystem (z. B. E. Coli oder Hamsterovarialzellen, you name it you get it) large scale in Protein übersetzen (2).

Ich erhalte:

Einen Tofu-artigen Block von Milliarden-Kopien der Sonette Shakespears, oder der Leiden des jungen Werthers. Und könnte Geschmacksrichtungen vergleichen. Shakespeare wird schon wegen der anderen Zusammensetzung der Buchstabensuppe anders schmecken als Schiller, vielleicht sogar anders als Byron.

Beyond Meat: Heute nehme ich mal den Shakespeare, raw. Meine Frau hätte gerne Ihren exzellenten Weimar-Salat mit Schiller-Locken

Ich erhalte ferner (Bonus):

Bilder. Neue Software für die Voraussagen von Faltungen von Proteinen (Tertiärstruktur) macht das Zeichnen einfacher.

Es gibt viele lyrische Texte über Proteine und Biochemie. Ich habe den hier vorgestellten Ansatz sonst so noch nicht gefunden. Die Idee ist aber eigentlich naheliegend. Deshalb scheint es mir unwahrscheinlich: Aber er scheint neu zu sein. Wenn jemand auf die Idee früher kam: Congratulations! Live And Prosper. Ich bitte herzlich um einen Hinweis, damit ich diesen Beitrag ergänzen kann.

Christian Bök hat mit Texten und DNA in E.coli gearbeitet (Xenotext: Book 1).

Literaturanregungen, beispielsweise:


(1) DNA Synthese

J. William Efcavitch, PhD, Molecular Assemblies and Stefan Lutz, PhD, Codexis, Inc. DNA-Synthesis: approaches, Advances and Applications

S, Kosuri, G. M. Church: Large-scale de novo DNA synthesis: technologies and applications. Nature Methods 2014. 11; 499-507

(2) Protein-Synthese

G. Bhattacharyya et. al. Large scale production of synthetic spider silk proteins in Escherichia coli. Protein Expr Purif. 2021 Jul;183:105839. doi: 10.1016/j.pep.2021.105839. Epub 2021 Mar 18. PMID: 33746079.