@iayork'un güzel cevabında neyin eksik olabileceğini eklemek için. E'de yapılan kodlamanın daha basit bir resmini vermek istiyorum. coli DNA.
-
4 piksel renginin her birinin farklı bir baz ile belirtildiği katı strateji için ilk olarak, bir :
AAGCCCTGGTCAGCT
İlk AAG'yi göz ardı edin ve C ile başlayın. Şimdi, her bir DNA tabanı 2 basamaklı bir ikili sayıyı temsil edebilir ve her sayı bir renge karşılık gelir, örneğin :
C = 00
T = 01
A = 10
G = 11
Bununla strateji akılda tutulursa, CCCT dizisi 00000001 piksel (veya piksel kümesi) verir ve sıra büyüdükçe bu böyle devam eder. Bu piksel, görüntüdeki dört pikselin rengini tanımlar. Böylece, her bir taban görüntüdeki bir piksele karşılık gelir ve taban, 4 renkli bir görüntüdeki pikselin rengini tanımlar.
-
Şimdi, esnek strateji . Başlangıç olarak, tabloya tekrar bakın:
Burada standart 3 tabanlı kodonlar kullanıyoruz. Her bir renk için önceden tanımlanmış değerden (1'den 21'e kadar), rengi kodonu kullanarak bulabiliriz. Örneğin, aynı diziden:
AAGCCCTGGTCAGCT
AAG'yi tekrar yok sayın ve CCC ile başlayın. Tablodan, CCC 1 değerini kodlar. Bir sonrakine geçin, TGG 16 değerini kodlar, TCA 10'u kodlar ve GCT 7'yi kodlar, vb. Daha uzun diziler için. Böylece şimdi 4 piksel, yani 2 x 2, renk kodu 1, 16, 10, 7 olan pikselli bir görüntü elde ediyoruz. Bu şekilde, her piksel önceden tanımlanmış değerlerden bir renge sahip olabilir. Bu verileri çıkarırken, görüntü şu şekilde çıkar ( gizmodo 'dan):
Yukarıdaki bölüm çoğunlukla bir elin tek görüntüsünden bahsetti. Şimdi, binicilik GIF'i hakkında konuşursak, süreç neredeyse aynı. Burada bir yerine 5 görüntü kodlamamız gerekiyor. Bilim adamları bu 5 görüntüyü 5 farklı hücreye kodladılar. Onları bazı nesiller boyunca kültürledikten sonra, tüm görüntülerin bilgilerini (standart biyoinformatik araçları kullanarak) çıkardılar ve GIF'i geri almak için derlediler. İlk ve son GIF'ler şuna benzer ( wired.com 'dan):
Ne bunlar katı ve esnek anlamına mı geliyor?
Bu teknikte katı ve esnek , kodondan ziyade bireysel bazla ilgilidir. Katı stratejide, her bir tabanın değeri sabittir, yani katıdır. Örneğin, herhangi bir sırada, sonraki veya önceki taban ne olursa olsun, C '00' değerini kodlayacaktır. Bu, hem CCCT hem de GGTC'de C'nin katı değerinin '00' olduğu anlamına gelir. Dolayısıyla, her bir tabanın katı bir şekilde bir pikselin rengine karşılık geldiği 4 renkli bir görüntü için, dizideki tabanlar kadar çok piksel elde ederiz.
Öte yandan, esnek stratejisine bağlı olarak, bireysel tabanların sabit bir değeri yoktur ve bir pikselin genel değeri, o pikseli kodlayan tüm tabanlarla tanımlanır. Örneğin, TCC 6 değerini kodlarken CCC 1'i kodlar. Bireysel bazın değeri dejenere (veya esnek ), dolayısıyla esnek strateji adıdır.
Bu nedenle, kısaca özetlemek gerekirse, bir piksel tek bir temel ile tanımlandığı için (esnek stratejide bir piksel bir kodon tarafından tanımlandığı için) katı strateji daha verimli iken, esnek strateji daha renkli görüntüler elde etmek için daha uygundur çünkü bir kodondaki baz sayısını artırarak daha fazla renk seçeneği elde edersiniz (oysa katı stratejide yalnızca 4 renk elde edersiniz, 4 bazla tanımlanır).
Neden AAG'yi görmezden geliyoruz? güçlü>
@canadianer'ın yanıtında belirttiği gibi, AAG bir PAM , yani Protospacer Bitişik Motiftir. Wikipedia 'ya göre:
Protospacer bitişik motif (PAM), CRISPR bakterisinde Cas9 nükleaz tarafından hedeflenen DNA dizisinin hemen ardından gelen 2-6 baz çiftli bir DNA dizisidir. adaptif bağışıklık sistemi. PAM, istilacı virüsün veya plazmidin bir bileşenidir, ancak bakteriyel CRISPR lokusunun bir bileşeni değildir.
Basit bir ifadeyle (teknik ayrıntılardan kaçınarak), CRISPR'nin çalışması için PAM gereklidir , ancak dizinin kendisinin bir parçası değildir. Bir noktalama işaretine çok benzer şekilde, CRISPR'nin düzgün çalışması için gereklidir, ancak kodlama / kod çözme amacıyla okunmamalıdır. E'de bulunan Cas9 için. coli (ve en popüler olanıdır), AAG dizisi bir PAM olarak hizmet eder ve bu nedenle burada kodlama amacıyla kullanılmaz. Bilim insanları, entegrasyon için birden fazla tanıma sitesi olmaması için piksellerinde AAG kullanmaktan da kaçındı (CRISPR'nin çalıştığının farkında değilseniz bu noktayı göz ardı edin).
Referans : Shipman, S., Nivala, J., Macklis, J. ve Church, G. (2017). CRISPR-Cas, bir dijital filmin canlı bakteri popülasyonunun genomlarına kodlanması. Doğa. http://dx.doi.org/10.1038/nature23017