Soru:
Bir örnek kümesi içindeki bilinmeyen barkod / adaptör dizilerini sistematik olarak nasıl tespit edebilirim?
story
2017-05-31 14:49:30 UTC
view on stackexchange narkive permalink

Yazarlar, işleme sırasında hangi adaptörlerin kırpıldığını belirtmedikleri SRA'dan sık sık veri kümeleri indirdim.

Yerel hizalamalar bu engeli aşma eğilimindedir, ancak biraz barbarca geliyor. >

fastQC ara sıra bunları almak için çalışır, ancak bazen gerçek adaptör dizilerini bulamaz.

Genellikle kullandıkları kitleri arayıp olası tüm barkodları bulmaya çalıştım.

Bunu yapmanın daha sağlam / verimli bir yolu var mı?

Bu, sorunuzu yanıtlamaz, ancak umarım bu tür sorunları yazarlardan eksik bilgileri yayınlamalarını istemeleri için SRA'ya bildirme olasılığı vardır.
Neden yerel uyumun biraz barbarca olduğunu düşünüyorsunuz? KüçükRNA sıralamasıyla çalışmadığınız sürece, bu gün ve çağdaki varsayılan yöntem olmalıdır. Adaptörleri güvenli tarafta olacak şekilde düzenleme eğilimindeyim, ancak pek çok işi zahmet etmeden ve sadece yerel hizalamaya güvenerek yaptım.
Dört yanıtlar:
#1
+4
ewels
2017-06-02 12:52:08 UTC
view on stackexchange narkive permalink

FastQC "gerçek bağdaştırıcı dizilerini bulamadığından" bahsettiniz - Sanırım Bağdaştırıcı Sırası Kirlenme grafiğini kastediyorsunuz. Bununla birlikte, kmer ve Sıra İçerik Grafikleri, eskisi başarısız olduğunda bile genellikle yararlıdır. Bunları geçmişte kullandım - bazen Sıralı İçerik Grafiği'nin başından itibaren adaptör sırasını okuyabilirsiniz (veya en azından kaç tane bazın kırpılacağını görebilirsiniz).

#2
+2
gringer
2017-05-31 15:45:23 UTC
view on stackexchange narkive permalink

Bunu yapmak için mevcut herhangi bir yöntemden haberdar değilim, ancak bunun nasıl yapılabileceğiyle ilgili birkaç fikir var:

Canu, yokluğu aramayı içeren bir adaptör kırpma yöntemine sahiptir okumalar için örtüşme. Belirli bir bölgede sekansı paylaşan başka okumalar yoksa, okuma düşük kapsam noktasında bölünür ve küçük parçalar atılır. Kısa okumaları koruyarak olası adaptör / barkod dizilerini aramak için böyle bir yöntem kullanmak mümkün olabilir.

Diğer bir seçenek de okumaların başında bir kmer araması yapmak ve bunlardan herhangi birinin olup olmadığına bakmaktır. yüksek bolluktaki kmers birlikte monte edilebilir ve / veya mevcut bilinen adaptörler veya barkodlarla eşleştirilebilir.

#3
+1
bli
2017-05-31 15:28:26 UTC
view on stackexchange narkive permalink

Kitaplıkta bol miktarda bulunması gereken bir dizi biliyorsanız, başlangıcını veya sonunu (örüntü eşleştirme vurgulayarak) belirleyebilir ve aynı sıranın sistematik olarak sırasıyla hemen önce mi yoksa hemen sonra mı geldiğini görebilirsiniz. Bu tür bir görsel inceleme, adaptörü bulmanıza yardımcı olabilir.

Örneğin, önceki bir laboratuvarda D üzerinde çalışıyorduk. melanogaster küçük RNA dizileme verileri ve meslektaşım, bu tür verilerle ilgili önceki deneyimlerinden aşağıdaki küçük RNA'nın muhtemelen bol olduğunu biliyordu: http://flybase.org/reports/FBgn0065042.html

Fastq dosyasında grep ederek bu diziye sahip birçok satırı, her zaman aynı olan başka bir dizinin yanında: bilinmeyen bağdaştırıcıyı görmemiz gerekti.

Eksik oylamanın nedenini öğrenebilir miyim? Bu yöntemin, oldukça bol bir dizinin beklendiği küçük bir RNA dizisinde uygulandığını gördüm. Bu dizinin grep çıktısını görsel olarak incelemek (desen vurgulu olarak), adaptörün ne olduğuna (vurgulanmayan kısım) çok iyi bir ipucu verdi.
Soru, bilinmeyen adaptör dizilerinin nasıl tespit edileceğini soruyor, bu nedenle OP bol dizileri önceden bilmeyecek. Sorunun amacı da bu ...
@tallphil Bağdaştırıcıyı bilmemek ile veride olması beklenen çok sayıda dizinin bilinmemesi arasındaki bağlantıyı görmüyorum. İyi hatırlıyorsam, yorumumda bahsettiğim örnekte, meslektaşım bu tür verilerle ilgili önceki deneyimlerinden şu küçük RNA'nın bol olduğunu biliyordu: http://flybase.org/reports/FBgn0065042.html her zaman aynı olan başka bir dizinin yanında, bu diziye sahip birçok satırı görmek için fastq dosyasında grep etmek zorunda kaldı: bilinmeyen bağdaştırıcı.
Aslında yazınızı yeniden okudum ve şimdi ne demek istediğinizi anlıyorum. Bu makul bir fikir. Ancak, bir okuyucunun kafasının karışabileceği ve en bol diziyi aramanın barkodla ortaya çıkabileceğini düşündüğünüzü düşünerek bunu zayıf bir şekilde açıkladığınızı düşünüyorum. Bu durumda "bol dizi" nin, bir veya her iki uca bağlanmış adaptörlere sahip olması beklenen bilinen bir nükleik asit dizisi olduğunu belirtmiş olmalısınız.
Ah evet, özür dilerim - aynen böyle okudum. Muhtemelen orijinal sorunun beklenen bağdaştırıcı dizileri için grepping'den bahsetmesine yardımcı olmadı, bu yüzden bu aklımda tazeydi :) Üzgünüm @bli! Olumsuz oy benden gelmedi, bu yüzden korkarım geri çekemem.
Açıklamalarımı netleştirmeye çalıştım.
#4
+1
Nils
2017-06-02 16:41:16 UTC
view on stackexchange narkive permalink

Kraken / reaper araç setindeki minion yardımcı programı bunun için yardımcı olabilir: http://wwwdev.ebi.ac.uk/enright-dev/kraken/reaper/src/ reaper-latest / doc / minion.html

Bu tam olarak doğru tipte bir alet gibi görünüyor. Çok kötü olmasına rağmen, esas olarak 3 'uçlu adaptör için tasarlanmıştır. Merak ediyorum, tüm okumalarınızı çevirip 5 'sonuna uygulayabilir misiniz?


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...