Soru:
Bu insan bam dosyasında neden her kromozomun yalnızca bir kopyası var?
Lot_to_learn
2018-12-24 11:15:53 UTC
view on stackexchange narkive permalink

İnsan DNA dizisinde, kromozomun bir kopyasının annenin DNA'sından geldiğini ve diğer bir kopyanın da insan DNA'sındaki her bir kromozomun iki kopyasını oluşturmak için babanın DNA'sından geldiğini biliyoruz. Dolayısıyla, DNA'sından ekzom dizisini çıkarırsak, her ekzomda her kromozomun iki kopyası olmalıdır (biri anneden, diğeri babadan). Ancak ya fastq dosyasında ya da WES verilerindeki bam dosyasında her zaman her kromozomun yalnızca bir kopyasını buluyorum.

S1: Sekanstaki diğer gen kopyası nerede veya bir şeyi gözden kaçırdım mı?

S2: WES verilerinde ploidiyi nasıl kontrol edebilirim ve her bir kromozomun iki kopyası olup olmadığını nasıl öğrenebilirim? WES verilerim referansla eşlenir ve bir bam dosyasında saklanırsa bunu nasıl yapabilirim?

Örneğin, tüm genlerin iki kopyası yoktur. Y kromozomu. (Genellikle) sadece biridir.
Bir cevap:
conchoecia
2018-12-24 12:21:41 UTC
view on stackexchange narkive permalink

Bir kromozomun maternal ve babaya ait kopyalarına haplotipler adı verilir. Çoğu metazoan (hayvan) diploiddir ve cinsel üreme sırasında anne ve baba kromozom katkısına sahiptir, sorunuzun ifade ettiği gibi sadece insanlar değil.

1. Çeyreğe Yanıt

Sorunuz, başka bir deyişle: .bam dosyaları haplotipler arasında neden farklılık göstermiyor?

Sorunuz, bugün çoğu insanın "genomik" nasıl yaptığına dair daha temel bir çekirdeğe ulaşıyor. Çoğu insan bir genom oluşturduğunda veya bir referans genom oluşturduğunda, aslında her kromozom için tek bir sekans içeren bir fasta dosyası üretirler. Elbette bu, kromozom başına çok farklı iki sekans olduğu için biyolojik olarak doğru değildir. Çoğu genom, yalnızca ikisi arasında kimerik bir fikir birliği bildirir ve bunu bir referans olarak adlandırır. Bu referans genomlar haploid veya haplotip çökmüş durumdadır.

Sorunuz burada devreye girer: Biyolojik olarak iki farklı haplotipten türetilen transkriptleri bir referans genoma eşlediniz. sadece (yetersiz olarak) her iki haplotipi temsil eden bir konsensüs dizisi içerir. Sonuç olarak, bam dosyasındaki tek bir lokusta, her iki haplotipten de eşlenmiş okumalar olacaktır. Referans fasta dosyanız her iki haplotipin de tam sırasını içeriyorsa, eşleştirdiyseniz referansı okur ve yalnızca birincil hizalamalara bakarsanız, okumalar çoğunlukla menşe haplotipleriyle eşleşir.

Bu, fazlama adlı başka bir konuya girer ve burada her haplotipe özgü polimorfizmlerin çoğunun sırası ve yönü, sıralama verileri kullanılarak belirlenir. Varyant sitelerin doğru şekilde tespit edilmesine dayandığı için bununla ilgili bazı sorunlar vardır. GATK ve diğerleri gibi yazılımlar, iyi bir sıralama kapsamı varsa, tek nükleotid polimorfizmlerini (SNP'ler) bulabilirler, ancak eklemelerin ve silmelerin saptanması çok daha zordur. Bu, herhangi bir genomdaki haplotip farklılıklarının çok SNP taraflı bir görünümünü verir. Varyant siteleri bulduktan sonra, hapcut2 gibi fazlama yazılımları hangi varyantların hangi haplotipe düştüğünü belirler ve aynı haplotipe ait olduğu düşünülen varyantların bloklarını çıkarır.

Tek başına fazlama yeterli değildir. okuma haritalama ile tüm varyantları tespit edememe nedeniyle her iki haplotipin tam dizisini doğru şekilde yeniden yapılandırmak. Geleceğin altın standardı, her haplotipin bağımsız olarak bir araya getirildiği diploid de novo genom grubu 'dur. Bu, genom birleştiriciler geliştiren insanlar için aktif bir araştırma alanıdır ve PacBio ve Oxford Nanopore uzun okumalarındaki gelişmelerle sıkı sıkıya bağlantılıdır. Trio canu hakkındaki bu makale, başarılı bir dioploid birleştirme tekniğini öğrenmek için iyi bir başlangıçtır.

2. Çeyreğe Yanıt

Tüm ploidileri kontrol etmek istiyorsanız kromozomların en az 10 katı kadar tüm genom av tüfeği verilerinin kapsamına ve leke bölmesi ve genomeskop gibi bir araca ihtiyacınız var.

Denemeye çalışıyorsanız Kanser örneği gibi bir şey için yerel kopyaları veya tam kromozom kopyalarını kontrol edin, ayrıca tüm genom av tüfeği verilerine ihtiyacınız olacaktır. WES verileri ploidi hakkında güvenilir bilgi vermez, çünkü belirli bir lokustaki okuma sayısı söz konusu bölge için gerçek homolog kromozomal DNA miktarına değil, transkripsiyon seviyesine bağlıdır.

Kanser örneklerinde bir lokusun kromozom kopyası veya kopyası olduğuna dair kanıt aramaya (bir bam dosyası kullanın) çalışıyorsanız, bilinen bir normal lokusa kıyasla o lokustaki tüm genom av tüfeği kapsama alanında bir artış ararsınız. Örneğin, biri dışındaki tüm kromozomlar 22 kapsama alanına sahipse ve bir kromozomun ortalama kapsamı 33 ise, bu bir trizominin kanıtıdır. Bu mantık daha küçük bölgelere de uygulanabilir (tekrar eden bölgeler, paraloglar vb. Hariç).

Güzel açıklama için teşekkürler. Mümkünse +50 vermek istiyorum. Bu cevap, daha ileri çalışmalar için güzel bir başlangıç ​​olabilir.


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 4.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...