Soru:
Sorgu dizisindeki patlama isabetlerinin dağılım grafiğini oluşturmak
bluescholar1212
2017-07-27 03:03:37 UTC
view on stackexchange narkive permalink

BLAST aramamın sonuçlarını, BLAST web sitesindeki patlama vuruşlarının dağılımının grafik görüntüsüne benzer bir şekilde görselleştirmeye çalışıyorum.

Örneğin, BLAST aramamdan:

enter image description here

ancak grafiğin, 6139 isabetin tamamının sorgu dizimdeki dağılımı hakkında bilgiler içermesini istiyorum.

Bu, bir dağılımı görselleştirmek için çok sayıda dizi olduğundan, belirli bir bölgedeki isabet sayısının bir puanını kullanmayı ve şuna daha benzer bir çıktı almayı düşünüyorum:

enter image description here

Patlamamı BLAST + komut satırı aracını kullanarak çalıştıracak ve sonuçları R'ye okuyacak olsaydım, grafik ekranı yeniden oluşturmak için çıktının hangi kısımlarını çizmeliyim dağıtımın? İdeal olarak, herhangi bir BLAST girdisi için eşdeğer bir grafik oluşturabilecek yeniden kullanılabilir bir nesne yapmak isterim.

Teşekkürler.

Bölgelerdeki isabet sayısının puanını nasıl alırsınız? Bence önce skoru almalı ve skoru ve bölgeyi R'de planlamalısın. Eğer uyum görselleştirme istiyorsanız, belki bu [link] (https://en.wikipedia.org/wiki/List_of_alignment_visualization_software) yardımı
Patlama çıkışı için hangi formatı kullanırsınız? Standartlardan biri mi yoksa kendinizinkini tanımlamaya açık mısınız? Ve bu, sorgunuzun her bir pozisyonundaki isabet sayısını mı yoksa puanlarını mı çiziyor? Ya da belki genel kimlikleri? Örnek ekseninizdeki "Koruma" tam olarak nedir?
@terdon Herhangi bir özel tipte patlama çıktısına bağlı değilim ve bu problem için kendiminkini tanımlamaya açığım. Sanırım puan yerine her pozisyondaki vuruş sayısını planlamayı seçeceğim. bu [bağlantı] (https://bcbio.wordpress.com/2009/02/07/automated-protein-conservation-display-from-blast-alignments/), benim ayrıntılı olarak gönderin.
Ancak, ilgili HSP'lerin kalitesini hesaba katmazsanız, belirli bir pozisyondaki isabet sayısı işe yaramaz bir bilgidir. Korumayı planlamak istiyor gibisiniz, eğer öyleyse, bunu yapmanın yanlış yolu budur. Örneğin, 12. konumda yüzlerce vuruşunuz olabilir, ancak bu yüzlerin hepsi çok küçükse ve çok kötü bir şekilde korunuyorsa, alakasızdır.
Korumayı planlamak istemiyorum. Belirli bir insan proteininin hangi bölgelerinin bakteri dizilerine en çok benzediğini bilmek istiyorum. Sorum buysa, boyut / koruma mutlaka önemli mi?
Bir cevap:
benn
2017-07-27 13:55:10 UTC
view on stackexchange narkive permalink

Muhtemelen blast çıktınıza sorgu başlangıcı (qstart) ve sorgu sonunu (qend) eklemek istiyorsunuz.

Bunun gibi bir şey:

  blastn -query your. fasta -out blast.out.txt -db your.db -outfmt '6 qseqid sseqid qstart qend length evalue'  

R'de, her satırdan "qstart: qend" alabilirsiniz. yoğunluk grafiği.

R'de bu başlangıç ​​ve bitiş amino asitlerinin yoğunluklarını çizmenin birçok yolu vardır.

Küçük bir veri çerçevesi ile bir örnek göstermeme izin verin:

  qstart <- c (200, 300, 250, 400, 500) qend <- c (300, 450, 400, 600, 650) df <- as.data.frame (cbind (qstart, qend )) aa <- vektör () i = 1for (i in 1: 5) {aa <- append (aa, c (df [i, 1]: df [i, 2])) i + 1} hist (aa ) dens <- yoğunluk (aa) grafiği (dens)  
Teşekkürler @b.nota Şu anda buna bir şans veriyorum ve nasıl sonuçlanacağını göreceğim. Bu tam olarak aradığım şey olabilir.
Şu anda yoğunluk grafiği yapmak için çalışıyorum ve bazı sorunlar yaşıyorum. Veri çerçevemdeki her satır için "qstart: end" içeren yeni bir sütunum var, ancak bu sütunla bir yoğunluk grafiği yapmaya çalıştığımda R bir hata veriyor. Bunu nasıl aşabilirim?
Harika adam! R'de veriyi nasıl alacağının ve ondan bir çizim yapmanın birçok yolu vardır. Cevabımın düzenlenmesinde size küçük bir örnek vereceğim. İyi şanslar!


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...