Soru:
Bir gen zenginleştirme analizinden en temsili yollar nasıl seçilir?
llrs
2017-05-26 19:07:00 UTC
view on stackexchange narkive permalink

Bir gen kümesine zenginleştirme analizi yaptım. Çıktı, yolların ve bunların p değerlerinin bir listesidir (yollar, p değeri < 0.05 olduğundan seçilir). Liste hala oldukça uzun, bu yüzden onu azaltmak istiyorum. Bu amaçla, $ p $, listedeki yolların sayısı olduğu bir $ p $ x $ p $ matrisindeki yolların Dice katsayısını hesapladım. Hem daha farklı olanları (daha az örtüşüyorlar, Dice katsayıları daha düşük) hem de en benzer yolları daha çok temsil eden yolları istiyorum (Öyleyse, 0.8'in üzerinde çakışan 5 yolluk bir grup varsa, sadece birini alır).

En çok temsilci yolunu nasıl seçebilirim?

GO için benzer bir araç var, ancak önemli olmayan GO'yu atmaya devam ediyor, burada tüm başlangıç ​​yolları zaten önemli.

Dice katsayı matrisini kullanarak yolların kümelenmesini yaparsam, nerede (veya nasıl) keseceğimi bilmiyorum.

circular dendrogara

Yolları seçmek için yüksekliği kullanmayı denedim. Ama boyun yorumundan emin değilim.

Gördüğüm diğer bazı araçlar çok boyutlu bir ölçekleme grafiği kullanıyor, ancak bunu yapmanın ve birinci boyutun belirli bir noktasında kesmenin yardımcı olup olmayacağından emin değilim. MDS plot

P değeri <0,05 veya p değeri <0,05 / (test edilen terim sayısı) mı kullanıyorsunuz? Birden fazla test nedeniyle yanlış pozitiflerden kaçınmak için ilkini kullanmak isteyeceksiniz
Çözmeye çalıştığınız problemde birkaç farklı değişken olduğundan (gruptaki yol sayısı, yollar arasında istenen örtüşme / mesafe, vb.) "Makul derecede iyi" bir sezgisel çözümle anlaşmanız gerekeceğini tahmin ediyorum. .) Pek çok olası cevabı hayal edebiliyorum.
@CloudyGloudy birden fazla test için düzeltme zaten yapıldı, üzgünüm daha önce bundan bahsetmedim. Evet, 0.5'lik bir örtüşme / mesafe seçme ve bunun üzerinde olanları tutma fikri ile oynuyordum, ancak bu diğerlerinden tamamen farklı olan yolların dışında kalacaktır, ancak belki 0.75'in üzerindekileri ve 0.25'in altındakileri seçebilirim.
üç yanıtlar:
#1
+4
gringer
2017-05-28 15:23:34 UTC
view on stackexchange narkive permalink

Bu, kümelenmiş bir ısı haritası grafiğine, bir korelasyon matrisi grafiğine veya benzer bir şeye uygun olabilecek bir şeye benziyor. Zar katsayısı matrisinin bir korelasyon matrisine (veya belki korelasyon matrisi olmadan bu matrisin sadece bir ısı haritası grafiğine) baktınız mı?

düzeltme paketi olabilir gibi görünüyor yararlı, özellikle hclust / dikdörtgen çizim sunumu.

Yine de bu paket için kefil olamıyorum; "R grafiği korelasyon matrisi" aramasıyla bulduğum bir şey.

Bir ısı haritası veya korelasyon grafiği ile, şu anda dendrogram ve MDS grafiğiyle yaptığım gibi, yollar arasındaki benzerlikleri gözlemleyebilirim. Ancak soru, bu daha temsili yolların nasıl seçileceğidir. Düzeltmeleriniz ve yorumlarınız için teşekkürler btw.
#2
+3
benn
2017-12-12 18:38:49 UTC
view on stackexchange narkive permalink

Benzer önemli yolları gruplamanın bir yolu, yollar arasında kaç genin örtüştüğünü ölçmek ve bunu kümelemede (ısı haritası) kullanmaktır. R'de, GO terimleri arasındaki örtüşme indeksini hesaplayan ve ardından onları bir ısı haritasında kümeleyen bir araç yaptım. Örtüşme indeksi, örtüşen genlerin oranıdır (0-1 arası sayı). Ayrıca, örtüşme indeksi yerine kümeleme için Pearson korelasyonu kullanılabilir. Paketim ( gogadget) yalnızca goseq analizi ile çalışır, ancak goseq 'yi reactome veya kegg verileri için de kullanabilirsiniz.

Bu örtüşme kümelemesini kullandım şimdi farklı veri kümeleri için yaklaşım ve genellikle 200-300 GO terimini 10-20 işlevsel gruba indirebiliriz.

Hangi örtüşme indeksini kullanıyor? Birkaç örtüşme endeksi vardır. GO'da bu yaklaşımı kullanmamanızı tavsiye ederim, iki GO teriminin ne kadar benzer olduğunu ölçmek için özel yöntemler vardır. Bkz. [GOSemSim] (www.bioconductor.org/packages/GOSemSim/).
Örtüşme indeksi, örtüşen genlerin sayısının, iki gen setinden daha küçük olan genlerin sayısına bölünmesiyle tanımlanır. [Bioconductor Örnek olay incelemeleri] (http://www-huber.embl.de/pub/pdf/HahneHuberGentlemanFalcon2008.pdf), bölüm 13.3'te açıklanmıştır. Bu kitap biyoinformatikte büyük isimlerle yazılmıştır (R. Gentleman ve W. Huber gibi).
Yeni örtüşme endeksi için teşekkürler, bilmiyordum. BTW, genler arasındaki bu benzerliğin hesaplanma şekli, diğer örtüşme indekslerini kullanmaktır, bu yüzden bu yardımcı olmaz.
Tamam, ama benim açımdan, hangi dizinin kullanılacağı değil, kümeleme yaklaşımı ([gringer] (https://bioinformatics.stackexchange.com/users/73/gringer) önerdiği gibi). Paketimin [kullanıcı kılavuzu] 'na (https://sourceforge.net/projects/gogadget/files/gogadget.2.1/) 26-28. Sayfalara bakarsanız, bir ısı haritası göreceksiniz. Genellikle Ward.D ve Euclidean ile iyi sonuçlar alıyorum. Ağaç R'de kesilebilir, ancak doğru kesmeyi bulmadan önce hangi gen setlerinin hangi dallarda bir araya toplandığını görmek ve değerlendirmek isteyebilirsiniz.
Üzgünüm, son yorumum başka bir soruyu düşünüyordu. Evet, bu yaklaşım işe yarayabilir
#3
+2
Scott Gigante
2017-05-27 15:43:35 UTC
view on stackexchange narkive permalink

Listeyi mutlaka kısaltmak yerine, en temsili gen kümelerinin daha güvenli bir şekilde sıralanmasından memnunsanız, EGSEA'yı deneyebilirsiniz. En alakalı gen kümelerinin bir sıralamasını vermek için bir topluluk yaklaşımı kullanır ve ayrıca, çıktıyı farklı ayrıntı düzeylerinde incelemenizi sağlayan istatistikler, ısı haritaları, yol haritaları, özet çizimleri ve GO grafikleriyle etkileşimli bir HTML çıktısı üretir.

bioRxiv ile ilgili makaleyi okuyabilir veya paketi Bioconductor 'dan indirebilirsiniz.

Sıralama, p-değeri aracılığıyla zaten yapılmıştır (EGSEA tarafından önerilen gibi daha ayrıntılı bir testin daha iyi olacağı iddia edilebilir) ancak bu, EGSEA veya diğer yazılımların çıktısından ilgili yolların nasıl seçileceğini yanıtlamıyor gibi görünüyor. / araçlar / yöntemler
P değerine göre sıralama yapmamalısınız. P-değeri sadece gözlemlenen değişikliğin istatistiksel olarak anlamlı olup olmadığının bir göstergesidir, gözlemlenen değişikliğin büyüklüğünün bir göstergesi değildir.


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...