(Acest articol a fost publicat pentru prima dată pe R – Myscapeși cu amabilitate a contribuit la R-bloggeri). (Puteți raporta problema legată de conținutul acestei pagini aici)
Doriți să vă distribuiți conținutul pe R-bloggeri? dați clic aici dacă aveți un blog, sau aici dacă nu aveți.
Prezentare generală
Analiza funcțională este utilă pentru determinarea funcțiilor genelor exprimate diferențial. Genele pot avea mai multe adnotări funcționale, așa că trebuie să stabilim care dintre ele sunt importante.
Ce funcții biologice conduc diferențele în expresia genelor?
Aplicația freeCount FA vă va ajuta să efectuați o analiză funcțională a seturilor de gene, care pot fi produse din expresie diferențială sau analiză de rețea.
Obiectivele de învățare
- Aflați cum să efectuați analize funcționale în aval cu topGO
- Exersați interpretarea rezultatelor analizei funcționale
- Înțelegeți cum să conectați genele la funcții
Înrudit
Acest tutorial este al doilea dintr-o serie și direct după tutorialul Making DE Gene Lists with freeCount.
topGO
Pachetul topGO R oferă instrumente pentru testarea termenilor ontologiei genelor (GO) în timp ce ține cont de topologia graficului GO.
Unul dintre principalele avantaje ale topGO este cadrul de testare unificat al setului de gene pe care îl oferă. Există o serie de statistici și algoritmi de testare care se ocupă de structura graficului GO și care sunt gata de utilizare în topGO.
Ontologie genetică
Ontologia genelor (GO) este structura logică care descrie întreaga complexitate a biologiei. Termenii GO descriu numeroasele tipuri diferite de funcții moleculare (MF), căile care efectuează diferite programe biologice (BP) și locațiile celulare în care acestea apar (CC).
Adnotările GO sunt declarații urmăribile, bazate pe dovezi, care leagă un anumit produs genetic cu un anumit termen de ontologie. Setul tuturor adnotărilor GO asociate cu o genă oferă o descriere a rolului ei biologic.
Înainte de a începe
Exercițiul din acest tutorial va folosi aplicațiile freeCount din RStudio pe un computer personal. Asigurați-vă că aveți următoarele instrumente descărcate, instalate și la zi pe computerul personal:
- Mediul software R
- Aplicația desktop RStudio
Pentru utilizatorii de Windows, instalați suplimentar RTools.
De asemenea, este posibil să rulați online aplicațiile freeCount prin Posit Cloud. Pentru a vedea cum, consultați tutorialul freeCount Bioinformatics Analysis Apps on Posit Cloud.
Date de intrare
- Descărcați fișierul cu liste de gene tribolium DE
- Descărcați fișierul de adnotări ale termenilor tribolium GO
Sfat! Faceți clic dreapta și selectați Salvați ca… pentru a descărca fișierele de mai sus în formatele necesare.
Aplicația de analiză
Următorii pași vă arată cum să obțineți și să începeți să rulați aplicația de analiză funcțională (FA) freeCount.
- Descărcați gratuit aplicațiile Count R Shiny
- Accesați https://github.com/ElizabethBrooks/freeCount
- Faceți clic pe verde < > Cod buton
- Clic Descărcați ZIP
- Extrageți freeCount-principal director
- Navigați la aplicații director
- Deschideți DEPARTE fișier în RStudio
- Clic Instala pe bannerul galben pentru a instala pachetele R necesare (sau rulați codul pe rândurile de la 10 la 20)
- Faceți clic pe Rulați aplicația butonul din colțul din dreapta sus al panoului sursă
Procesul de analiză
Efectuați următorii pași pentru a face o listă de termeni GO semnificativi, care descriu funcțiile biologice care conduc diferențele de expresie a genelor în experimentul dvs.
- Încărcați datele și faceți clic Executați analiza
- Examinați setările inițiale de pe Analiză fila
- Explorați datele și rezultatele inițiale pentru fiecare nivel de ontologie
- Ajustați setările P-Value, Algoritm sau Test Statistic și faceți clic Analiza de actualizare
- Creați o listă organizată de termeni GO repetând pașii 3 și 4
- Descărcați lista curată a termenilor GO
1. Încărcați date
Încărcați datele și faceți clic Executați analiza.


Date de intrare
- Prima casetă de text este Statistică pentru scorul geneticcare este statistica folosită pentru a filtra seturile dvs. de gene pentru a vă concentra asupra genelor interesante (de exemplu, în mod semnificativ DE). În acest tutorial trebuie să setăm acest lucru la FDR.
- A doua casetă de text este Expresie pentru scorul genetic care definește modul de filtrare a setului de gene folosind statistica specificată în prima casetă de text. În acest tutorial trebuie să setăm acest lucru la < 0,05.
- Primul fișier este Tabelul scorurilor genetice care are toate genele detectate în experimentul tău cu scoruri genetice. În acest tutorial, folosim un fișier cu liste de gene tribolium DE.
- Al doilea fișier este Tabelul de mapări cu adnotările de termeni GO pentru experimentul dvs. În acest tutorial, folosim fișierul de adnotări de termeni tribolium GO.
2. Examinați setările inițiale
Examinați setările inițiale de pe Analiză fila.


3. Explorați datele
Explorați datele și rezultatele inițiale pentru fiecare nivel de ontologie (BP, MF sau CC) pe Explorare şi Rezultate file.
Verificați numărul de termeni GO semnificativi pentru fiecare nivel de ontologie de pe Explorare fila. Histograma arată gama de valori p, ceea ce vă permite să vedeți câți termeni GO au fost considerați semnificativi pentru lista dvs. de gene la setările curente de analiză.


Tabelul de Rezultate pentru cei mai importanți termeni GO pe Explorare fila arată cei mai semnificativi termeni GO pentru nivelul ontologiei selectate, care sunt sortați după valoarea p.


Rezultatele analizei funcționale a termenului GO pot fi vizualizate pe Rezultate fila. Graficul cu puncte arată cei mai semnificativi termeni GO pentru fiecare nivel de ontologie.


4. Reglați setările
Ajustați setările P-Value, Algoritm sau Test Statistic și faceți clic Analiza de actualizare.


Filtrarea rezultatelor analizei funcționale
Reglați tăieturile de…
- Scăderea Valoarea P să se concentreze asupra termeni GO cu probabilitate mare
- Schimbarea Algoritm sau Statistica de testare a face ipoteze și teste diferite asupra datelor
Reduceți rezultatele la termenii GO asociați cu funcțiile biologice despre care credeți că conduc diferențele în expresia genelor și care par a fi relevanți pentru experimentul dvs.
Verificați pragul P-Value, algoritmul și statistica de testare prin investigarea termenilor GO rezultați pentru diferitele niveluri de ontologie. O abordare este să căutați în baze de date online (de exemplu, QuickGO) pentru mai multe informații despre termenii semnificativi GO. De asemenea, poate fi util să folosiți instrumente AI pentru a începe explorarea rezultatelor termenului GO.
Verificați setările de analiză
Verificați dacă setările de analiză s-au actualizat uitându-vă la Setări curente de analiză în partea stângă a aplicației.


5. Creați o listă organizată
Creați o listă organizată de termeni GO repetând pașii 3 și 4.
Poate fi necesar să ajustați în mod repetat setările și să inspectați rezultatele analizei funcționale pentru a crea o listă gestionabilă de termeni GO relevanți pentru experimentul dvs.
În plus, poate doriți să reveniți și să ajustați setările de analiză DE pentru a crea un set mai informativ de gene pentru analiza funcțională.
6. Descărcați rezultatele
Descărcați lista curată a termenilor GO.


The Tabelul rezultatelor termenilor GO are toți termenii GO din analiză (semnificativi sau nu) sortați după valoarea p.
The Tabelul rezultatelor semnificative ale termenului GO are toți termenii GO semnificativi din analiză sortați după valoarea p. Acești termeni GO pot fi căutați folosind instrumente de internet sau AI pentru a ajuta la identificarea termenilor relevanți pentru experimentul dvs. Rețineți că este important să verificați rezultatele de la instrumentele AI, deoarece acestea pot raporta funcții eronate pentru termeni.
The Tabelul ID-urilor genelor pentru termenii GO are doar ID-urile genelor pentru fiecare dintre termenii GO, care pot fi utilizate în operațiunile de set pentru a identifica seturi partajate sau unice de gene. Acest tabel poate fi introdus în aplicația freeCount SO pentru a efectua operațiuni stabilite.
