Rfam
Rfam | |
Kategória | biológiai adatbázis |
Licenc | Közkincs |
A Rfam weboldala |
Az Rfam nem kódoló RNS- (ncRNS-) családokról és más strukturált RNS-ekről szóló információt tartalmazó adatbázis. Jelölt, nyílt hozzáférésű adatbázis, melyet a Wellcome Trust Sanger Institute fejlesztett a Janelia Farmmal együttműködve,[1][2][3][4] és jelenleg a European Bioinformatics Institute működteti.[5] Az Rfam a fehérjecsaládokat leíró Pfamhez hasonlóan működik.
A fehérjékkel szemben az ncRNS-ek másodlagos szerkezete hasonló lehet elsődleges szerkezetükben lévő jelentős hasonlóság nélkül. Az Rfam az ncRNS-eket közös ősük alapján sorolja be. E családok többszekvenciás rendezése (MSA) lehetővé teszi a szerkezetük és működésük megismerését, hasonlóan a fehérjecsaládokhoz. Ezen MSA-k hasznos lehet a másodlagos szerkezetről szóló információ hozzáadásával.[4][6]
Használata
[szerkesztés]Az Rfam számos célra használható. Minden ncRNS-család esetén lehetővé teszi a szekvenciahasonlóságok megtekintését és letöltését, a jelölések olvasását és a családtagok eloszlását fajokban. Ezenkívül irodalmi forrásokra és más RNS-adatbázisokra is vannak linkek. Az Rfam ezenkívül hivatkozásokat is biztosít a Wikipédia számára, lehetővé téve a bejegyzések felhasználók általi létrehozását vagy szerkesztését.
Az Rfam felülete lehetővé teszi ncRNS-ek kulcsszó, családnév, genom, ncRNS-szekvencia vagy EMBL-hozzáférésiszám szerinti keresését.[7] Az adatbázis-információ továbbá használható INFERNAL szoftvercsomaggal.[8][9][10] Az INFERNAL továbbá használható az Rfammel szekvenciák vagy teljes genomok ismert ncRNS-ekkel való homológjainak keresésére.
Módszerek
[szerkesztés]Az adatbázisban az elsődleges szekvencia és másodlagos szerkezet MSA által képviselt információi a profilok sztochasztikus kontextusmentes nyelvtanaival (SCFG), más néven kovarianciamodellekkel együtt van jelen. Ezek a Pfamben használt fehérjecsalád-jelölés rejtett Markov-modelljeinek analógjai.[1] Az adatbázis családjait két többszekvenciás egyezés képviseli Stockholm-formátumban és egy SCFG.
Az első MSA a „mag”. Ez kézzel ellenőrzött, az ncRNS-család képviselőit szerkezeti információval együtt tartalmazó MSA. Ezt használják fel SCFG létrehozására, melyet az INFERNAL a további családtagok azonosítására és hozzáadására használ. A hamis pozitívok elkerüléséhez családspecifikus küszöbérték használatos.
A 12. verzióig az Rfam BLAST szűrőlépést használt, mivel a profil-SCFG-k túl számításigényesek voltak. Azonban a későbbi INFERNAL-verziók elég gyorsak,[10] így a BLAST-lépés nem szükséges.[11]
A második MSA a „teljes” elrendezés, és a szekvencia-adatbázis kovarianciamodelles keresésével jön létre. Minden észlelt homológot a modellhez rendeznek az automatikusan előállított teljes elrendezést adva.
Története
[szerkesztés]Az Rfam 1.0 2003-ban jelent meg, és 25 ncRNS-csaláot és 50 000 ncRNS-gént tartalmazott. 2005-ben jelent meg a 379 családban több mint 280 000 gént tartalmazó Rfam 6.1. A 2012 augusztusában megjelent Rfam 11.0 2208, a 2022 novemberében megjelent 14.9 4108 családot tartalmaz.[7]
Fő kiadások és publikációk
[szerkesztés]- 2003 - Rfam: an RNA family database.[1]
- 2005 - Rfam: annotating non-coding RNAs in complete genomes.[2]
- 2008 - The RNA WikiProject: community annotation of RNA families.[6]
- 2008 - Rfam: updates to the RNA families database.[3]
- 2011 - Rfam: Wikipedia, clans and the “decimal” release.[4]
- 2012 - Rfam 11.0: 10 years of RNA families.[12]
- 2014 - Rfam 12.0: updates to the RNA families database. [3]
- 2017 - Rfam 13.0: shifting to a genome-centric resource for non-coding RNA families.[13]
- 2020 - Rfam 14: expanded coverage of metagenomic, viral and microRNA families.[14]
Rfamet használó szoftverek
[szerkesztés]A miRNS-leíró adatbázis 2004-ben jelent meg. Ez ViennaRNA-t használ a miRNS-ek bázispárosodásának előrejelzésére.[15]
A miRBase 2002-ben jelent meg, célja a miRNS és az NGS ismeretének alkalmazása a miRNS-ek stabil, konzisztens elnevezéséhez. A 21. kiadás (2014) 28 645 prekurzor miRNS-t és 35 828 termék miRNS-t tartalmaz 223 fajból.[16]
Az RNAiFold egyéni és Rfam-alapú RNS-ek tervezését teszi lehetővé.[17] Az RNAiFold 1.0 2013-ban, a 2.0 2015-ben jelent meg,[17] a 3.0 2016 januárjában, a 3.1 2016 márciusában.[18]
Problémák
[szerkesztés]- A magasabb szintű eukarióták számos ncRNS-ből származó pszeudogént és ismétlődést tartalmaznak. E nem működő anyagok megkülönböztetése a működő ncRNS-től nehéz.[2]
- A kovarianciamodellek nem modelleznek intronokat.
Jegyzetek
[szerkesztés]- ↑ a b c Griffiths-Jones S, Bateman A, Marshall M, Khanna A, Eddy SR (2003). „Rfam: an RNA family database”. Nucleic Acids Res. 31 (1), 439–41. o. DOI:10.1093/nar/gkg006. PMID 12520045. PMC 165453.
- ↑ a b c Griffiths-Jones S, Moxon S, Marshall M, Khanna A, Eddy SR, Bateman A (2005). „Rfam: annotating non-coding RNAs in complete genomes”. Nucleic Acids Res. 33 (Database issue), D121–4. o. DOI:10.1093/nar/gki081. PMID 15608160. PMC 540035.
- ↑ a b c Gardner PP, Daub J, Tate JG et al. (2008. október 1.). „Rfam: updates to the RNA families database”. Nucleic Acids Research 37 (Database issue), D136–D140. o. DOI:10.1093/nar/gkn766. PMID 18953034. PMC 2686503.
- ↑ a b c Gardner PP, Daub J, Tate J, Moore BL, Osuch IH, Griffiths-Jones S, Finn RD, Nawrocki EP, Kolbe DL, Eddy SR, Bateman A (2011). „Rfam: Wikipedia, clans and the "decimal" release.”. Nucleic Acids Res 39 (Database issue), D141–5. o. DOI:10.1093/nar/gkq1129. PMID 21062808. PMC 3013711.
- ↑ Moving to xfam.org. Xfam Blog. (Hozzáférés: 2014. május 3.)
- ↑ a b Daub J, Gardner PP, Tate J, Ramsköld D, Manske M, Scott WG, Weinberg Z, Griffiths-Jones S, Bateman A (2008. december 1.). „The RNA WikiProject: community annotation of RNA families”. RNA 14 (12), 2462–4. o. DOI:10.1261/rna.1200508. PMID 18945806. PMC 2590952.
- ↑ a b Rfam families. rfam.xfam.org
- ↑ Eddy SR, Durbin R (1994. június 1.). „RNA sequence analysis using covariance models”. Nucleic Acids Research 22 (11), 2079–88. o. DOI:10.1093/nar/22.11.2079. PMID 8029015. PMC 308124.
- ↑ Eddy SR (2002). „A memory-efficient dynamic programming algorithm for optimal alignment of a sequence to an RNA secondary structure”. BMC Bioinformatics 3, 18. o. DOI:10.1186/1471-2105-3-18. PMID 12095421. PMC 119854.
- ↑ a b Nawrocki EP, Eddy SR (2013). „Infernal 1.1: 100-fold faster RNA homology searches”. Bioinformatics 29 (22), 2933–5. o. DOI:10.1093/bioinformatics/btt509. PMID 24008419. PMC 3810854.
- ↑ Nawrocki EP, Burge SW, Bateman A, Daub J, Eberhardt RY, Eddy SR, Floden EW, Gardner PP, Jones TA, Tate J, Finn RD (2015. január 1.). „Rfam 12.0: updates to the RNA families database”. Nucleic Acids Res 43 (Database issue), D130–7. o. DOI:10.1093/nar/gku1063. PMID 25392425. PMC 4383904.
- ↑ Burge SW, Daub J, Eberhardt R, Tate J, Barquist L, Nawrocki EP, Eddy SR, Gardner PP, Bateman A (2013. január 1.). „Rfam 11.0: 10 years of RNA families”. Nucleic Acids Res 41 (Database issue), D226–32. o. DOI:10.1093/nar/gks1005. PMID 23125362. PMC 3531072.
- ↑ Kalvari I, Argasinska J, Quinones-Olvera N, Nawrocki EP, Rivas E, Eddy SR, Bateman A, Finn RD, Petrov AI (2018. január 1.). „Rfam 13.0: shifting to a genome-centric resource for non-coding RNA families”. Nucleic Acids Res 46 (D1), D335–D342. o. DOI:10.1093/nar/gkx1038. PMID 29112718. PMC 5753348.
- ↑ Kalvari I, Nawrocki EP, Ontiveros-Palacios N, Argasinska J, Lamkiewicz K, Marz M, Griffiths-Jones S, Toffano-Nioche C, Gautheret D, Weinberg Z, Rivas E, Eddy SR, Finn RD, Bateman A, Petrov AI (2021. január 1.). „Rfam 14: expanded coverage of metagenomic, viral and microRNA families”. Nucleic Acids Res 49 (D1), D192–D200. o. DOI:10.1093/nar/gkaa1047. PMID 33211869. PMC 7779021.
- ↑ Sam Griffiths-Jones (2004. január 1.). „The microRNA Registry”. Nucleic Acids Res 32 (Database issue), D109–D111. o. DOI:10.1093/nar/gkh023. PMID 14681370. PMC 308757. (Hozzáférés: 2023. november 24.)
- ↑ Alyssa C. Moore, Jonathan S. Winkjer, Tsai Tien Tseng (2015). „Bioinformatics Resources for MicroRNA Discovery”. Biomark Insights 10 (Suppl 4), 53–58. o. PMID 26819547. PMC 4718083. (Hozzáférés: 2023. november 24.)
- ↑ a b Juan Antonio Garcia-Martin, Ivan Dotu, Peter Clote (2015. július 1.). „RNAiFold 2.0: a web server and software to design custom and Rfam-based RNA molecules”. Nucleic Acids Res 43 (Web Server issue), W513–W521. o. DOI:10.1093/nar/gkv460. PMID 26019176. PMC 4489274. (Hozzáférés: 2023. november 24.)
- ↑ Juan Antonio Garcia-Martin: Github - clotelab/RNAiFold: A constraint programming algorithm for RNA inverse folding and molecular design
Fordítás
[szerkesztés]Ez a szócikk részben vagy egészben a Rfam című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.