Pfam
Pfam ialah pangkalan data keluarga protein yang merangkumi anotasi protein serta penjajaran jujukan berbilang yang dijana menggunakan model Markov tersembunyi.[1][2][3] Versi terbaharu, Pfam 36.0, telah dikeluarkan pada September 2023 dan mengandungi 20,795 keluarga.[4]
Pfam | |
---|---|
Kandungan | |
Perihalan | Pangkalan data Pfam menyediakan penjajaran dan model Markov tersembunyi untuk domain protein. |
Jenis data diperoleh | Keluarga protein |
Organisma | semua |
Perhubungan | |
Pusat penyelidikan | EBI |
Kutipan utama | PubMed |
Bahasa | Bahasa Inggeris |
Capaian | |
Format data | Format Stockholm |
Tapak web | www |
URL muat turun | FTP |
Teknikal | |
Lesen | Lesen Awam Am Lemah GNU |
Versi | 36.0 |
Entiti penanda | ya |
sunting · sunting di Wikidata |
Kegunaan
suntingTujuan umum pangkalan data Pfam adalah untuk menyediakan klasifikasi keluarga dan domain protein yang lengkap dan tepat.[5] Pada asalnya tujuan di sebalik penciptaan pangkalan data adalah untuk mewujudkan kaedah separa automatik untuk menyusun maklumat mengenai keluarga protein yang diketahui untuk meningkatkan kecekapan penganotasian genom.[6] Klasifikasi keluarga protein Pfam telah diterima pakai secara meluas oleh ahli biologi kerana liputan luas protein dan konvensyen penamaan yang wajar.[7]
Pangkalan data ini digunakan oleh ahli biologi eksperimen yang menyelidik protein tertentu, digunakan oleh ahli biologi struktur untuk mengenal pasti sasaran baharu untuk penentuan struktur protein, digunakan oleh ahli biologi pengkomputeran untuk mengatur jujukan, serta digunakan oleh ahli biologi evolusi yang menjejak asal usul protein.[8] Projek-projek genom awal yang melibatkan manusia dan lalat menggunakan Pfam secara meluas untuk anotasi fungsi data genom.[9][10][11]
Laman web Pfam membenarkan pengguna menyerahkan urutan protein atau DNA untuk mencari padanan keluarga protein itu dalam pangkalan data. Jika jujukan DNA yang diserahkan, terjemahan enam rangka dilakukan, kemudian setiap rangka bacaan dicari.[12] Daripada melakukan carian BLAST biasa, Pfam menggunakan model Markov tersembunyi berprofil, yang mengutamakan padanan di tapak yang terpelihara jujukannya, membolehkan pengesanan homologi dengan jauh lebih baik, menjadikannya lebih sesuai untuk menganotasi genom organisma yang tiada saudara terdekat yang beranotasi dengan baik.[13]
Pfam juga telah digunakan dalam penciptaan sumber lain seperti iPfam, yang mengkatalogkan interaksi domain-domain dalam dan antara protein, berdasarkan maklumat dalam pangkalan data struktur dan pemetaan domain Pfam pada struktur tersebut.[14]
Rujukan
sunting- ^ "The Pfam protein families database". Nucleic Acids Res. 36 (Database issue): D281–8. 2008. doi:10.1093/nar/gkm960. PMC 2238907. PMID 18039703.
- ^ Finn, R. D.; Mistry, J.; Schuster-Böckler, B.; Griffiths-Jones, S.; Hollich, V.; Lassmann, T.; Moxon, S.; Marshall, M.; Khanna, A. (Jan 2006). "Pfam: clans, web tools and services" (Free full text). Nucleic Acids Research. 34 (Database issue): D247–D251. doi:10.1093/nar/gkj149. ISSN 0305-1048. PMC 1347511. PMID 16381856.
- ^ Bateman, A.; Coin, L.; Durbin, R.; Finn, R. D.; Hollich, V.; Griffiths-Jones, S.; Khanna, A.; Marshall, M.; Moxon, S. (2004). "The Pfam protein families database". Nucleic Acids Research. 32 (Database issue): 138D–1141. doi:10.1093/nar/gkh121. ISSN 0305-1048. PMC 308855. PMID 14681378.
- ^ "Pfam 36.0 release". Xfam Blog. 2023-09-18. Dicapai pada 2023-11-24.
- ^ Sammut, Stephen; Finn, Robert D.; Bateman, Alex (2008). "Pfam 10 years on: 10 000 families and still growing". Briefings in Bioinformatics. 9 (3): 210–219. doi:10.1093/bib/bbn010. PMID 18344544.
- ^ Sonnhammer, Erik L.L.; Eddy, Sean R.; Durbin, Richard (1997). "Pfam: A Comprehensive Database of Protein Domain Families Based on Seed Alignments". Proteins. 28 (3): 405–420. doi:10.1002/(sici)1097-0134(199707)28:3<405::aid-prot10>3.0.co;2-l. PMID 9223186.
- ^ Xu, Qifang; Dunbrack, Roland L. (2012). "Assignment of protein sequences to existing domain and family classification systems: Pfam and the PDB". Bioinformatics. 28 (21): 2763–2772. doi:10.1093/bioinformatics/bts533. PMC 3476341. PMID 22942020.
- ^ Finn, R. D.; Mistry, J.; Tate, J.; Coggill, P.; Heger, A.; Pollington, J. E.; Gavin, O. L.; Gunasekaran, P.; Ceric, G. (2009). "The Pfam protein families database". Nucleic Acids Research. 38 (Database): D211–D222. doi:10.1093/nar/gkp985. ISSN 0305-1048. PMC 2808889. PMID 19920124.
- ^ "The Pfam protein families database". Nucleic Acids Res. 30 (1): 276–80. 2002. doi:10.1093/nar/30.1.276. PMC 99071. PMID 11752314.
- ^ "The genome sequence of Drosophila melanogaster". Science. 287 (5461): 2185–95. 2000. Bibcode:2000Sci...287.2185.. CiteSeerX 10.1.1.549.8639. doi:10.1126/science.287.5461.2185. PMID 10731132. Unknown parameter
|displayauthors=
ignored (bantuan) - ^ Lander, Eric S.; Linton, Lauren M.; Birren, Bruce; Nusbaum, Chad; Zody, Michael C.; Baldwin, Jennifer; Devon, Keri; Dewar, Ken; Doyle, Michael (2001). "Initial sequencing and analysis of the human genome". Nature. 409 (6822): 860–921. doi:10.1038/35057062. ISSN 0028-0836. PMID 11237011. Unknown parameter
|displayauthors=
ignored (bantuan);|hdl-access=
requires|hdl=
(bantuan) - ^ Finn, Robert D.; Bateman, Alex; Clements, Jody; Coggill, Penelope; Eberhardt, Ruth Y.; Eddy, Sean R.; Heger, Andreas; Hetherington, Kirstie; Holm, Liisa (2014). "Pfam: the protein families database". Nucleic Acids Research. 42 (D1): D222–D230. doi:10.1093/nar/gkt1223. ISSN 0305-1048. PMC 3965110. PMID 24288371.
- ^ "Pfam: multiple sequence alignments and HMM-profiles of protein domains". Nucleic Acids Res. 26 (1): 320–2. 1998. doi:10.1093/nar/26.1.320. PMC 147209. PMID 9399864.
- ^ Finn, R. D.; Marshall, M.; Bateman, A. (2004). "iPfam: visualization of protein-protein interactions in PDB at domain and amino acid resolutions". Bioinformatics. 21 (3): 410–412. doi:10.1093/bioinformatics/bti011. ISSN 1367-4803. PMID 15353450.