「蛋白質構造データバンク」の版間の差分
→統計情報: グラフ追加 |
m cewbot: 修正ウィキ文法 38: HTMLの<i>タグの使用 |
||
10行目: | 10行目: | ||
1998年に、PDBの管理は同研究所から[http://home.rcsb.org/ 構造バイオインフォマティクス研究共同体] (RCSB; Research Collaboratory for Structural Bioinformatics) に移管され、同研究共同体 (RCSB) のプロジェクトの一つとなった。 |
1998年に、PDBの管理は同研究所から[http://home.rcsb.org/ 構造バイオインフォマティクス研究共同体] (RCSB; Research Collaboratory for Structural Bioinformatics) に移管され、同研究共同体 (RCSB) のプロジェクトの一つとなった。 |
||
<div id="wwPDB"> |
<div id="wwPDB"> |
||
2003年、RCSBを含む次の3つの研究組織により、[http://www.wwpdb.org/ Worldwide Protein Data Bank] (wwPDB) が結成され、PDBのデータの登録、データの処理、配布を行っている。2006年には生体分子磁気共鳴データバンク(BMRB)もメンバーに加わり、現在は4つの組織で運営されている<ref>Helen M. Berman, Gerard J. Kleywegt, Haruki Nakamura, John L. Markley,"The Protein Data Bank at 40: Reflecting on the Past to Prepare for the Future" (2012) |
2003年、RCSBを含む次の3つの研究組織により、[http://www.wwpdb.org/ Worldwide Protein Data Bank] (wwPDB) が結成され、PDBのデータの登録、データの処理、配布を行っている。2006年には生体分子磁気共鳴データバンク(BMRB)もメンバーに加わり、現在は4つの組織で運営されている<ref>Helen M. Berman, Gerard J. Kleywegt, Haruki Nakamura, John L. Markley,"The Protein Data Bank at 40: Reflecting on the Past to Prepare for the Future" (2012) ''Structure'' <b>20</b> pp391-396 [http://dx.doi.org/10.1016/j.str.2012.01.010 doi:10.1016/j.str.2012.01.010]</ref>。 |
||
* 日本:[http://pdbj.org/ 日本蛋白質構造データバンク (PDBj)] |
* 日本:[http://pdbj.org/ 日本蛋白質構造データバンク (PDBj)] |
||
* 米国:[http://www.pdb.org/ 構造バイオインフォマティクス研究共同体 (RCSB PDB)] |
* 米国:[http://www.pdb.org/ 構造バイオインフォマティクス研究共同体 (RCSB PDB)] |
2016年11月15日 (火) 14:50時点における版
蛋白質構造データバンク(たんぱくしつこうぞうデータバンク、PDB; Protein Data Bank)は、蛋白質(タンパク質)と核酸の3次元構造の構造座標(立体配座)を蓄積している国際的な公共のデータベースである。PDBに蓄積されている構造データは、X線結晶解析法、NMR法(核磁気共鳴法)などによって実験的に決定されたデータである。なお、理論的な予測(蛋白質構造予測)で推定されたデータは蓄積していない。
世界中の生物学者や生化学者たちが、PDBに構造データを登録する。PDBに登録されたデータはパブリックドメインのもとで公開され、誰もが無償でアクセスすることができる。日本では大阪大学蛋白質研究所にその支所がある。
PDBは、生物学的構造データの中心的なデータベースである。構造生物学の研究で欠かせない情報源であり、また近年では構造ゲノミクスの研究でも重要なデータベースである。バイオインフォマティクスの研究でも、PDBに代表される3次元分子構造データベースは重要な研究対象である。PDBから派生したデータベースとプロジェクトは非常に多く、蛋白質の構造、機能、進化のそれぞれの側面から、PDBの構造データの統合や分類を行っている。
歴史
1971年に、アメリカ合衆国のブルックヘブン国立研究所がPDBを設立した。 1998年に、PDBの管理は同研究所から構造バイオインフォマティクス研究共同体 (RCSB; Research Collaboratory for Structural Bioinformatics) に移管され、同研究共同体 (RCSB) のプロジェクトの一つとなった。
2003年、RCSBを含む次の3つの研究組織により、Worldwide Protein Data Bank (wwPDB) が結成され、PDBのデータの登録、データの処理、配布を行っている。2006年には生体分子磁気共鳴データバンク(BMRB)もメンバーに加わり、現在は4つの組織で運営されている[1]。
- 日本:日本蛋白質構造データバンク (PDBj)
- 米国:構造バイオインフォマティクス研究共同体 (RCSB PDB)
- 英国:欧州蛋白質構造データバンク (PDBe)
- 米国:生体分子磁気共鳴データバンク(BMRB)
wwPDBの役割は、PDBの生体高分子の3次元構造を蓄積した単一のデータベースの保守と、PDBデータベースを世界中の研究者コミュニティに無償で公開し利用できるようにすることである。
構造データの増加
PDBが設立された当初、データベースが含む蛋白質の3次元構造は7つであったが、その後、データベースに登録される構造データ数はほぼ指数関数的に急激に増え、この増加傾向が衰える兆しは無い。
PDBのデータの増加ペースは、多くの人々により分析の対象となっている。
構造データの内容
2008年1月22日現在の時点で、PDBのデータベースでは48555構造の分子の3次元構造のデータが公開されている。 そのうち44742構造が蛋白質であり、他には核酸、蛋白質核酸複合体、その他の分子構造が、登録されている。 ここ数年は、毎年約5000の新しい構造データが登録され公開されている。 構造データは、mmCIFという分子構造データを記述するために開発された形式で、格納されている。
注意すべきこととしては、PDBは生体高分子を構成する各原子の厳密な配座の情報を格納しているということである(ただし水素以外の原子については、多くの場合は統計的に配座を推定している)。
例えば生体高分子のシーケンスデータ(特定の蛋白質を生成するための情報を記述したアミノ酸配列や、特定の核酸を構成するヌクレオチド配列)のみに関心がある場合は、Swiss-Protや国際塩基配列データベース (INSD; International Nucleotide Sequence Database; DDBJ/EMBL/GenBank) の、PDBよりさらに大規模な配列データベースを使うべきである。
統計情報
2014年6月3日現在、RCSBのページでは、次の統計情報を公開している。
解析手法 | 蛋白質 | 核酸 | 蛋白質核酸複合体 | その他 | 合計 |
---|---|---|---|---|---|
X線結晶解析法 | 83314 | 1529 | 4346 | 4 | 89193 |
NMR法 | 9182 | 1082 | 210 | 7 | 10481 |
電子顕微鏡 | 548 | 54 | 174 | 0 | 776 |
複合手法 | 59 | 3 | 2 | 1 | 65 |
その他 | 155 | 4 | 6 | 13 | 178 |
合計 | 93258 | 2672 | 4738 | 25 | 100693 |
PDBの蛋白質データのうち、
- 78747件の構造は構造因子ファイルを持つ。
- 7795件の構造はNMR束縛ファイルを持つ。
- 1553件の構造は化学シフトファイルを持つ。
- 738件の構造は3次元電子顕微鏡マップファイルを持つ。
注意: 蛋白質構造予測により理論的に推定されたモデルは統計に含まれていない(2002年7月2日より前までは含まれていた)。
PDBの統計情報のページは毎週更新されている。
ファイル形式
PDBの3次元構造データのファイル形式は、頻繁な変更と改訂を経ている。 もともとのファイル形式は、コンピュータのパンチカードの幅の制約に従っていた。
- ブルックヘブン国立研究所のスタッフによるPDBファイル形式ガイド PDBファイル形式の仕様を読むことができる。未加工の構造データを見る場合は、事前に読んでおくとよい。
- PDBでは、最近はPDBデータをXML形式でも提供している(PDBML形式)。
- ftp.rcsb.org 未加工のPDBデータをダウンロードできる。
- PDB統計 PDBに関する統計情報を提供している。
従来のファイル形式には多くの問題が伴うため、いくつかの「清掃」プロジェクトが行われている。
MMDBは、ASN.1形式を採用しており、またASN.1形式をXMLに変換した形式でも提供している。 wwPDBは、先述したように、RCSB PDB、MSD-EBI、PDBj の3つの組織により構成されており、それぞれの組織のデータベースをまたがって一貫した形式でデータを提供している。
一定の人々は、こうした状況を肯定的に認識している。 別の人々は、構造データを共通のデータベースで利用できなければ、生体高分子の構造に関する問題について研究者間の会話が成り立たないと、考えている。
PDBから提供される構造データには、それぞれ PDB ID という4文字のアルファベットからなる識別子が、割り当てられている。 PDB ID は、生体高分子の識別子として使うことはできない。 なぜなら、同じ一つの分子が環境/状況に応じて異なる複数の3次元構造をとるということが、蛋白質などの分子ではよくあるためである。 その場合、一つの分子がそのとり得る構造ごとに、複数の PDB ID を割り当てられる。
wwPDBでは、生物学者により蛋白質や核酸の構造データが登録されると、wwPDBのスタッフがその構造データを検証し注釈(アノテーション)をつける。 その後、データはソフトウェアにより妥当性を検証される。 この妥当性検証ソフトウェアのソースコードは、無償で公開されている。 先述したとおり、wwPDBでも、実験的に決定された構造データの登録のみを受け付け、蛋白質構造予測により理論的に推定された構造データは受け付けていない。
現在、さまざまな配分機関や自然科学系学術雑誌が、自分たちが関わって決定した構造データをPDBに登録する科学者を必要としている。
構造データを見る
PDBの3次元構造データは、生体物質を視覚化するソフトウェアを使って見ることができる。 このようなソフトウェアをいくつか示す。
- RasMol: Roger Sayle により開発された。
- Jmol: Javaで開発された。ウェブページ内でJavaアプレットとして使うこともできる。
- PyMOL: Pythonで開発された。
- Chime: ウェブブラウザのプラグインとして使うことができる。
- ウェブブラウザ VRMLプラグイン
- STING: ブラジルの Structural Bioinformatics Group により開発された。蛋白質構造の分析機能を備える。
- jV: 日本蛋白質構造データバンク(PDBj)の活動の一つとして Javaで開発された。ウェブページ内でJavaアプレットとして使うこともできる。
構造バイオインフォマティクス研究共同体 (RCSB PDB) のウェブサイトではまた、教育や構造ゲノミクスに関するリソース、および関連するソフトウェアを、提供している。
参考資料
論文
- H.M. Berman, K. Henrick, H. Nakamura (2003): Announcing the worldwide Protein Data Bank. Nature Structural Biology 10 (12), p. 980 PMID 14634627.
- H.M. Berman, J. Westbrook, Z. Feng, G. Gilliland, T.N. Bhat, H. Weissig, I.N. Shindyalov, P.E. Bourne: The Protein Data Bank. Nucleic Acids Research, 28 pp. 235-242 (2000). PMID 10592235
- Bernstein FC, Koetzle TF, Williams GJ, Meyer Jr EF, Brice MD, Rodgers JR, Kennard O, Shimanouchi T, Tasumi M. The Protein Data Bank: a computer-based archival file for macromolecular structures. J Mol Biol 1977;112:535-542. PMID 875032.
- Sussman, JL, Lin, D, Jiang, J, Manning, NO, Prilusky, J, Ritter, O & Abola, EE. Protein data bank (PDB): a database of 3D structural information of biological macromolecules. Acta Cryst 1998; D54:1078-1084. PMID 10089483.
オンライン
外部リンク
- 構造バイオインフォマティクス研究共同体 (RCSB PDB)
- 欧州蛋白質構造データバンク (PDBe)
- 欧州バイオインフォマティクス研究所PDB要約 (PDBsum)
- 日本蛋白質構造データバンク (PDBj)
酵素データベース
- BRENDA 酵素データベースポータル
- PDBSProtEC
- Catalytic Site Atlas (CSA) 酵素触媒残基データベース
- MACiE 酵素反応データベース
- EzCatDB 酵素触媒機構データベース
- Enzyme Structures Database (PDBsum EC⇒PDB)酵素構造データベース
構造データの視覚化ソフトウェア
その他
- ExPASy - Swiss-Prot と TrEMBL
- 国際塩基配列データベース (INSD) - DDBJ/EMBL/GenBankが共同で提供している国際的な核酸の塩基配列データベース
- ^ Helen M. Berman, Gerard J. Kleywegt, Haruki Nakamura, John L. Markley,"The Protein Data Bank at 40: Reflecting on the Past to Prepare for the Future" (2012) Structure 20 pp391-396 doi:10.1016/j.str.2012.01.010