利用者:にゃむ/タンパク質Infobox/使い方
このページではInfobox 蛋白質の項目の作成方法について記述します。使用例はInfobox 蛋白質/使用例の他、Infobox 蛋白質ページの「ツールボックス」にある「リンク元」をクリックして実際の使用例を見ることもできます。まず簡便な項目の入力の仕方について説明した後、それぞれの入力項目の内容について説明します。
項目の調べ方と入力の仕方
[編集]入力項目が多く、また専門的な項目もありますので、いきなり全て埋めるのは無理です。ただし、必須の入力項目は「名前」と「英語名」だけですので、不明な項目はどんどん空欄にしておいてください。
英語項目から翻訳する
[編集]この日本語版「蛋白質 Infobox」は英語版en:Template:Protboxの翻訳、改訂版ですので、英語の項目がありそこでProtboxが使われていれば、そこから項目を引いてくることができます。ただし英語版と日本語版は1:1で対応しませんので、その対応関係を以下に示します('='の右側が英語版の対応項目)。なお、英語版のいくつかの項目(Reviewなど)は、日本語版にはありません
{{Infobox 蛋白質 |名前 = (和名のため、対応項目なし) |画像 = Photo |キャプション = Caption |英語名 = Name |略称 = (対応項目なし; Symbolがあればそれを入れてください) |別名 = (対応項目なし) |HGNCid = HGNCid |HGNCSymbol = Symbol (AltSymbolsは今のところ日本語版にはありません) |EntrezGene = EntrezGene |OMIM = OMIM |RefSeq = RefSeq |UniProt = UniProt |PDBid = PDB |EC番号 = ECnumber |染色体番号 = Chromosome |遺伝子座 = ※1 |遺伝子名 = Gene |種名 = (対応項目なし) |遺伝子の種類 = Gene_type |アミノ酸長 = Protein_length |分子量 = Molecular_weight |立体構造 = Structure |蛋白質の種類 = Type |蛋白質の機能 = Functions |ドメイン = Domains |モチーフ = Motifs |アイソザイム = Alternative_products |触媒反応 = Catalytic_activity |補因子 = Cofactors |活性調節 = Enzyme_regulation |Km = Km |Km注 = (対応項目なし。種名、基質などはこちらへ) |Vmax = Vmax |Vmax注 = (対応項目なし。種名、基質など) |病気 = Diseases |医薬品 = Pharmaceuticals |バイオテクノロジー = Biotechnology |分布(タクソン) = Taxa |発現部位 = Cells |局在 = Location |修飾 = Mods |代謝経路 = Pathways |相互作用 = Interactions |その他 = (対応項目なし) |作用(受容体またはリガンド) = Actions |アゴニスト = Agonists |アンタゴニスト = Antagonists }}
※1: Chromosome, Arm, Band, LocusSupplementaryDataをスペースなしでつなげて入れてください(Chromosome=7, Arm=p, Band=13, LocusSupplementaryData=-p11.2なら'7p13-p11.2')
調べながら入力
[編集]新たに項目を起こす場合の調べ方と入力の一例を示します。かならずしもこのやり方に沿う必要はありませんが、どこから手をつけようと思っておられるのなら参考になるはずです。
まず、生物種を決定し、遺伝子を調べます。同じ種類の蛋白質でも生物種が異なれば働きや細かなデータが異なってくることがあります。原則としてヒトに存在する蛋白質についてはヒトのデータを入力するようにしてください。まずHGNC(Human Genome Organization 遺伝子命名委員会)にある「Quick Search」を使って該当の蛋白質をコードしている遺伝子が無いか調べます。うまく見つけられれば、ここでかなりの項目を入力できるはずです。入力できる項目とHGNCのWebサイトにある項目の対応関係を下に示します。
|英語名 = Approved Name |略称 = Approved Symbol |HGNCid = HGNC ID (':'以降の数字の部分のみ) |HGNCSymbol = Approved Symbol |EntrezGene = Entrez Gene ID |OMIM = OMIM ID |RefSeq = RefSeq |UniProt = UniProt ID |EC番号 = Enzyme IDs |染色体番号 = Chromosomeの先端の数字('22q11.1'なら'22') |遺伝子座 = Chromosome |種名 = (ヒトについて項目を分けてある都合上、なにも記入しないでください)
ヒトに存在しない蛋白質の場合はEntrez Geneから遺伝子を調べます。データが見つかったら以下の項目を入力します。下の項目で()で示したのは、Enterz Geneのセクション('Summary', 'Bibliography'など)を示します。下に示した全ての項目が存在するとは限りません。 次にUniprotで同様に遺伝子をサーチして、同様に項目を入力します。
[Entrez Geneで入力できる項目] |英語名 = 一番上にある太字で書かれた遺伝子の名前 |略称 = 英語名の左にある記号 |EntrezGene = GeneID |RefSeq = (NCBI Reference Sequences (RefSeq)) Product |UniProt = (Related Sequences) Protein Accession |EC番号 = (General protein information)に'ECx.x.x.x'があれば'x.x.x.x'の部分 |遺伝子名 = (Summary) Gene name |種名 = (Summary) Organism |遺伝子の種類 = (Summary) Gene type [Uniprotで入力できる項目] Entry informationから |UniProt = Primary accession number Cross-referencesから |PDBid = PDBの項目にある「数字とアルファベットからなる4文字のID」 Sequence informationから |アミノ酸長 = Length (数字のみ) |分子量 = Molecular weight (数字のみ)
残りの項目は、例えばEntrez Geneの'General gene information'の欄やUniprotの'Comments'欄などを参照して埋めてください。文章になっているところはそのまま引用とはせずに、自分なりの文章になおして記入して頂くようお願いします。
各項目の説明
[編集]Infoboxの各入力項目について説明します。入力欄には大区分はありませんが、わかりやすくするため、実際のboxでの大区分に沿って説明します。
名前等
[編集]|名前 = |画像 = |キャプション = |英語名 = |略称 = |別名 =
名前
[編集]現在広く認められている名前(和名)を記入してください。名称が変更されている場合は、変更前の名称を「別名」欄に記入してください。
画像・キャプション
[編集]その蛋白質に関連する画像を入力します。その蛋白質の立体構造などがこれにあたります。ウィキメディア・コモンズに登録された画像のファイル名を入力してください。画像に関する説明文をキャプションに入力します。
英語名
[編集]現在広く認められている名前を記入してください。HGNC(Human Genome Organization 遺伝子命名委員会)の'Approved Name'や、Uniprotでの'Protein Name'が参考になります。
略称
[編集]広く認められている略称・略号を入力します。HGNCのApproved Symbolなどがこれにあたります。
別名
[編集]名称が変更されたものの現在も広く使われている名称を入力してください。
遺伝子(ヒト)
[編集]ヒト遺伝子専用の項目です。他の生物種のデータを入力する場合は空欄にしてください。
|染色体番号 = |遺伝子座 =
染色体番号
[編集]ヒト染色体上で、どの染色体に存在するかを記入してください。下の「遺伝子座」が分かっている場合は、先頭の一桁ないし二桁の数字です。
遺伝子座
[編集]ヒト染色体上の位置を示します。'5p11.2'などの記号です。(英語版では、Chromosome, Arm, Band, LocusSupplementaryDataと分かれていますが、日本語版では一つにまとめてあります)
遺伝子
[編集]全ての種に共通する(種名を除く)項目です。
|遺伝子名 = |種名 = |遺伝子の種類 =
遺伝子名
[編集]その遺伝子の名前です。UniprotやEntrez Geneでの'Gene Name'にあたります。
種名
[編集]Escherichia coli等、その遺伝子を持つ種の名前です。 Uniprotでは'From',Entrez Geneでは'Organism'にあたります。
遺伝子の種類
[編集]遺伝子の種類を示します。「蛋白質コード」「偽遺伝子」「RNA遺伝子」などがありますが、蛋白質の項目である以上普通は「蛋白質コード」のはずです。不明なら無視してください。
基礎データ
[編集]その蛋白質に関する基礎データです。「遺伝子」の項で記述した種の蛋白質について、それぞれの項目に入力してください。種によって異なる項目は()付きで注をつけておくとわかりやすいと思います。下の各項目につけたリストは記入例です。
|分布(タクソン) = |発現部位 = |局在 = |修飾 = |代謝経路 = |相互作用 = |アミノ酸長 = |分子量 = |立体構造 = |蛋白質の種類 = |蛋白質の機能 = |アイソザイム =
分布(タクソン)
[編集]その蛋白質がどういった生物に存在するかを文章で記入します。
- ヒト
- 哺乳類
- 動物
- 嫌気呼吸を行う生物
- …
発現部位
[編集]その蛋白質が主に発現している組織や細胞を記入します。
- 感覚器官
- 肝臓
- …
局在
[編集]蛋白質が細胞のどこに局在するかを記入します。
- 細胞質
- 細胞外
- 核内
- ペリプラズム領域
- …
修飾
[編集]蛋白質の翻訳後修飾について記述します。
- 糖鎖付加(N-グリコシル化、O-グリコシル化)
- 蛋白質消化(自己消化、プロテアーゼによる活性化など)
- …
代謝経路
[編集]蛋白質が関与する代謝経路を記述します。Entrez Geneの'General gene information'欄にはその蛋白質が関与するKEGGのパスウェイの一覧がありますから、そこから引っ張ってくるのもいいでしょう。クエン酸回路などの有名な回路については日本語版Wikipediaの項目へリンクするのを忘れずに。
- クエン酸回路
- グルタミン酸代謝
- カルビン・ベンソン回路
- …
相互作用
[編集]相互作用している主要な蛋白質などを記入します。
アミノ酸長
[編集]蛋白質のアミノ酸の長さを数字のみで記入します。「77」と記入すれば、Infoboxの「長さ」欄には「77 (アミノ酸)」と表示されます。
分子量
[編集]蛋白質の分子量を数字のみで記入します(分子量にはそもそも単位がない)。Infoboxの欄は「分子式量」となっていて、「分子量」を「11345」と記入すれば「分子式量」欄には「11345 (Da)」と表示されます。
蛋白質の種類
[編集]蛋白質の種類を記入します。階層的に記入しておくとわかりやすいと思います。
- 酵素; 脱水素酵素
- ホルモン; インシュリンファミリー
- …
蛋白質の機能
[編集]蛋白質の機能を記入します。Infoboxはあくまでも表ですので、簡潔に記述できる場合にのみ使ってください。そうでない場合は本文に記入する方がいいと思われます。
アイソザイム
[編集]アイソザイムなどが存在する場合に文章で記入します。
以下執筆中