FAM214A

ホモサピエンスにおけるタンパク質コード遺伝子
FAM214A
識別子
エイリアスFAM214A、KIAA1370、配列類似性214のメンバーAを持つファミリー
外部IDMGI : 2387648; HomoloGene : 35065; GeneCards : FAM214A; OMA :FAM214A - オルソログ
オルソログ
人間ねずみ
エントレズ
アンサンブル
ユニプロット
RefSeq (mRNA)

NM_001286495
NM_019600

NM_001113283
NM_153584
NM_001359816

RefSeq(タンパク質)

NP_001273424
NP_062546

NP_001106754
NP_705812
NP_001346745

場所(UCSC)15章: 52.58 – 52.71 Mb9章: 74.86 – 74.94 Mb
PubMed検索[3][4]
ウィキデータ
人間の表示/編集マウスの表示/編集

タンパク質FAM214Aは、配列類似性214を持つタンパク質ファミリーA(FAM214A)としても知られ、ヒトではFAM214A遺伝子によってコードされるタンパク質です。FAM214Aは、染色体15(ヒト)のq21.2-q21.3遺伝子座に存在する機能不明の遺伝子です[5]この遺伝子のタンパク質産物には2つの保存されたドメインがあり、1つは機能不明(DUF4210)で、もう1つはChromosome_Segと呼ばれています。[6] FAM214Aタンパク質の機能は未解明ですが、DUF4210とChromosome_Segはどちらも減数分裂中の染色体分離に関与すると予測されています。[7]

遺伝子

概要

FAM214A 遺伝子、15番染色体のマイナスDNA鎖(センス(分子生物学)を参照)の位置52,873,514と53,002,014の間に位置し、そのため遺伝子の長さは97,303塩基対(bp)となる。[5] [8] [9] FAM214Aはこれまで、KIAA1370とFLJ10980という2つの別名で呼ばれていた。[5] FAM214A遺伝子には、転写後に最終的な4231 bpのmRNA転写産物を構成する12のエクソンが含まれると予測されている[10]このmRNA産物がプロモーター配列と転写因子の助けを借りて最終的なFAM214Aタンパク質に翻訳される。FAM214A mRNA配列のプロモーターは、GenomatixのEl Doradoプログラムによって予測され、分析された。[11]このプロモーターは601塩基対の長さで、5' UTRの一部にまたがっています。[11]

15番染色体上のFAM214Aの位置[5]
15番染色体上のイントロンエクソンを含むFAM214A遺伝子の図[9]

遺伝子発現

FAM214Aの発現データはGene Cards [12]から得られたものである。

BioGPSやExpression Atlasなどの多くの情報源によると、FAM214Aは低レベルで普遍的に(あるいはほぼ普遍的に)発現していると考えられています。[12] [13] [14]下記のBioGPS画像に見られるように、免疫関連細胞および組織では有意に高い発現レベルが見られ、免疫における役割を示唆しています。しかしながら、この主張を裏付ける具体的なin situでの証拠は未だ得られていません。発現データは、幅広い遺伝子を対象とした多数の研究から収集されているため、一部のデータには矛盾する性質があります。

BioGPSから得られたFAM214Aの発現データ[13]

タンパク質

概要

FAM214A タンパク質のヒトにおける機能はまだ不明です。しかし、遺伝子オントロジーには、このタンパク質の機能を説明する「生物学的プロセス」、「細胞成分」、および「分子機能」という3つの機能用語の関連付けがあり、生体内での主要な機能の意味合いを予測しています。[15] [16] FAM214Aのタンパク質産物は1076個のアミノ酸(aa)で構成され、分子量は121,700ダルトンと予測されており等電点はpH 7.7付近です。 [6] [17] [18]このタンパク質は、シグナルペプチド配列が欠如していることと、プログラムPSORTIIの予測に基づいて、転写後に核内に残留すると予測されています。[19]選択的スプライシングにより、他の2つのアイソフォーム(Q32MH5-2とQ32MH5-3)が観察されています。これらは主要な産物とはわずかに異なります。[20] アイソフォーム2は、塩基960-960から4つの異なるアミノ酸を持ち、配列の末端が欠落しています。塩基964-1076から。[20]アイソフォーム3には、メチオニンの後の配列の先頭に7つの余分なアミノ酸が追加されています。[20]

FAM214Aタンパク質は、翻訳後、PSORT IIの複数のサブプログラムによって核内に留まると予測されます。[19]このタンパク質は、残基709から始まる2つの「古典的な」核局在シグナル(NLS)の1つであるpat4シグナルを持ちます。 [21] 2つ目の「古典的な」NLSであるpat7も、「非古典的な」二分NLSも持ちませんが、NCNNスコアによって核に局在すると予測されます。[21] [22] このスコアは、アミノ酸配列に基づいて、タンパク質が核に局在するか細胞質に局在するかを予測します。[21] [22] FAM214Aタンパク質の場合、NCNNスコアは94.1%の確度で核局在を予測しました。[21] [22] この情報に基づいて、PSORTはタンパク質の細胞内局在の全体的な予測を生成します。 FAM214Aの場合、予測値は核では69.6%であったのに対し、ミトコンドリアでは13.0%、細胞質では8.7%、分泌小胞と小胞体では4.3%であった。[19]

翻訳後修飾

FAM214Aタンパク質内に発見された予測リン酸化部位[23]

このタンパク質は、ExPASyウェブサーバー上のNetNGlycとNetOGlycによって予測されたシグナルペプチド配列の欠如により、有意な数の翻訳後修飾を受けない可能性が高い。[24] [25] これは、翻訳後修飾を行う細胞内機構の多くが、タンパク質が小胞体ゴルジ体などの細胞小器官を通過することを必要とするためである。シグナルペプチド配列がなければ、タンパク質は一般的に核から出ることはなく、これは前述のPSORT IIによって予測された。[19]

このタンパク質のSAPS分析をswp23s.qデータベースに対して行ったところ、このタンパク質には異常に多くのセリンアミノ酸と異常に少ないアラニンアミノ酸が存在することが示された。[17] Fayardらによるレビュー記事によると、ホスホイノシチド依存性キナーゼ2(PDK2)は、細胞周期の制御に重要なセリン/スレオニンキナーゼである。FAM214Aタンパク質は、正常と考えられるよりも多くのセリン基を持っているため、PDK2がこのタンパク質に重要な影響を与える可能性がある。[26]過剰な数のセリンが実際にリン酸化されると予測されたかどうかを判断するために、タンパク質配列をExPASyウェブサーバーのプログラムNetPhosで実行した。[23]このプログラムは、69個のセリン、14個のスレオニン、および9個のチロシンのリン酸化を予測した。[23]上記のSAPS解析によると、セリンの総数は134個であり、そのうち約半数が生体内でリン酸化されると予測される。リン酸化予測の図を右に示す。

ExPASyのプログラムNetCoronaは、FAM214Aタンパク質に対して、もう一つのタイプの翻訳後修飾を予測した。[27]このプログラムは、翻訳後にFAM214Aタンパク質配列の214位と215位の間に単一の切断部位が存在すると予測した。[27]

タンパク質相互作用

FAM214Aプロモーター配列には、多数の転写因子 結合部位が予測されています。 [11] 最も高い予測信頼性を持つ部位のいくつかを下の表に示します。[11]

FAM214Aプロモーター配列に結合すると予測される転写因子

予測される転写因子 始める 終わり ストランド 自信
転写因子IIB(TFIIB)認識要素 97 103 ネガティブ 1.0
骨髄性ジンクフィンガータンパク質MZF1 151 161 ネガティブ 1.0
ミエリン転写因子1様、ニューロンC2HCジンクフィンガー因子1 388 400 ネガティブ 0.945
アンドロゲン受容体結合部位、IR3部位 495 513 ネガティブ 0.923
ウィルムス腫瘍抑制因子 1 17 ポジティブ 0.968
非回文性核因子I結合部位 27 47 ポジティブ 0.988
FOXP1の選択的スプライシング変異体、ES細胞で活性化 383 383 ポジティブ 1.0
多形性腺腫遺伝子1 488 510 ポジティブ 1.0
ETS様遺伝子1(ELK-1) 569 589 ポジティブ 0.961
FAM214A非転写因子はタンパク質相互作用を予測した

STRINGによれば、FAM214Aタンパク質と相互作用すると予測される唯一のタンパク質はMFSD6Lと呼ばれる。このタンパク質は主要ファシリテータースーパーファミリーに属し、膜貫通タンパク質であると予測されている。FAM214Aと同様に、このタンパク質の機能は実験や研究によってまだ明らかにされていない。[28] [29]このMFSD6Lタンパク質は、確実に相互作用すると予測される唯一のFAM214Aタンパク質であるため、その配列をPSORT IIプログラムで解析した。NLSサブプログラムのデータから、1つのpat4と2つのpat7のNLS配列の存在が予測され、核局在の可能性が示唆された。[19] [21] 一方、NCNNスコアは細胞質局在を94.1%の確実性で予測したため、PSORT IIスコア全体は、細胞膜39.1%、小胞体39.1%、液胞4.3%、分泌系の小胞4.3%、ゴルジ体4.3%、ミトコンドリア4.3%、核4.3%となった。[21] [22]核局在シグナルが合計3つあるため、これは矛盾しているが、MFSD6Lタンパク質の膜貫通性がこれらの予測に問題を引き起こしている可能性がある。[21]

FAM214Aの三次構造のごく一部[30]

二次構造と三次構造

FAM214Aタンパク質の二次構造は、Biology WorkbenchとP rotein H omology/analog Y Recognition Engine(PHYRE)によって予測されているように、多数のαヘリックスβシートから構成されています。 [30] [31] PHYREプログラムは、FAM214Aの二次構造の66%が無秩序であり、そのため解析して三次構造予測に変換することができないと予測しています。[30] しかし、タンパク質の構造の約10%を95%の有意性で予測することができました。[30] この図を左に示します。[30]

保全

パラログ

ホモ・サピエンスの第9染色体上には、単一のパラログ遺伝子が発見され、FAM214B(配列類似性ファミリー、B)と名付けられている。[32] FAM214Bはパラログと考えられているものの、FAM214Aとは著しく異なるタンパク質配列を有する。NCBIのBLASTで両者を比較したところ、唯一顕著な類似性が認められたのは最後の200アミノ酸(DUF4210ドメインとChromosome_Segドメインが位置する領域)であった。[33] FAM214AとBの類似性は低いものの、これら2つのタンパク質は同じタンパク質ファミリーに属し、同じ2つの保存されたドメインを含んでいる。[7] [34]

オルソログ

FAM214Aタンパク質 には、哺乳類鳥類爬虫類両生類、条鰭綱、ウニ上科昆虫吸虫類、甲殻類、トリコプラシア類、花虫綱、およびユーロチオミセスを含む多数の分類にわたって、相当数の相同遺伝子が存在します。[35]これは、FAM214Aタンパク質が真核生物内ではよく保存されていますが、細菌古細菌では保存されていないようです。すべての相同遺伝子において、最も保存されている領域は、保存ドメインがあるタンパク質の末端近くでした(以下を参照)。ヒトFAM214Aタンパク質の相同遺伝子は、Tuber melanosporum、Talaromyces stipitatus、およびAspergillus nidulansにまで遡って発見されており、これらはすべて約1億2億1500万年前に分岐しました。

FAM214Aタンパク質のオーソログ

通称 人類の系統からの分岐(MYA) [36] NCBIタンパク質アクセッション番号 シーケンスの長さ ヒト配列との同一性パーセント [33] 共通遺伝子名
ホモ・サピエンス 人間 - NP_062546.2 1076 100 FAM214A
パン・トログロダイト チンパンジー 6.3 XP_003314724 1083 99 FAM214A
パン・パニスカス ボノボ 6.3 XP_003827895.1 1076 100 FAM214A
ドブネズミ ねずみ 92.3 NP_001100308 1074 100 LOC300836
ウシ 94.2 XP_601152 1087 100 KIAA1370
狼瘡(Canus lupus familiaris) 94.2 XP_544682 1081 100 KIAA1370
オルニトリンクス・アナティヌス カモノハシ 167.4 XP_001515207 1169 95 KIAA1370
ガルス・ガルス チキン 296.0 NP_001005811 1093 99 FAM214A
テニオピギア・グッタタ キンカチョウ 296.0 XP_002196177 1112 99 FAM214A
アノール・カロリネンシス カロライナアノール 296.0 XP_003227400 1086 99 KIAA1370
アフリカツメガエル 熱帯ツメガエル 371.2 NP_001015702 946 98 FAM214A
ダニオ・レリオ ゼブラフィッシュ 400.1 NP_001189349 1021 75 FAM214A
ミツバチ ハニービー 782.7 XP_393903 1339 45 LOC410423
ストロンギロセントロトゥス・プルプラトゥス ウニ 742.9 XP_799179 297 27 FAM214A類似体
キイロショウジョウバエ ミバエ 782.7 NP_610688 1297 27 CG9005
マンソン住血吸虫 住血吸虫寄生虫 792.4 XP_002579285 766 26 仮説的タンパク質
ミジンコ 一般的なミジンコ 782.7 EFX87516 200 18 仮説上のタンパク質 DAPPUDRAFT_207300
ネマトステラ・ベクテンシス イソギンチャク 8億5530万年前 XP_001633540 191 18 仮説的タンパク質
塊茎メラノスポルム トリュフ 1215.8 XP_002841833 622 15 仮説的タンパク質
タラロミセス・スティピタトゥス - 1215.8 XP_002478567 797 25 保存された仮説的タンパク質
アスペルギルス・ニデュランス 糸状菌 1215.8 XP_658605 728 15 仮説的タンパク質 AN1001.2

系統発生

FAM214Aとその相同タンパク質の進化的関係[31]

FAM214Aとその相同遺伝子間の進化的関係を示すために、Biology WorkbenchのCLUSTALWプログラムによって20の相同遺伝子の非根付系統樹が生成された。 [31]

保存されたドメイン

FAM214Aタンパク質には、3つのよく保存された領域があります。これには、タンパク質のN末端付近のよく保存された領域と、 C末端付近の未知機能ドメイン4210(DUF4210)とChromosome_Segドメインを含む2つの保存されたドメインが含まれます。[7]これら3つの領域の模式図を以下に示します。タンパク質のN末端付近のよく保存された領域には、既知のドメインやモチーフは含まれていないと予測されますが、上記のNetCoronaによって予測された切断部位はこの領域内に位置し、FAM214Aと相同なタンパク質の大部分でよく保存されています。[27]このタンパク質の末端に位置する2つの保存されたドメインは、進化の歴史に基づくと、ペプチドの最も重要な部分です。上記の相同遺伝子表にあるカモノハシ(Chromosome_Segドメインを欠いている)を除くすべての生物は、タンパク質配列内にこれらの保存されたドメインの両方を含んでいます。[7]

ホモサピエンスFAM214Aタンパク質の概略図。よく保存された領域とその位置を図式化したもの。

参考文献

  1. ^ abc GRCh38: Ensemblリリース89: ENSG00000047346 – Ensembl、2017年5月
  2. ^ abc GRCm38: Ensemblリリース89: ENSMUSG00000034858 – Ensembl、2017年5月
  3. ^ 「Human PubMed Reference:」。米国国立医学図書館、国立生物工学情報センター
  4. ^ 「マウスPubMedリファレンス:」。米国国立医学図書館、国立生物工学情報センター
  5. ^ abcd 「遺伝子カード: 配列類似性214、AのFAM214Aファミリー」。
  6. ^ ab "Protein FAM214A". NCBI . 2013年2月2日閲覧
  7. ^ abcd 「NCBI保存ドメイン」。
  8. ^ 「遺伝子FAM214a周辺の遺伝子座位マップ領域」。遺伝子カード
  9. ^ ab 「配列類似性214、Aを持つFAM214Aファミリー」NCBI。
  10. ^ 「配列類似性214を持つホモサピエンスファミリー、メンバーA(FAM214A)、mRNA」NCBI。2013年4月17日。
  11. ^ abcd 「ジェノマティクス: エルドラド」.ジェノマティクス[永久リンク切れ]
  12. ^ ab 「FAM214A遺伝子発現(遺伝子カードより)」。遺伝子カード
  13. ^ ab 「BioGPSによるFAM214A遺伝子発現」。BioGPS
  14. ^ 「Expression AtlasよりFAM214A遺伝子発現」。2013年6月16日時点のオリジナルよりアーカイブ。
  15. ^ 「遺伝子オントロジー」。
  16. ^ 「遺伝子オントロジー: 用語の関連付け」。
  17. ^ ab 「生物学ワークベンチ: SAPS」.
  18. ^ Kozlowski, LP (2016). 「IPC - 等電点計算機」. Biology Direct . 11 (1) 55. doi : 10.1186/s13062-016-0159-9 . PMC 5075173. PMID  27769290 . 
  19. ^ abcde 「PSORT II 予測」。
  20. ^ abc 「タンパク質FAM214A - ホモサピエンス(ヒト)」. UniProt .
  21. ^ abcdefg 「PSORT II NLS」。PSORT
  22. ^ abcd Reinhardt A, Hubbard T (1998年5月). 「ニューラルネットワークを用いたタンパク質の細胞内局在予測」. Nucleic Acids Research . 26 (9): 2230–6 . doi :10.1093/nar/26.9.2230. PMC 147531. PMID 9547285  . 
  23. ^ abc "NetPhos". ExPASy .
  24. ^ "NetNGlyc". ExPASy .
  25. ^ "NetOGlyc". ExPASy .
  26. ^ フェイヤード E、タンティニャック LA、ボードリー A、ヘミングス BA (2005 年 12 月)。 「プロテインキナーゼB/Aktの概要」。細胞科学ジャーナル118 (Pt 24): 5675– 8.土井:10.1242/jcs.02724。PMID  16339964。S2CID 8984112  。
  27. ^ abc 「NetCorona」。ExPASy
  28. ^ 「Gene Cards MFSD6L」. Gene Cards .
  29. ^ "UniProt MFSD6L". UniProt .
  30. ^ abcde 「PHYRE Protein Fold Recognition Server」。2022年8月12日時点のオリジナルよりアーカイブ2013年5月12日閲覧。
  31. ^ abc 「生物学ワークベンチ」。
  32. ^ 「遺伝子カード-パラログ」。遺伝子カード
  33. ^ ab "NCBI BLAST". NCBI.
  34. ^ 「保存ドメインFAM214B」。NCBI。
  35. ^ 「遺伝子カードオーソログ」。遺伝子カード
  36. ^ Hedges, SB; Dudley J; Kumar S (2006). 「TimeTree: 生物間の分岐時期に関する公開知識ベース」pp.  2971– 2972​​.
「https://en.wikipedia.org/w/index.php?title=FAM214A&oldid=1317912174」より取得