イナバ

ホモサピエンスにおけるタンパク質コード遺伝子
イナバ
識別子
エイリアスINAVA、染色体1のオープンリーディングフレーム106、C1orf106、自然免疫活性化因子
外部IDオミム:618051; MGI : 1921579;ホモロジーン:10103;ジーンカード:INAVA; OMA :INAVA - オルソログ
オルソログ
人間ねずみ
エントレズ
アンサンブル
ユニプロット
RefSeq (mRNA)

NM_001142569
NM_018265
NM_001367289
NM_001367290

NM_028872

RefSeq(タンパク質)

NP_001136041
NP_060735
NP_001354218
NP_001354219

NP_083148
NP_001392081
NP_001392082
NP_001392083

場所(UCSC)1 章: 200.89 – 200.92 MB1章: 136.14 – 136.16 Mb
PubMed検索[3][4]
ウィキデータ
人間の表示/編集マウスの表示/編集

INAVAは、仮説タンパク質LOC55765とも呼ばれヒトではINAVA遺伝子によってコードされている機能不明のタンパク質です。[5]あまり一般的ではない遺伝子別名には、FLJ10901やMGC125608などがあります。

遺伝子

位置

1番染色体上のC1orf106の位置

ヒトでは、INAVAは1番染色体長腕の1q32.1座に位置し、プラス鎖の200,891,499から200,915,736(24.238 kb)の範囲に及ぶ。[5]

ジーン地区

ジーン地区

INAVAは、Gタンパク質共役受容体25(上流)と、下流の擬似遺伝子と予測されるマエストロ熱様反復ファミリーメンバー3(MROH3P)に挟まれている。リボソームタンパク質L34擬似遺伝子6(RPL34P6)はさらに上流にあり、キネシンファミリーメンバー21Bはさらに下流にある。[5]

プロモーター

推定転写因子結合部位を持つC1orf106プロモーター領域

INAVA には 7 つの予測プロモーターがあり、実験的証拠は最も一般的なアイソフォームであるアイソフォーム 1 と 2 が異なるプロモーターを使用して転写されることを示唆しています。[6] Genomatix から入手できるツールである MatInspector を使用して、潜在的なプロモーター領域内の転写因子結合部位を予測しました。アイソフォーム 1 の予想されるプロモーターを標的とすると予測される転写因子は、さまざまな組織で発現しています。最も一般的な発現組織は、泌尿生殖器系、神経系、および骨髄です。これは、腎臓と骨髄で高度に発現している INAVA タンパク質の発現データと一致しています。[7] 転写因子結合部位を強調表示した予測プロモーター領域の図を右側に示します。アイソフォーム 2 のプロモーター領域に結合すると予測される因子は異なり、予測される上位 20 の因子のうち 12 は血液細胞および/または心血管系の組織で発現しています。

表現

C1orf106は幅広い組織で発現しています。GEOプロファイルの発現データを以下に示します。最も高い発現部位は表に記載されています。胎盤、前立腺、精巣、肺、唾液腺、樹状細胞では中程度の発現が見られます。脳、ほとんどの免疫細胞、副腎、子宮、心臓、脂肪細胞では低い発現が見られます。[7] GEOプロファイルで得られた様々な実験からの発現データは、肺がん、卵巣がん、大腸がん、乳がんなど、いくつかのがんにおいてINAVAの発現が亢進していることを示唆しています。

GEOプロファイルからのC1orf106発現データ
組織 パーセンタイル順位
Bリンパ球 90
気管 89
88
ヒト気管支上皮細胞 88
大腸腺癌 87
腎臓 87
85
膵臓 84
付録 82
骨髄 80

mRNA

アイソフォーム

INAVA遺伝子からは9つの推定アイソフォームが生成され、そのうち7つはタンパク質をコードすると予測されています。[8] 以下に示すアイソフォーム1と2は、最も一般的なアイソフォームです。

最も一般的なC1orf106アイソフォーム

最も長いアイソフォーム1が、標準的なアイソフォームとして認められています。アイソフォーム1は10個のエクソンを含み、情報源によって異なりますが、677アミノ酸長のタンパク質をコードしています。一部の情報源では、42ヌクレオチド下流の開始コドンを使用しているため、タンパク質は663アミノ酸長であると報告されています。NCBIによると、このアイソフォームは計算的にのみ予測されています。[5] これは、下流の開始コドンを囲むコザック配列が、下表に示すように、コンセンサスコザック配列に類似しているためと考えられます。予測されたアイソフォームの配列を得るために、Softberryが使用されました。[9]アイソフォーム2は、N末端が切断されているため、より短くなっています。どちらのアイソフォームも、代替ポリアデニル化部位を有しています。[8]

開始コドンの周囲配列とコザックコンセンサス配列の比較
開始コドンの周囲配列とコザックコンセンサス配列の比較

miRNA制御

予測されるmiRNA標的配列

miRNA-24は、INAVA mRNAを標的とする可能性のあるマイクロRNAとして同定されました。 [10] 5'非翻訳領域 に位置する結合部位を示しています。

タンパク質

一般的な特性

C1of106タンパク質(アイソフォーム1)

下図に示すアイソフォーム1は、DUF3338ドメイン、2つの低複雑性領域、およびプロリンリッチ領域を含む。このタンパク質はアルギニンとプロリンに富み、アスパラギンと疎水性アミノ酸(具体的にはフェニルアラニンとイソロイシン)の量は平均より少ない。[11] 等電点は9.58、未修飾タンパク質の分子量は72.9 kDaである。[12]このタンパク質はN末端シグナルペプチドを持たないと予測されているが、核局在シグナル(NLS)とロイシンに富む核外輸送シグナルが予測されている[13] [14] [15]

変更点

INAVAは高度にリン酸化されると予測される。[16] [17] PROSITEによって予測されるリン酸化部位を下表に示す。NETPhosによる予測は図に示されている。各線は予測されるリン酸化部位を指し、セリン(S)、スレオニン(T)、またはチロシン(Y)を表す文字とつながっている。

PROSITEによって予測されるリン酸化部位
PROSITEによって予測されるリン酸化部位
NETPhosによって予測されるリン酸化部位。文字はセリン(S)、スレオニン(T)、またはチロシン(Y)に対応します。

構造

コイルドコイルは残基130-160と200-260にまたがると予測されている。[18] 二次構成はランダムコイルが約60%、αヘリックスが30%、βシートが10%と予測されている。[19]

相互作用

INAVAタンパク質が相互作用するタンパク質は十分に解明されていない。テキストマイニングによる知見は、INAVAが以下のタンパク質と相互作用する可能性があることを示唆している:DNAJC5G、SLC7A13、PIEZO2、MUC19。[20]酵母ツーハイブリッドスクリーニングによる実験的知見は、INAVAタンパク質がアダプタータンパク質である14-3-3タンパク質シグマと相互作用することを示唆している。[21]

相同性

INAVAは、下表に示すように脊椎動物においてよく保存されています。配列はBLAST [22] およびBLAT [23]から取得されました。

順序 属と種 通称 NCBI登録 長さ(aa) 配列同一性 分岐からの時間(百万年)
* C1orf106 ホモ・サピエンス 人間 NP_060735.3 667 100% 該当なし
* C1orf106 マカク属 カニクイザル XP_005540414.1 703 97% 29.0
* LOC289399 ドブネズミ ノルウェーのネズミ NP_001178750.1 667 86% 92.3
* 予測されるC1orf106ホモログ オドベヌス・ロスマルス・ディバーゲンス セイウチ XP_004392787.1 672 85% 94.2
* C1orf106様 アフリカトビネズミ XP_003410255.1 663 84% 98.7
* 予測されるC1orf106ホモログ ダシプス・ノベムシンクトゥス コオロギアルマジロ XP_004478752.1 676 81% 104.2
* 予測されるC1orf106ホモログ オコトナ・プリンセプス アメリカナキウサギ XP_004578841.1 681 78% 92.3
* 予測されるC1orf106ホモログ モノデルフィス・ドメスティカ 灰色の短い尾を持つオポッサム XP_001367913.2 578 76% 162.2
* 予測されるC1orf106ホモログ クリセミス・ピクタ・ベリ ニシキガメ XP_005313167.1 602 56% 296.0
* 予測されるC1orf106ホモログ ジオスピザ・フォルティス ミディアムグラウンドフィンチ XP_005426868.1 542 50% 296.0
* 予測されるC1orf106ホモログ ミシシッピワニ アリゲーター XP_006278041.1 547 49% 296.0
* 予測されるC1orf106ホモログ キビタキ キビタキ XP_005059352.1 542 49% 296.0
予測されるC1orf106ホモログ ラティメリア・カルムネ 西インド洋のシーラカンス XP_005988436.1 613 46% 414.9
* 予測されるC1orf106ホモログ レピソステウス・オクラトゥス スポッテッドガー XP_006628420.1 637 44% 400.1
* 4Aを含むFERMドメイン アフリカツメガエル(シルラナ)トロピカリス ニシツメガエル XP_002935289.2 695 43% 371.2
* 予測されるC1orf106ホモログ オレオクロミス・ニロティクス ナイルティラピア XP_005478188.1 576 40% 400.1
予測されるC1orf106ホモログ ハプロクロミス・バートニ アスタトティラピア・バートニ XP_005914919.1 576 40% 400.1
予測されるC1orf106ホモログ プンダミリア・ニエレレイ ハプロクロミス・ニエレレイ XP_005732720.1 577 40% 400.1
* LOC563192 ダニオ・レリオ ゼブラフィッシュ NP_001073474.1 612 37% 400.1
LOC101161145 メダカ メダカ XP_004069287.1 612 33% 400.1

以下に、アスタリスクで示したエントリーについて、配列同一性と分岐からの時間の関係を示すグラフを示します。色は近縁度(緑=近縁、紫=遠縁)に対応しています。

種の関連性に関連した配列同一性のパーセント

パラログ

INAVAパラログと考えられるタンパク質は、データベース間で一貫性がありません。潜在的にパラログなタンパク質の多重配列アライメント(MSA)を作成し、真のパラログ関係の可能性を判断しました。[24] 配列は、ヒトにおけるC1orf106タンパク質を用いたBLAST検索から取得されました。MSAは、これらのタンパク質が真核生物に存在する相同ドメインDUF3338を共有していることを示唆しています。多重配列アライメントの一部を以下に示します。DUFドメイン(緑色の枠で囲まれている)を除けば、ほとんど保存性はありませんでした。DUF3338ドメインには特別な物理的特性はありませんが、注目すべき発見が1つあります。MSA内の各タンパク質は2つの核局在シグナルを持つと予測されます。MSA内のタンパク質はすべて核に局在すると予測されます。[13] SAPSを用いてタンパク質の物理的特性の比較も行われ、表に示されています。[11]

ヒトにおけるDUF3338ドメインの保存
潜在的パラログの物理的特性
潜在的パラログの物理的特性

臨床的意義

INAVA遺伝子領域では合計556の一塩基多型(SNP)が同定されており、そのうち96は臨床的原因と関連している。[25] Rivasら[26]は、 下表に示すように、 炎症性腸疾患およびクローン病と関連する可能性のある4つのSNPを特定した。GeneCardsによると、その他の疾患との関連としては、多発性硬化症潰瘍性大腸炎が挙げられる。[27]

残基 変化 注記
333 (rs41313912) チロシン ⇒ フェニルアラニン リン酸化、中程度の保存
376 アルギニン ⇒ システイン 中程度の保全
397 アルギニン ⇒ トレオニン 保存されていない
554 (rs61745433) アルギニン ⇒ システイン 中程度の保全

参考文献

  1. ^ abc GRCh38: Ensemblリリース89: ENSG00000163362 – Ensembl、2017年5月
  2. ^ abc GRCm38: Ensemblリリース89: ENSMUSG00000041605 – Ensembl、2017年5月
  3. ^ 「Human PubMed Reference:」。米国国立医学図書館、国立生物工学情報センター
  4. ^ 「マウスPubMedリファレンス:」。米国国立医学図書館、国立生物工学情報センター
  5. ^ abcd "NCBI Gene 55765" . 2014年2月10日閲覧
  6. ^ “Genomatix: MatInspector”. 2021年12月2日時点のオリジナルよりアーカイブ2014年3月6日閲覧。
  7. ^ ab "GEO Profiles" . 2014年3月6日閲覧
  8. ^ ab "Aceview" . 2014年3月6日閲覧
  9. ^ 「Softberry」 . 2014年4月20日閲覧
  10. ^ 「TargetScanHuman 6.2」 。 2014年4月15日閲覧
  11. ^ ab 「タンパク質配列の統計分析」 。 ​​2014年4月20日閲覧
  12. ^ 「Compute pI/Mwツール」2014年4月10日閲覧
  13. ^ ab "PSORTII" . 2014年4月20日閲覧
  14. ^ “cNLS Mapper”. 2021年11月22日時点のオリジナルよりアーカイブ2014年4月20日閲覧。
  15. ^ "NetNES" . 2014年4月20日閲覧
  16. ^ "NETPhos" . 2014年4月20日閲覧
  17. ^ 「スイスバイオインフォマティクス研究所:PROSITE」.
  18. ^ “ExPASy COILS”. 2014年4月22日時点のオリジナルよりアーカイブ2014年4月20日閲覧。
  19. ^ "SOPMA" . 2014年4月27日閲覧
  20. ^ “STRING”. 2013年5月15日時点のオリジナルよりアーカイブ2014年4月15日閲覧。
  21. ^ "MINT" . 2014年4月15日閲覧
  22. ^ "BLAST" . 2014年3月8日閲覧
  23. ^ 「BLAT」 . 2014年3月8日閲覧
  24. ^ 「SDSC Biology Workbench: ClustalW」 . 2014年3月12日閲覧
  25. ^ "dbSNP" . 2014年4月22日閲覧
  26. ^ Rivas MA; et al. (2011). 「GWAS遺伝子座のディープリシークエンシングにより、炎症性腸疾患に関連する独立した稀な変異が同定される」Nature Genetics . 43 (11): 1066– 1073. doi :10.1038/ng.952. PMC 3378381. PMID 21983784  . 
  27. ^ "GeneCards" . 2014年5月1日閲覧
「https://en.wikipedia.org/w/index.php?title=INAVA&oldid=1301500069」から取得