| イナバ | |||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 識別子 | |||||||||||||||||||||||||||||||||||||||||||||||||||
| エイリアス | INAVA、染色体1のオープンリーディングフレーム106、C1orf106、自然免疫活性化因子 | ||||||||||||||||||||||||||||||||||||||||||||||||||
| 外部ID | オミム:618051; MGI : 1921579;ホモロジーン:10103;ジーンカード:INAVA; OMA :INAVA - オルソログ | ||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
| ウィキデータ | |||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||
INAVAは、仮説タンパク質LOC55765とも呼ばれ、ヒトではINAVA遺伝子によってコードされている機能不明のタンパク質です。[5]あまり一般的ではない遺伝子別名には、FLJ10901やMGC125608などがあります。
遺伝子
位置
ヒトでは、INAVAは1番染色体長腕の1q32.1座に位置し、プラス鎖上の200,891,499から200,915,736(24.238 kb)の範囲に及ぶ。[5]
ジーン地区

INAVAは、Gタンパク質共役受容体25(上流)と、下流の擬似遺伝子と予測されるマエストロ熱様反復ファミリーメンバー3(MROH3P)に挟まれている。リボソームタンパク質L34擬似遺伝子6(RPL34P6)はさらに上流にあり、キネシンファミリーメンバー21Bはさらに下流にある。[5]
プロモーター

INAVA には 7 つの予測プロモーターがあり、実験的証拠は最も一般的なアイソフォームであるアイソフォーム 1 と 2 が異なるプロモーターを使用して転写されることを示唆しています。[6] Genomatix から入手できるツールである MatInspector を使用して、潜在的なプロモーター領域内の転写因子結合部位を予測しました。アイソフォーム 1 の予想されるプロモーターを標的とすると予測される転写因子は、さまざまな組織で発現しています。最も一般的な発現組織は、泌尿生殖器系、神経系、および骨髄です。これは、腎臓と骨髄で高度に発現している INAVA タンパク質の発現データと一致しています。[7] 転写因子結合部位を強調表示した予測プロモーター領域の図を右側に示します。アイソフォーム 2 のプロモーター領域に結合すると予測される因子は異なり、予測される上位 20 の因子のうち 12 は血液細胞および/または心血管系の組織で発現しています。
表現
C1orf106は幅広い組織で発現しています。GEOプロファイルの発現データを以下に示します。最も高い発現部位は表に記載されています。胎盤、前立腺、精巣、肺、唾液腺、樹状細胞では中程度の発現が見られます。脳、ほとんどの免疫細胞、副腎、子宮、心臓、脂肪細胞では低い発現が見られます。[7] GEOプロファイルで得られた様々な実験からの発現データは、肺がん、卵巣がん、大腸がん、乳がんなど、いくつかのがんにおいてINAVAの発現が亢進していることを示唆しています。

| 組織 | パーセンタイル順位 |
|---|---|
| Bリンパ球 | 90 |
| 気管 | 89 |
| 肌 | 88 |
| ヒト気管支上皮細胞 | 88 |
| 大腸腺癌 | 87 |
| 腎臓 | 87 |
| 舌 | 85 |
| 膵臓 | 84 |
| 付録 | 82 |
| 骨髄 | 80 |
mRNA
アイソフォーム
INAVA遺伝子からは9つの推定アイソフォームが生成され、そのうち7つはタンパク質をコードすると予測されています。[8] 以下に示すアイソフォーム1と2は、最も一般的なアイソフォームです。

最も長いアイソフォーム1が、標準的なアイソフォームとして認められています。アイソフォーム1は10個のエクソンを含み、情報源によって異なりますが、677アミノ酸長のタンパク質をコードしています。一部の情報源では、42ヌクレオチド下流の開始コドンを使用しているため、タンパク質は663アミノ酸長であると報告されています。NCBIによると、このアイソフォームは計算的にのみ予測されています。[5] これは、下流の開始コドンを囲むコザック配列が、下表に示すように、コンセンサスコザック配列に類似しているためと考えられます。予測されたアイソフォームの配列を得るために、Softberryが使用されました。[9]アイソフォーム2は、N末端が切断されているため、より短くなっています。どちらのアイソフォームも、代替ポリアデニル化部位を有しています。[8]

miRNA制御

miRNA-24は、INAVA mRNAを標的とする可能性のあるマイクロRNAとして同定されました。 [10] 5'非翻訳領域 に位置する結合部位を示しています。
タンパク質
一般的な特性

下図に示すアイソフォーム1は、DUF3338ドメイン、2つの低複雑性領域、およびプロリンリッチ領域を含む。このタンパク質はアルギニンとプロリンに富み、アスパラギンと疎水性アミノ酸(具体的にはフェニルアラニンとイソロイシン)の量は平均より少ない。[11] 等電点は9.58、未修飾タンパク質の分子量は72.9 kDaである。[12]このタンパク質はN末端シグナルペプチドを持たないと予測されているが、核局在シグナル(NLS)とロイシンに富む核外輸送シグナルが予測されている。[13] [14] [15]
変更点
INAVAは高度にリン酸化されると予測される。[16] [17] PROSITEによって予測されるリン酸化部位を下表に示す。NETPhosによる予測は図に示されている。各線は予測されるリン酸化部位を指し、セリン(S)、スレオニン(T)、またはチロシン(Y)を表す文字とつながっている。


構造
コイルドコイルは残基130-160と200-260にまたがると予測されている。[18] 二次構成はランダムコイルが約60%、αヘリックスが30%、βシートが10%と予測されている。[19]
相互作用
INAVAタンパク質が相互作用するタンパク質は十分に解明されていない。テキストマイニングによる知見は、INAVAが以下のタンパク質と相互作用する可能性があることを示唆している:DNAJC5G、SLC7A13、PIEZO2、MUC19。[20]酵母ツーハイブリッドスクリーニングによる実験的知見は、INAVAタンパク質がアダプタータンパク質である14-3-3タンパク質シグマと相互作用することを示唆している。[21]
相同性
INAVAは、下表に示すように脊椎動物においてよく保存されています。配列はBLAST [22] およびBLAT [23]から取得されました。
| 順序 | 属と種 | 通称 | NCBI登録 | 長さ(aa) | 配列同一性 | 分岐からの時間(百万年) | |
|---|---|---|---|---|---|---|---|
| * | C1orf106 | ホモ・サピエンス | 人間 | NP_060735.3 | 667 | 100% | 該当なし |
| * | C1orf106 | マカク属 | カニクイザル | XP_005540414.1 | 703 | 97% | 29.0 |
| * | LOC289399 | ドブネズミ | ノルウェーのネズミ | NP_001178750.1 | 667 | 86% | 92.3 |
| * | 予測されるC1orf106ホモログ | オドベヌス・ロスマルス・ディバーゲンス | セイウチ | XP_004392787.1 | 672 | 85% | 94.2 |
| * | C1orf106様 | アフリカトビネズミ | 象 | XP_003410255.1 | 663 | 84% | 98.7 |
| * | 予測されるC1orf106ホモログ | ダシプス・ノベムシンクトゥス | コオロギアルマジロ | XP_004478752.1 | 676 | 81% | 104.2 |
| * | 予測されるC1orf106ホモログ | オコトナ・プリンセプス | アメリカナキウサギ | XP_004578841.1 | 681 | 78% | 92.3 |
| * | 予測されるC1orf106ホモログ | モノデルフィス・ドメスティカ | 灰色の短い尾を持つオポッサム | XP_001367913.2 | 578 | 76% | 162.2 |
| * | 予測されるC1orf106ホモログ | クリセミス・ピクタ・ベリ | ニシキガメ | XP_005313167.1 | 602 | 56% | 296.0 |
| * | 予測されるC1orf106ホモログ | ジオスピザ・フォルティス | ミディアムグラウンドフィンチ | XP_005426868.1 | 542 | 50% | 296.0 |
| * | 予測されるC1orf106ホモログ | ミシシッピワニ | アリゲーター | XP_006278041.1 | 547 | 49% | 296.0 |
| * | 予測されるC1orf106ホモログ | キビタキ | キビタキ | XP_005059352.1 | 542 | 49% | 296.0 |
| 予測されるC1orf106ホモログ | ラティメリア・カルムネ | 西インド洋のシーラカンス | XP_005988436.1 | 613 | 46% | 414.9 | |
| * | 予測されるC1orf106ホモログ | レピソステウス・オクラトゥス | スポッテッドガー | XP_006628420.1 | 637 | 44% | 400.1 |
| * | 4Aを含むFERMドメイン | アフリカツメガエル(シルラナ)トロピカリス | ニシツメガエル | XP_002935289.2 | 695 | 43% | 371.2 |
| * | 予測されるC1orf106ホモログ | オレオクロミス・ニロティクス | ナイルティラピア | XP_005478188.1 | 576 | 40% | 400.1 |
| 予測されるC1orf106ホモログ | ハプロクロミス・バートニ | アスタトティラピア・バートニ | XP_005914919.1 | 576 | 40% | 400.1 | |
| 予測されるC1orf106ホモログ | プンダミリア・ニエレレイ | ハプロクロミス・ニエレレイ | XP_005732720.1 | 577 | 40% | 400.1 | |
| * | LOC563192 | ダニオ・レリオ | ゼブラフィッシュ | NP_001073474.1 | 612 | 37% | 400.1 |
| LOC101161145 | メダカ | メダカ | XP_004069287.1 | 612 | 33% | 400.1 |
以下に、アスタリスクで示したエントリーについて、配列同一性と分岐からの時間の関係を示すグラフを示します。色は近縁度(緑=近縁、紫=遠縁)に対応しています。

パラログ
INAVAパラログと考えられるタンパク質は、データベース間で一貫性がありません。潜在的にパラログなタンパク質の多重配列アライメント(MSA)を作成し、真のパラログ関係の可能性を判断しました。[24] 配列は、ヒトにおけるC1orf106タンパク質を用いたBLAST検索から取得されました。MSAは、これらのタンパク質が真核生物に存在する相同ドメインDUF3338を共有していることを示唆しています。多重配列アライメントの一部を以下に示します。DUFドメイン(緑色の枠で囲まれている)を除けば、ほとんど保存性はありませんでした。DUF3338ドメインには特別な物理的特性はありませんが、注目すべき発見が1つあります。MSA内の各タンパク質は2つの核局在シグナルを持つと予測されます。MSA内のタンパク質はすべて核に局在すると予測されます。[13] SAPSを用いてタンパク質の物理的特性の比較も行われ、表に示されています。[11]


臨床的意義
INAVA遺伝子領域では合計556の一塩基多型(SNP)が同定されており、そのうち96は臨床的原因と関連している。[25] Rivasら[26]は、 下表に示すように、 炎症性腸疾患およびクローン病と関連する可能性のある4つのSNPを特定した。GeneCardsによると、その他の疾患との関連としては、多発性硬化症や潰瘍性大腸炎が挙げられる。[27]
| 残基 | 変化 | 注記 |
|---|---|---|
| 333 (rs41313912) | チロシン ⇒ フェニルアラニン | リン酸化、中程度の保存 |
| 376 | アルギニン ⇒ システイン | 中程度の保全 |
| 397 | アルギニン ⇒ トレオニン | 保存されていない |
| 554 (rs61745433) | アルギニン ⇒ システイン | 中程度の保全 |
参考文献
- ^ abc GRCh38: Ensemblリリース89: ENSG00000163362 – Ensembl、2017年5月
- ^ abc GRCm38: Ensemblリリース89: ENSMUSG00000041605 – Ensembl、2017年5月
- ^ 「Human PubMed Reference:」。米国国立医学図書館、国立生物工学情報センター。
- ^ 「マウスPubMedリファレンス:」。米国国立医学図書館、国立生物工学情報センター。
- ^ abcd "NCBI Gene 55765" . 2014年2月10日閲覧。
- ^ “Genomatix: MatInspector”. 2021年12月2日時点のオリジナルよりアーカイブ。2014年3月6日閲覧。
- ^ ab "GEO Profiles" . 2014年3月6日閲覧。
- ^ ab "Aceview" . 2014年3月6日閲覧。
- ^ 「Softberry」 . 2014年4月20日閲覧。
- ^ 「TargetScanHuman 6.2」 。 2014年4月15日閲覧。
- ^ ab 「タンパク質配列の統計分析」 。 2014年4月20日閲覧。
- ^ 「Compute pI/Mwツール」2014年4月10日閲覧。
- ^ ab "PSORTII" . 2014年4月20日閲覧。
- ^ “cNLS Mapper”. 2021年11月22日時点のオリジナルよりアーカイブ。2014年4月20日閲覧。
- ^ "NetNES" . 2014年4月20日閲覧。
- ^ "NETPhos" . 2014年4月20日閲覧。
- ^ 「スイスバイオインフォマティクス研究所:PROSITE」.
- ^ “ExPASy COILS”. 2014年4月22日時点のオリジナルよりアーカイブ。2014年4月20日閲覧。
- ^ "SOPMA" . 2014年4月27日閲覧。
- ^ “STRING”. 2013年5月15日時点のオリジナルよりアーカイブ。2014年4月15日閲覧。
- ^ "MINT" . 2014年4月15日閲覧。
- ^ "BLAST" . 2014年3月8日閲覧。
- ^ 「BLAT」 . 2014年3月8日閲覧。
- ^ 「SDSC Biology Workbench: ClustalW」 . 2014年3月12日閲覧。
- ^ "dbSNP" . 2014年4月22日閲覧。
- ^ Rivas MA; et al. (2011). 「GWAS遺伝子座のディープリシークエンシングにより、炎症性腸疾患に関連する独立した稀な変異が同定される」Nature Genetics . 43 (11): 1066– 1073. doi :10.1038/ng.952. PMC 3378381. PMID 21983784 .
- ^ "GeneCards" . 2014年5月1日閲覧。
外部リンク
- UCSC ゲノム ブラウザのヒト C1orf106 ゲノムの位置と C1orf106 遺伝子の詳細ページ。

