BioLinux は、以下の 1 つ以上の方法を使用して Linuxプラットフォーム上のバイオインフォマティクスソフトウェアへのアクセスを容易にするさまざまなプロジェクトで使用される用語です。
現在、Linuxシステムとその他のUnixシステムの両方において、同様の目的を持つ様々なプロジェクトが存在しており、その一部を以下に紹介します。また、Canadian Bioinformatics Helpdesk Newsletter [ 1 ]にも、Linuxベースのプロジェクトの概要が掲載されており、それらについて詳しく説明しています。
多くの Linux パッケージはMac OS Xと互換性があり、選択した Linux パッケージ (バイオインフォマティクス ソフトウェアを含む) を Mac OS X を実行しているコンピューターに簡単にインストールできるようにするプロジェクトがいくつかあります。(ソース?)
BioArchLinuxリポジトリには、Arch LinuxおよびArch Linuxベースのディストリビューション用の3,770以上のパッケージが含まれています。[ 2 ]
Debian は、多くの学術機関で使用されているもう 1 つの非常に人気のあるLinux ディストリビューションであり、一部のバイオインフォマティクス専門家は、このディストリビューション用に独自のソフトウェア パッケージを deb形式で提供しています。
パッケージリポジトリは、一般的にバイオインフォマティクス研究者が使用しているLinuxディストリビューションに固有のものです。バイオインフォマティクス分野では、様々なLinuxバリアントが広く利用されています。Fedora は、商用Red Hatシステムの無償配布版です。Red Hatは、商用サポートとトレーニングパッケージを提供しているため、企業で広く利用されています。Fedora Coreは、コミュニティがサポートするRed Hatの派生版で、Red Hatのシステムを好みながらも商用サポートは必要としないユーザーの間で人気があります。バイオインフォマティクスアプリケーションの多くのユーザーは、Fedoraで動作するように設計されたRPM (Red Hatのパッケージ形式)を作成しており、 Red Hat Enterprise Linuxシステムにもインストールできる可能性があります。MandrivaやSUSEなどの他のディストリビューションもRPMを使用しているため、これらのパッケージはこれらのディストリビューションでも動作する可能性があります。
Slackwareは、あまり使われていないLinuxディストリビューションの一つです。Linuxオペレーティングシステムに精通しており、様々なGUIよりもコマンドラインを好む人々に人気があります。パッケージはtgzまたはtgx形式です。Slackwareをベースにした最も有名なライブディストリビューションはSlaxで、多くのバイオインフォマティクスディストリビューションのベースとして使用されています。
ライブDVDまたはCDはCD/DVDドライブから実行されるため、バイオインフォマティクスコンピューティングを提供する理想的な方法ではありません。つまり、従来のハードディスクインストールよりも速度が遅く、設定機能も限られています。しかし、他のLinuxアクセス手段がない場合にアドホックソリューションを提供するには適しており、Linuxインストールのベースとして使用することも可能です。
一般的に、Linuxディストリビューションには幅広い公式パッケージが用意されていますが、科学的なサポートはあまり含まれていません。ただし、以下に挙げるような例外もあります。
Gentoo Linuxは、156を超えるバイオインフォマティクスアプリケーション(メインツリーのGentoo sci-biology herdを参照)をebuild形式で 提供しています。ebuildはアプリケーションをソースコードからビルドするものです。さらに315個のパッケージがGentoo science overlay(テスト用)に含まれています。
Gentooは非常に柔軟性が高く、コミュニティからのサポートも充実していますが、ソースからインストールする必要があるため、インストールに時間がかかり、メンテナンスにかなりの時間を要することがあります。中央サーバーを利用してバイナリパッケージを生成することで、コンパイル時間をある程度短縮することが可能です。一方で、プロセッサの性能を最大限に活かし、最高速度で動作するように微調整することも可能です(例えば、SSE、AVX、AVX2 CPU命令を実際に使用するなど)。バイナリベースのディストリビューションは、通常、i686命令セットのみ、あるいはi386命令セットのみを使用したバイナリを提供しています。
FreeBSDはLinuxディストリビューションではありませんが、非常によく似た Unixのバージョン です。そのportsはGentooのebuildに類似しています。ただし、このプロジェクトはx86やARMなどのTier-1プラットフォーム向けにコンパイル済みのバイナリパッケージを継続的にビルドしています。ユーザーは、移植性のない最適化やその他のビルドオプションを有効にするために、任意のportsをソースからビルドしてインストールすることもできます。ソースからのビルドオプションにより、portsシステムは再配布を許可しないライセンスのソフトウェアのインストールを自動化することもできます。
Portsコレクションには31,000以上のPortが含まれており、そのうち2,200以上が科学分野、240以上が生物学関連です。新しいPortsとアップデートはFresh Ports [ 3 ]サイトに掲載されています。
pkgsrcパッケージマネージャーは、元々FreeBSD portsからフォークされたもので、 NetBSDプロジェクトによってメンテナンスされていますが、すべてのPOSIX互換オペレーティングシステムをサポートすることを目指しています。NetBSD 、多くのLinuxディストリビューション、macOS、およびSunOS派生OSで十分にテストされています。FreeBSD ports と同様に、一部のプラットフォーム向けにコンパイル済みバイナリパッケージがメンテナンスされています。パッケージは、任意のプラットフォーム上でソースからビルドすることも、追加の最適化やオプションが必要な場合でもビルドできます。pkgsrc コレクションには 19,000 を超えるパッケージが含まれており、そのうち約 800 は科学分野、60 は生物学関連です。
標準的なDebianインストールには、100を超えるバイオインフォマティクスパッケージが提供されています。NEBC Bio-Linux [ 4 ]パッケージも、bio-linux-baseパッケージがインストールされていれば、標準的なDebianシステムにインストールできます。これにより、/usr/local/bioinfディレクトリが作成され、他のパッケージもここにインストールされます。Debianパッケージは、Ubuntu Linuxやその他のDebian派生システムでも動作する可能性があります。
BioLinuxプロジェクトでは、IT専門家ではない科学者が特定の問題に対する解決策を迅速に見つけられるように、サポートとドキュメントの提供が不可欠です。サポートフォーラムやメーリングリストも、研究コミュニティ内で知識を広めるのに役立ちます。これらのリソースの一部は、こちらにリンクされています。