| タナグラ | |
|---|---|
| 開発者 | リュミエール大学リヨン第2校 |
| 安定版リリース | 1.4.50 / 2013/12/18 |
| リポジトリ | |
| オペレーティング·システム | ウィンドウズ |
| タイプ | 機械学習、データマイニング、多変量解析、データ分析 |
| ライセンス | オープンソース |
| Webサイト | https://tanagra-machine-learning.blogspot.com/ |
Tanagraは、フランスのリュミエール大学リヨン第2校のRicco Rakotomalalaによって開発された、研究および学術目的のための無料の機械学習ソフトウェアスイートです。 [ 1 ] [ 2 ] Tanagraは、可視化、記述統計、インスタンス選択、特徴選択、特徴構築、回帰、因子分析、クラスタリング、分類、関連ルール学習などの いくつかの標準的なデータマイニングタスクをサポートしています。
Tanagraは学術プロジェクトであり、フランス語圏の大学で広く利用されています。[ 3 ] Tanagraは実際の研究[ 4 ]やソフトウェア比較論文で頻繁に使用されています。
Tanagraの開発は2003年6月に開始され、最初のバージョンは2003年12月に配布されました。Tanagraは、教師あり学習タスク(分類)、特にインタラクティブかつ視覚的な決定木の構築に特化した、別の無料データマイニングツールであるSipinaの後継です。Sipinaは現在もオンラインで利用可能で、メンテナンスも行われています。Tanagraは「オープンソースプロジェクト」であり、ソフトウェア配布ライセンスに同意し、それに従う限り、すべての研究者がソースコードにアクセスして独自のアルゴリズムを追加できます。
Tanagra プロジェクトの主な目的は、この分野のソフトウェア開発の現在の標準 (特に GUI の設計と使用方法) に準拠し、実際のデータまたは合成データの分析を可能にする、ユーザーフレンドリーなデータ マイニング ソフトウェアを研究者と学生に提供することです。
2006年から、Ricco Rakotomalala氏は重要な文書化作業を行いました。専用ウェブサイトには多数のチュートリアルが公開されており、統計的および機械学習的手法と、実際のケーススタディにおけるTanagraを用いた実装方法が解説されています。また、同じ問題に対する他の無料データマイニングツールの使用についても幅広く解説されています。ツールの比較により、読者は結果の提示方法の違いを理解することができます。

Tanagraは既存のデータマイニングツールと同様に動作します。ユーザーはダイアグラム上でデータマイニングプロセスを視覚的に設計できます。各ノードは統計または機械学習の手法を表し、2つのノード間の接続はデータ転送を表します。しかし、ワークフローパラダイムに基づく多くのツールとは異なり、Tanagraは非常に簡素化されています。処理はツリーダイアグラムで表されます。結果はHTML形式で表示されます。そのため、出力を簡単にエクスポートしてブラウザで視覚化できます。また、結果テーブルをスプレッドシートにコピーすることも可能です。
Tanagra は、統計的アプローチ (例: パラメトリックおよびノンパラメトリック統計テスト)、多変量解析手法 (例: 因子分析、対応分析、クラスター分析、回帰)、および機械学習テクニック (例: ニューラル ネットワーク、サポート ベクター マシン、決定木、ランダム フォレスト) の間で適切な妥協点を見つけます。