Apache Lucene

Java library for full-text search
Lucene
開発者Apacheソフトウェア財団
初回リリース1999年; 26年前 (1999)
安定版リリース
10.3.1 / 2025年10月6日; 41日前[1] (2025-10-06)
リポジトリ
  • github.com/apache/lucene
言語Java
オペレーティングシステムクロスプラットフォーム
タイプ検索インデックス
ライセンスApache License 2.0
ウェブサイトlucene.apache.org

Apache Luceneは、 Doug CuttingによってJavaで書かれた、無料のオープンソース 検索エンジン ソフトウェアライブラリです。Apache Software Foundationによってサポートされており、 Apacheソフトウェアライセンスの下でリリースされています。Luceneは、実稼働検索アプリケーションの標準基盤として広く使用されています。[2] [3] [4]

Luceneは、 Object PascalPerlC#C++PythonRubyPHPなどの他のプログラミング言語にも移植されています[5]

履歴

ダグ・カッティングは1999年にLuceneを最初に開発しました。[6] Luceneは彼にとって5番目の検索エンジンでした。彼はそれ以前に、ゼロックスPARC在籍中に2つ、Appleで1つ、そしてExciteで4つ目の検索エンジンを開発していました[7]当初はSourceForgeのウェブサイトからダウンロード可能でした。2001年9月にApache Software FoundationのオープンソースJava製品であるJakartaファミリーに加わり、2005年2月に独立したApacheトップレベルプロジェクトとなりました。Luceneという名前は、ダグ・カッティングの妻のミドルネームと母方の祖母のファーストネームに由来しています。[8]

Luceneには以前、Lucene.NET、 MahoutTikaNutchなど、多くのサブプロジェクトが含まれていました。現在、これら3つは独立したトップレベルプロジェクトとなっています。

2010年3月、Apache Solr検索サーバーがLuceneサブプロジェクトとして参加し、開発者コミュニティが統合されました

バージョン4.0は2012年10月12日にリリースされました。[9]

2021年3月、Luceneはロゴを変更し、Apache SolrはLuceneから独立した、再びトップレベルのApacheプロジェクトになりました。

機能と一般的な使用方法

Luceneは、全文インデックス作成と検索機能を必要とするあらゆるアプリケーションに適していますが、インターネット検索エンジンの実装やローカルの単一サイト検索における有用性が認められています。 [10] [11]

Luceneには、編集距離に基づいてあいまい検索を実行する機能が含まれています[12]

Luceneは推薦システムの実装にも使用されています。[13]例えば、Luceneの「MoreLikeThis」クラスは、類似文書の推薦を生成できます。「MoreLikeThis」の用語ベクトルベースの類似度アプローチと、共引用や共引用近接分析などの引用ベースの文書類似度指標を比較したところ、Luceneのアプローチは、非常に類似した構造特性とより狭い関連性を持つ文書の推薦に優れていました。[14]対照的に、引用ベースの文書類似度指標は、より広く関連する文書の推薦に適している傾向があり、[14]推薦される文書に本文内引用が含まれている限り、 引用ベースのアプローチは偶然の推薦を生成するのに適している可能性があります。

Luceneベースのプロジェクト

Lucene自体はインデックス作成と検索のライブラリであり、クロールやHTML解析機能は含まれていません。ただし、いくつかのプロジェクトがLuceneの機能を拡張しています。

参照

参考文献

  1. ^ 「Apache Luceneへようこそ」。Lucene™ニュースセクション。2021年2月12日時点のオリジナルからのアーカイブ2020年2月12日閲覧
  2. ^ カンフィス, クリス; デ・フリース, アルジェン・P.; ボイツォフ, レオニード; リン, ジミー (2020)、「どのBM25のことですか? スコアリングバリアントの大規模再現性研究」、ホセ, ジョーモン M.; ユルマズ, エミネ; マガリャエス, ジョアン; カステルス, パブロ (編)、『情報検索の進歩』、コンピュータサイエンス講義ノート、第12036巻、Cham: Springer International Publishing、pp.  28– 34、doi :10.1007/978-3-030-45442-5_4、ISBN 978-3-030-45441-8PMC  7148026
  3. ^ Grand, Adrien; Muir, Robert; Ferenczi, Jim; Lin, Jimmy (2020)、「MAXSCOREからBlock-Max Wandへ:Luceneがクエリ評価パフォーマンスを大幅に向上させた経緯」、Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo (編)、『情報検索の進歩』、Lecture Notes in Computer Science、vol. 12036、Cham: Springer International Publishing、pp.  20– 27、doi :10.1007/978-3-030-45442-5_3、ISBN 978-3-030-45441-8PMC  7148045
  4. ^ Azzopardi, Leif; Moshfeghi, Yashar; Halvey, Martin; Alkhawaldeh, Rami S.; Balog, Krisztian; Di Buccio, Emanuele; Ceccarelli, Diego; Fernández-Luna, Juan M.; Hull, Charlie; Mannix, Jake; Palchowdhury, Sauparna (2017-02-14). 「Lucene4IR:Luceneを用いた情報検索評価リソースの開発」 . ACM SIGIR Forum . 50 (2): 58– 75. doi :10.1145/3053408.3053421. ISSN  0163-5840. S2CID  212416159
  5. ^ 「LuceneImplementations」apache.org2025年3月25日閲覧
  6. ^ KeywordAnalyzer 「Apache LuceneとSolrによる検索の効率化」(PDF) 2007年11月19日. 2012年1月31日時点のオリジナル(PDF)からのアーカイブ。
  7. ^ Cutting, Doug (2019-06-07). 「Xerox PARCでいくつかの検索エンジンを開発し、その後AppleでV-Twinを開発し、Exciteの検索を書き直し、そしてLuceneを開発しました。つまり、LuceneはV-Twin 3.0と言えるのでしょうか? 25年近く経った今でも、V-TwinはMac OS X Search Kitとして生き続けています!」@cutting . 2019-06-19閲覧.
  8. ^ Barker, Deane (2016). Webコンテンツ管理. O'Reilly. p. 233. ISBN 978-1491908105
  9. ^ 「Apache Lucene - Welcome to Apache Lucene」. apache.org . 2016年2月4日時点のオリジナルからのアーカイブ2016年2月4日閲覧
  10. ^ McCandless, Michael; Hatcher, Erik; Gospodnetić, Otis (2010). Lucene in Action, Second Edition . Manning. p. 8. ISBN  978-1933988177
  11. ^ 「GNU/Linux セマンティックストレージシステム」(PDF) . glscube.org . 2010年6月1日時点のオリジナル(PDF)からのアーカイブ。
  12. ^ 「Apache Lucene - クエリパーサー構文」. lucene.apache.org . 2017年5月2日時点のオリジナルからのアーカイブ
  13. ^ J. Beel、S. Langer、B. Gipp、「Docearの研究論文推薦システムのアーキテクチャとデータセット」、ACM/IEEEデジタル図書館合同会議(JCDL 2014)における第3回国際科学出版物マイニングワークショップ(WOSP 2014)の議事録、英国ロンドン、2014年
  14. ^ M. Schwarzer、M. Schubotz、N. Meuschke、C. Breitinger、V. Markl、B. Gipp、https://www.gipp.com/wp-content/papercite-data/pdf/schwarzer2016.pdf 「Wikipediaのリンクベース推薦の評価」、第16回ACM/IEEE-CSデジタル図書館合同会議(JCDL)議事録、米国ニューヨーク州ニューヨーク、2016年、191-200ページ
  15. ^ Wayner, Peter. 「今こそ探索する価値のある11の最先端データベース」。InfoWorld。2015年9月21日時点のオリジナルよりアーカイブ。 2015年9月21日閲覧
  16. ^ 「Elasticsearch:RESTful、分散型検索&分析 - Elastic」。elastic.co 2015年10月8日時点のオリジナルよりアーカイブ。 2015年9月23日閲覧
  17. ^ 「CompassとElasticsearchの未来」。the dude abides。2015年10月15日時点のオリジナルよりアーカイブ2015年10月14日閲覧
  18. ^ ab Natividad, Angela. 「Socialtextが検索機能をアップデート、Kinoに対応」CMS Wire. 2012年9月29日時点のオリジナルよりアーカイブ。 2011年5月31日閲覧
  19. ^ Marvin Humphrey. 「KinoSearch - 検索エンジンライブラリ - metacpan.org」p3rl.org 。 2015年9月23日閲覧
  20. ^ Diment, Kieren; Trout, Matt S (2009). 「Catalyst Cookbook」. Catalyst決定版ガイド. Apress . p. 280. ISBN 978-1-4302-2365-8
  21. ^ Wishart, DS ; et al. (2009年1月). 「HMDB:ヒトメタボロームのための知識ベース」. Nucleic Acids Res. 37 (データベース号): D603–10. doi :10.1093/nar/gkn810 . PMC 2686599. PMID  18953024  
  22. ^ リム、エミリア;ポン、アリソン;ジュンボウ、ヤニック;ノックス、クレイグ;シュリヴァスタヴァ、サビタ;グオ、アン・チ;ヌヴー、ヴァネッサ;ウィシャート、デビッド・S.(2010年1月)「T3DB:一般的な毒素とその標的に関する包括的注釈付きデータベース」Nucleic Acids Res . 38(データベース号):D781–6. doi :10.1093/nar/gkp934. PMC 2808899. PMID 19897546.   

参考文献

  • Official website
Retrieved from "https://en.wikipedia.org/w/index.php?title=Apache_Lucene&oldid=1315414153#History"