Lucene
Da Wikipedia, l'enciclopedia encyclopedia
Apache Lucene è una API gratuita ed open source per il reperimento di informazioni inizialmente implementata in Java da Doug Cutting. È supportata dall'Apache Software Foundation ed è resa disponibile con l'Apache License. Lucene è stata successivamente reimplementata in Perl, C#, C++, Python, Ruby e PHP.
Lucene software | |
---|---|
Genere | Application programming interface (non in lista) |
Sviluppatore | Apache Software Foundation |
Data prima versione | 30 marzo 2000 |
Ultima versione | 9.10.0 (20 febbraio 2024) |
Sistema operativo | Multipiattaforma |
Linguaggio | Java |
Licenza | Apache License 2.0 (licenza libera) |
Sito web | lucene.apache.org/core/ |
Sebbene concepita per realizzare applicazioni che necessitano di funzionalità di indicizzazione e ricerca full text, Lucene è molto nota ed usata per la realizzazione di motori di ricerca sia sul World Wide Web che sulle Intranet private. Questo ha portato all'affermazione di una percezione del prodotto come di un motore di ricerca dotato di web spider e parser HTML. In realtà l'utilizzo di Lucene richiede che tali moduli siano forniti esternamente.
I dati gestiti da Lucene sono rappresentati come documenti (document) dotati di campi (fields) testuali. Questa genericità consente di realizzare, con le API di Lucene, prodotti indipendenti dal formato dei file: possono essere indicizzati con Lucene testi in PDF, HTML, Microsoft Word così come in ogni altro tipo di file dal quale sia possibile estrarre informazioni.
Lucene è stato re-implementato (o è in corso di re-implementazione) anche in C, C++, Delphi, C#/.NET, Perl, Ruby, PHP e Common Lisp.
Il software Apache Tika per la ricerca testuale è stato per un periodo un sottoprogetto di Lucene, prima di diventare autonomo nel 2007.