Nutch
logiciel informatique / De Wikipedia, l'encyclopédie encyclopedia
Cher Wikiwand IA, Faisons court en répondant simplement à ces questions clés :
Pouvez-vous énumérer les principaux faits et statistiques sur Nutch?
Résumez cet article pour un enfant de 10 ans
Nutch est une initiative visant à construire un moteur de recherche open source. Il utilise Lucene comme bibliothèque de moteur de recherche et d'indexation. En revanche, le robot de collecte a été créé spécifiquement pour ce projet.
Cet article est une ébauche concernant l’informatique.
Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.
Développé par | Doug Cutting |
---|---|
Dernière version | 1.19 ()[1] |
Dépôt | github.com/apache/nutch |
Écrit en | Java |
Système d'exploitation | Multiplateforme |
Environnement | Windows, Mac OS X, GNU/Linux |
Formats lus | WARC (en) |
Formats écrits | WARC (en) |
Type | moteur de recherche open source |
Licence | Licence Apache |
Site web | nutch.apache.org |
L'architecture de Nutch est hautement modulaire et permet à des développeurs de créer des plugins pour différentes phases du processus : récupération des données, analyse des documents, recherche, etc.
Doug Cutting est l'initiateur et le coordinateur de ce projet.
Il est entièrement développé en langage Java, mais les données qu'il manipule sont dans un format de données indépendant de tout langage de programmation. En a été présenté une version opérationnelle d'une démonstration de Nutch sur une base regroupant 100 millions de documents.