Remove ads
insieme delle tecniche utilizzate per gestire la rappresentazione, la memorizzazione, l'organizzazione e l'accesso ad oggetti contenenti informazioni quali documenti, pagine web, cataloghi online e oggetti multimediali Da Wikipedia, l'enciclopedia libera
L'information retrieval (IR), talvolta, meno di frequente, reso in lingua italiana come reperimento dell'informazione,[1][2][3][N 1] è l'insieme delle tecniche utilizzate per gestire la rappresentazione, la memorizzazione, l'organizzazione e l'accesso ad oggetti contenenti informazioni quali documenti, pagine web, cataloghi online e oggetti multimediali. Il termine è stato coniato da Calvin Mooers alla fine degli anni quaranta del Novecento ed oggi è usato quasi esclusivamente in ambito informatico.
È un campo interdisciplinare che nasce dall'incrocio di discipline diverse coinvolgendo la psicologia cognitiva, l'architettura informativa, la filosofia (vedi la voce ontologia), il design, il comportamento umano sull'informazione, la linguistica, la semiotica, la scienza dell'informazione e l'informatica. Molte università e biblioteche pubbliche utilizzano sistemi di information retrieval per fornire accesso a pubblicazioni, libri ed altri documenti.
Lo scopo dell'information retrieval è di soddisfare il cosiddetto "bisogno informativo dell'utente", ovvero garantire a quest'ultimo, in seguito ad una sua ricerca, i documenti e le informazioni che rispondono alla sua richiesta.
Due concetti sono di fondamentale importanza per analizzare un sistema di information retrieval: query ed oggetto.
Comunemente, si definisce task di un sistema di information retrieval una situazione tipica che un sistema di questo genere deve risolvere.
Nel momento in cui un utente intende usare un qualsiasi sistema di reperimento dell'informazione (per esempio, un motore di ricerca) per acquisire informazioni su un determinato argomento, questi deve tradurre tale necessità in una query; il sistema di information retrieval ha il compito di restituire, a partire da essa, tutti i documenti rilevanti alla richiesta effettuata.
Ci sono molti modi per misurare quanto l'informazione intesa si associa bene all'informazione recuperata.
La precisione (in inglese precision) è la proporzione di documenti pertinenti fra quelli recuperati:
Nella classificazione binaria la precisione è analoga al valore positivo di previsione.
La precisione può anche essere valutata rispetto a un certo valore soglia, indicato con P@n, piuttosto che relativamente a tutti i documenti recuperati: in questo modo, si può valutare quanti fra i primi n documenti recuperati sono rilevanti per la query.
Il significato e l'uso del termine precisione nel campo dell'information retrieval differiscono quindi dalla definizione di accuratezza e precisione tipiche di altre discipline scientifiche e tecnologiche.
Il recupero o richiamo (in inglese recall) è la proporzione fra il numero di documenti rilevanti recuperati e il numero di tutti i documenti rilevanti disponibili nella collezione considerata:
Nella classificazione binaria, questo valore è chiamato sensitività.
La misura F (in inglese F-measure) è la media armonica pesata fra precisione e recupero. La versione tradizionale, detta anche bilanciata, è data da:
Questa misura è anche detta , perché sia la precisione che il recupero nella formula precedente hanno appunto il peso 1.
In generale, la formula è:
Altre due formule comuni sono , che assegna alla precisione un peso doppio rispetto al recupero, e la , che al contrario pesa il recupero al doppio della precisione.
Per concludere con successo una ricerca di informazioni, è necessario rappresentare i documenti in qualche modo. C'è un certo numero di modelli aventi tale scopo. Essi possono essere classificati secondo due criteri, come mostrato in figura: in base ad un criterio matematico e in base alle proprietà del modello (tradotto da fonte originale logos-verlag.de.).
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.