Loading AI tools
집합적인 정보로부터 원하는 내용과 관련이 있는 부분을 얻어 내는 행위 위키백과, 무료 백과사전
정보 검색(情報檢索, information retrieval)은 집합적인 정보로부터 원하는 내용과 관련이 있는 부분을 얻어 내는 행위를 말한다. 이를 위해 메타데이터나 색인이 사용될 수 있다.
자동화된 정보 검색 시스템은 소위 ‘정보 과부하’라 불리는 상태를 완화시키기 위해 사용된다. 많은 대학 및 공공 도서관들이 보유 서적 및 저널, 각종 문서들에 대한 접근성을 제공하기 위해 정보 검색 시스템을 구축한다. 웹 검색 엔진은 일상적으로 가장 쉽게 접할 수 있는 정보 검색 시스템 중 하나이다.
“ | 지난 몇 달 동안 일기를 계속 녹음해 왔지만 찾아보고 싶을 때 어떻게 찾아봐야 할까, 하는 생각은 단 한 번도 해보지 못했습니다. | ” |
정보를 검색하기 위해 컴퓨터를 사용한다는 아이디어는 1945년 버니바 부시가 디 애틀랜틱 지에 기고한 '우리가 생각하는 대로(As We May Think)'를 통해 대중화되었다.[2] 최초의 자동화 정보 검색 시스템은 1950~1960년대에 도입되었다. 1970년까지 수 천 개 문서의 모음인 크랜필드 콜렉션(Cranfield collection)과 같은 소규모 말뭉치를 대상으로 하는 몇몇 방법들이 학계에 소개되었다.[2] 록히드 다이얼로그 시스템(Lockheed Dialog system)과 같은 대규모 검색 시스템은 1970년대 초부터 사용되기 시작하였다.
1992년 미국 국방부는 미국 국립표준기술연구소(NIST)와 함께 텍스트 검색 컨퍼런스(Text Retrieval Conference, TREC)를 후원하였으며, 이것은 TIPSTER 텍스트 프로그램의 일부였다. 이 프로그램의 목적은 대규모 텍스트를 위한 텍스트 검색 방법론의 성능 측정에 필요한 제반 시설을 지원함으로써 정보 검색 관련 학계를 후원하는 것이었다. 이를 통해 매우 큰 말뭉치에 적용 가능한 확장성 높은 검색 방법에 대한 연구가 촉진되었다. 그리고 웹 검색 엔진의 등장으로 인해 이러한 대규모 검색 시스템에 대한 요구는 더욱 커지게 되었다.
오늘날의 정보검색시스템은 크게 데이터집합, 색인, 랭킹, 표현, 사용자 피드백이라는 다섯 가지 요소로 구성되어 있다.
정보 검색 모델에는 불리안 모델(boolean model), 벡터 모델(vector model) 등이 있다. 불리안 모델은 한 개의 질의어에 있는 두 개 이상의 키워드가 and, or, not에 의하여 연결되어 있는 경우, 이들을 논리곱의 합의 형태로 변환하여, 각각의 논리곱이 각 문서에 존재하는지를 체크하는 방법이다. 벡터 모델은 질의어와 각각의 문서를 모든 색인어에 대한 벡터 형태로 나타낸 후, 질의어와 각 문서의 벡터곱을 유사도로 이용하여 문서들을 랭킹하는 방법이다.[3][4]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.