From Wikipedia, the free encyclopedia
Optiline märgituvastus (ka optiline tekstituvastus, inglise keeles optical character recognition ehk OCR) on trükitud või käsitsi kirjutatud teksti teisendamine masinloetavale kujule.
Esmalt salvestatakse tekst pildi kujul skanneri või digikaamera abil arvutisse. Seejärel otsib tekstituvastustarkvara pildilt üles tähemärgid ja teisendab need digitaalsele kujule, näiteks Unicode'i märkideks.
Tähemärkide tuvastamine võib ebaõnnestuda erinevatel põhjustel:
Tuvastamise täpsust saab parandada piirates võimalikke sõnu. Näiteks esinevad tekstis tõenäolisemalt sõnaraamatusõnad kui tundmatud sõnad.
Pildid, videod ja helifailid Commonsis: Optiline märgituvastus |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.