From Wikipedia, the free encyclopedia
El reconeixement intel·ligent de caràcters (en anglès, Intelligent character recognition, ICR) és un sistema avançat del reconeixement òptic de caràcters per a «legir» texts escrits a mà.[1]
Aquest article o aquest apartat conté informació obsoleta o li falta informació recent. |
Un programari ICR és «intel·ligent» en el sentit que té la capacitat d'aprendre les lletres de l'estil personal d'escriptura a mà durant el procés i així pot millorar la qualitat del reconeixement. Té dues aplicacions principals: la transliteració fora de línia a partir d'un escaneig de documents manuscrits o mecanografiats en paper o un altre suport, i l'aplicació en línia. Aquesta darrere es fa servir per introduir notes amb una tauleta tàctil en text de maquinari com a alternativa del teclat. Una aplicació particular és la transliteració de manuscrits antics, o a més de l'estil gràfic particular hi ha el problema de la llengua i ortografia antigues, que el fan més difícil interpretar ambiguïtats.
Ja des de la fi dels anys vuitanta del segle xx, una de les primers aplicacions industrials va ser la lectura automàtica d'adreces de les sobrecartes als centres de triatge de correus.[2] El reconeixement intel·ligent encara no obté la mateixa precisió que OCR, així i tot pot atènyer una precisió del 97% o superior. S'utilitza per transliterar text escrit a mà, text mecanografiat i fonts poc habituals.
El procés d'ICR, majoritàriament es divideix en aquests set passos.
El reconeixement intel·ligent de caràcters (ICR), el reconeixement òptic de caràcters (OCR) i el reconeixement de marques òptiques (OMR) són mètodes orientats a disminuir la quantitat d'entrades de dades manuals. Per omplir formularis, OMR és una tecnologia molt especialitzada, ja que conté marques d'identificació (quadres negres al principi i al final del formulari). En OCR i ICR són més flexibles, no utilitzen marques de temps, però sí marques de registre (caselles). Recuperar continguts, només és possible amb ICR i OCR, ja que OMR no fa un escaneig de la imatge. En precisió, OMR aconsegueix una eficàcia del 99%, mentre que OCR del 98% i ICR del 97% si l'entrada ha estat neta i s'utilitza una edició sobre context.
Les millors eines de processament de formularis combinen OCR i ICR per donar-li la màxima flexibilitat, cosa que li permet combinar diversos tipus de respostes en una base de dades. Això pot ser útil per a molts tipus de documents, que van des de les enquestes i qüestionaris als xecs bancaris.
Aquests són alguns exemples de programari ICR.
Empresa | Productes | Llengües que suporta ICR |
---|---|---|
Parascript | Parascript CheckPlus
Parascript AddressScript Parascript FormXtra Parascript FieldScript |
Anglès, Francès, Alemany, Italià, Kazak, Portuguès, Rus i Espanyol |
A2IA | A2iA DocumentReader
A2iA CheckReader A2iA AddressReader A2iA FieldReader |
Anglès, Francès, Alemany, Italià, Portuguès i Espanyol |
ABBYY | ABBYY FlexiCapture
ABBYY FlexiCapture Engine ABBYY FineReader Engine |
Afrikaans, Albanès, Aimara, Azerbaidjan (Amèrica), Basc, Bemba, Blackfoot, Bretó, Bogotà, Búlgar, Cebuano, Chamorro, Tàrtar, Croat, Cors, Txec, Dakota (Sioux), Holandès (Bèlgica), Holandès (Països Baixos), Anglès, Estonià, Evenki, Fiji, Finlandès, Francès, Friso, Friulano, Gallec, Ganda, Alemany, Alemany (Luxemburg), Alemany (nova ortografia), Grec, Guaraní, Hani, Hausa, Hawaià, Hongarès, Islandès, Indonesi, Irlandès, Italià, Jingpo, Karachay-Balkària, Kasub, Kawa, Kazakhstan, Kirguizstan, Congolès, Kpelle, Kumyk, Kurd, Llatí, Letó, Lituà, Luba, Madagascar, Malinké, el Maori, el Maia, Miao, Minangkabau, Mohawk, Moldau, Mongol, Mordvin, el Náhuatl, Nivkh, Nogayos, Nyanja, Ojibway, Francès antic, Alemany antic, Italià antic, Espanyol antic, el Papiamento, Polonès, Quítxua, Rhaeto Romànic, Romanès, Romaní, Rundi, Rus, Ruandès, Sami (lapons), Samoa, el Gaèlic Escocès, Selkup, Serbi, Eslovac, Eslovè, Somàlia, Sotho, Espanyol, Suahili, Swaziland, Tagalog, Tahitià, Tok Pisin, Tonga, Tswana, Tun, Turc, Uigur (Amèrica), Ucraïnès, el Wòlof, Xhosa, Anat zapoteca i Interlingua |
Accusoft Pegasus | SmartZone ICR/OCR | Anglès, Danès, Alemany, Finlandès, Francès, Alemany, Italià, Noruec, Portuguès, Espanyol i Suec (.NET supports all listed, ActiveX is English only) |
Cognitive Technologies | Cognitive Forms | Rus |
ExperVision | TypeReader
OpenRTK |
Anglès, Francès, Alemany, Italià, Espanyol, Portuguès, Danès, Alemany, Suec, Noruec, Hongarès, Polac, Xinès, Xinès tradicional, Rus, Finlandès i Polinès |
I.R.I.S. Group | IRISCapture Pro for Forms | Latin based languages |
LEADTOOLS | LEADTOOLS ICR SDK Module | Català, Txec, Danès, Alemany, Anglès, Finès, Francès, Alemany, Hongarès, Italià, Noruec, Polac, Portuguès, Espanyol i Suec |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.