Remove ads
من ويكيبيديا، الموسوعة الحرة
التعرّف على خط اليد هو قدرة جهاز الحاسوب على تلقي وتفسير المدخلات المكتوبة بخط اليد من مصادر مثل المستندات الورقية والصور الفوتوغرافية والشاشات اللمسية وغيرها من الأجهزة. قد يجري استشعار صورة النص المكتوب «دون اتصال» من قطعة من الورق عن طريق المسح البصري (التعرف الضوئي على الحروف) أو التعرف الذكي على الكلمات. وبدلاً من ذلك، يمكن استشعار حركات رأس القلم «مع اتصال»، على سبيل المثال بواسطة سطح شاشة حاسوب بميزة القلم، وهي مهمة أسهل عمومًا نظرًا لوجود المزيد من الأدلة المتوفرة.
يستلزم التعرف على الكتابة اليدوية أساسًا التعرف على الحروف البصرية. ومع ذلك، فإن نظام التعرف على الكتابة اليدوية الكامل يعالج أيضًا التنسيق، وينفذ التجزئة الصحيحة إلى أحرف بالإضافة إلى إيجاد الكلمات المتطابقة.
يتضمن التعرف على خط اليد دون اتصال التحويل التلقائي للنص الموجود في صورة ما إلى رموز أحرف قابلة للاستخدام في تطبيقات معالجة النصوص والحاسوب. تعتبر البيانات التي حصل هذا النموذج بمثابة تمثيل ثابت من الكتابة اليدوية. من الصعب نسبيا التعرف على خط اليد، لأن كثير من الناس لديهم أنماط مختلفة في الكتابة اليدوية. ولذلك تركز محركات OCR أساسًا على النص المطبوع على الآلة فيما تركز ICR على خط اليد «المكتوب بحروف كبيرة».
تضييق نطاق المشكلة غالبًا ما يساعد على زيادة دقة أنظمة التعرف على الكتابة اليدوية. على سبيل المثال، قد يحتوي حقل نموذج لرمز بريدي بالولايات المتحدة على الأرقام من 0 إلى 9 فقط. هذه الحقيقة من شأنها أن تقلل من عدد الهويات الممكنة.
الأساليب الأساسية:
عادةً ما يتضمن التعرف على الأحرف (بدون اتصال) على فحص نموذج أو مستند مكتوب في وقت ما في الماضي. هذا يعني أنه يجب استخلاص الأحرف الفردية الموجودة في الصورة الممسوحة ضوئيًا. توجد أدوات قادرة على تنفيذ هذه الخطوة. ولكن هنالك بعض العيوب في هذه الخطوة أكثرها شيوعا الحروف المتصلة. وهذا يسبب مشكلة كبيرة في مرحلة التعرف. ورغم ذلك هنالك العديد من الخوارزميات المتاحة التي تقلل من مشاكل الحروف المتصلة.
بعد استخراج الأحرف الفردية يُستخدم محرك التعرف لإيجاد حرف الحاسوب المطابق. وتوجد عدة تقنيات مختلفة المتاحة حاليا التعرف والمطابقة.[1]
تعمل طريقة استخلاص السمات أو الخصائص بطريقة مشابهة لمعرفات الشبكة العصبية. ومع ذلك، يجب على المبرمجين تحديد الخصائص التي يشعرون أنها مهمة.
بعض الأمثلة على الخصائص تشمل:
بينما تركز التقنيات التقليدية على تقسيم الأحرف الفردية من أجل التعرف عليها، تركز التقنيات الحديثة على التعرف على جميع الأحرف في سطر نص مجزأ. وتركز خصوصًا على تقنيات التعلم الآلي القادرة على تعلم السمات المرئية، وتجنب هندسة المقاييس المحددة المستخدمة سابقًا. تستخدم الأساليب الحديثة شبكات عصبية لاستخراج سمات مرئية عبر عدة إطارات متداخلة لصورة خطية تستخدمها RNN لإنتاج احتمالات الأحرف..
يتضمن التعرف (المتصل) على خط اليد التحويل الآلي للنص كما هو مكتوب على محول رقمي خاص أو المساعد الرقمي الشخصي، حيث يلتقط جهاز الاستشعار تحركات طرف القلم وكذلك التبديل بين رفع القلم وإنزاله. يُعرف هذا النوع من البيانات بالحبر الرقمي ويمكن اعتباره تمثيلًا رقميًا لخط اليد. تحول الإشارة التي حصل عليها إلى رموز حرف والتي يمكن استخدامها داخل الحاسوب وتطبيقات معالجة النصوص. تتضمن عناصر واجهة التعرف على الكتابة اليدوية على الإنترنت عادةً ما يلي:
يمكن تقسيم عملية التعرف (المتصل) على الكتابة اليدوية إلى خطوات عامة قليلة:
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.