التعرف الضوئي على الحروف وانشاء نموذج للغة العربية

السلام عليكم ورحمة الله وبركاته الأخوة الأعزاء

هل أحد يعرف يتعامل مع برنامج التعرف الضوئي على الحروف باستخدام تطبيق Tesseract OCR وكيف يتم تدريبه باستخدام أداة jtessboxeditor وإنشاء نموذج مخصص للتعرف على النصوص العربية لمجموعة من الصور بها نصوص عربية، لو أحد من حضؤاتكم لديه المعرفة الفنية. بهذه الأمور ممكن يبغني للتواصل معه إن شاء الله ،،،،

شكرا لكم …

إعجابَين (2)

وعليكم ورحمة الله وبركاته
لا اظن ان احد هنا لديه خبرة

إعجاب واحد (1)

هذا رد الذكاء الاصطناعي
برنامج Tesseract OCR من أقوى الأدوات للتعرف على النصوص داخل الصور، ويمكن تخصيصه لتحديد النصوص العربية باستخدام jtessboxeditor أو أدوات أخرى مشابهة. فيما يلي شرح مختصر للخطوات المطلوبة:


1. إعداد البيئة:

  • تحميل Tesseract:

    • قم بتنزيل Tesseract OCR من الموقع الرسمي أو عن طريق مدير الحزم (مثل apt في لينكس أو Chocolatey في ويندوز).
    sudo apt install tesseract-ocr
    
  • تثبيت jtessboxeditor:

    • قم بتحميل أداة jtessboxeditor وهي أداة جافا تُستخدم لتحرير وإدارة الملفات الخاصة بالصندوق (box files).

2. جمع البيانات:

  • اجمع صورًا تحتوي على النصوص العربية المراد التعرف عليها.
  • تأكد أن الصور عالية الجودة وخالية من التشويش.

3. إنشاء الملفات الأولية:

  • قم بإنشاء بيانات تدريب باستخدام أمر Tesseract لإنشاء ملفات .box:
    tesseract image.png output_name -l ara --psm 6 box.train
    
    • image.png: الصورة المستخدمة.
    • output_name: اسم الملف الناتج.
    • -l ara: لتحديد اللغة العربية.
    • --psm 6: لتحديد وضع تحليل التخطيط.

4. تحرير وتصحيح ملفات الصندوق باستخدام jtessboxeditor:

  • افتح ملفات .box باستخدام أداة jtessboxeditor.
  • قم بمراجعة وتصحيح البيانات بحيث تطابق الأحرف في الصورة مع النصوص.

5. تجميع بيانات التدريب:

  • بعد تصحيح الملفات، قم بتحويلها إلى ملفات يمكن لـ Tesseract استخدامها للتدريب.
  • استخدم الأمر:
    tesseract image.png output_name -l ara --psm 6 box.train
    

6. إنشاء نموذج مخصص:

  • استخدم الأدوات المدمجة في Tesseract لإنشاء نموذج تدريب جديد:

    • قم بتجميع ملفات .box و.tr الناتجة.
    • استخدم أمر combine_tessdata لإنشاء نموذج اللغة المخصص.
    combine_tessdata ara
    

7. استخدام النموذج الجديد:

  • قم باستبدال النموذج الافتراضي في Tesseract بالنموذج الجديد أو استخدمه مع الأمر:
    tesseract image.png output -l custom_ara_model
    

8. التحقق والتعديل:

  • اختبر النموذج على الصور للتأكد من دقة النتائج.
  • قم بتحسين البيانات وتكرار التدريب إذا لزم الأمر.

إعجاب واحد (1)

شكرا لحضرتك واهتمامك بارك الله فيك

إعجاب واحد (1)