واجهة برمجة تطبيقات JavaScript مفتوحة المصدر لإضافة وإدارة التعرف الضوئي على الحروف إلى تطبيقات الويب

مكتبة جافا سكريبت مجانية رائدة لإضافة وظيفة التعرف البصري على الأحرف (OCR) إلى تطبيقات الويب JS وتحويل صور النص المطبوع أو المكتوب بخط اليد إلى نص يمكن قراءته آليًا مجانًا.

Tesseract.js هي مكتبة جافا سكريبت مفتوحة المصدر ومفيدة للغاية، حيث تمكن مطوري البرامج من دمج وظيفة التعرف الضوئي على الحروف (OCR) داخل تطبيقات الويب الخاصة بهم بأقل جهد وتكلفة. التعرف الضوئي على الحروف (OCR) هو عملية تحويل صور النص المطبوع أو المكتوب بخط اليد إلى نص يمكن قراءته آليًا. Tesseract.js هو منفذ لمحرك Tesseract OCR الشهير، والذي تم تطويره في الأصل بواسطة شركة Hewlett-Packard في الثمانينيات وتمت صيانته لاحقًا بواسطة Google. يمكن لـ Tesseract.js التعرف على أكثر من 100 لغة، مما يجعلها أداة قوية للمطورين الذين يتطلعون إلى إضافة وظيفة التعرف الضوئي على الحروف إلى تطبيقات الويب الخاصة بهم.

من السهل جدًا التعامل مع Tesseract.js ويمكن استخدامه لمجموعة متنوعة من المهام، مثل استخراج النص من المستندات الممسوحة ضوئيًا والإيصالات وبطاقات العمل، وأتمتة مهام إدخال البيانات بالإضافة إلى تحسين وظيفة البحث داخل تطبيقات الويب. إحدى المزايا الرئيسية لـ Tesseract.js هي قدرته على التعرف على النص حتى عندما تكون الصورة المدخلة ذات جودة أو دقة رديئة. تستخدم المكتبة خوارزميات التعلم الآلي لتحسين دقة نتائج التعرف الضوئي على الحروف. ويمكنه أيضًا إجراء تحليل تخطيط الصفحة واكتشاف المناطق محل الاهتمام داخل الصورة.

يحظى Tesseract.js بشعبية كبيرة نظرًا لسهولة استخدامه بالإضافة إلى إمكانات التعرف الضوئي على الحروف القوية ويمكن تشغيله بسلاسة إما في متصفح أو على خادم باستخدام NodeJS. فهو يوفر واجهة برمجة تطبيقات بسيطة تسمح لمطوري البرامج بتكوين خيارات التعرف الضوئي على الحروف مثل اللغة ووضع تجزئة الصفحة وأحرف القائمة البيضاء. إن قدرته على التعرف على النص من الصور ذات الجودة الرديئة ودعم لغات متعددة تجعله أداة قيمة لمجموعة واسعة من التطبيقات واختيارًا ممتازًا للمطورين الذين يتطلعون إلى إضافة التعرف الضوئي على الحروف إلى تطبيقات الويب الخاصة بهم.

نظرة سريعة

نظرة عامة على ميزات Tesseract.js.

نظرة عامة على الميزات

إجراء التعرف الضوئي على الحروف
أضف قدرات التعرف الضوئي على الحروف
التعرف على نص الصورة
تحويل صور النص
نص الخط الذي تم التعرف عليه
البحث في ملف PDF
أكثر من 100 لغة
إنشاء تطبيقات التعرف الضوئي على الحروف
حفظ في المتصفح
استخرج النص
دعم تعدد الخيوط

Tesseract.js

يدعم Tesseract.js تنسيقات ملفات الصور الشائعة المدرجة أدناه.

قارئ

PNG, JPEG, BMP, TIFF, TGA, DICOM

كاتب

PNG, JPEG, BMP, TIFF

Tesseract.js

استقلالية النظام الأساسي

يمكن أن يعمل Tesseract.js مع أي لغة برمجة تعتمد على Java

Java

Tesseract.js

البدء مع Tesseract.js

الطريقة الموصى بها لتثبيت Tesseract.js هي استخدام npm. الرجاء استخدام الأمر التالي للتثبيت السلس

قم بتثبيت Tesseract.jsvia npm

 npm install tesseract.js

يمكنك أيضًا تثبيته يدويًا؛ قم بتنزيل أحدث ملفات الإصدار مباشرةً من مستودع GitHub.

تحويل الصورة إلى نص عبر JavaScript API

تسهل مكتبة JavaScript مفتوحة المصدر Tesseract.js على مطوري البرامج العمل مع أنواع مختلفة من الصور مثل BMP وJPG وPNG وPBM وWebP وغيرها. تدعم المكتبة استخراج النص من الصور لأتمتة معالجة النصوص على الصور وملفات PDF والمستندات الممسوحة ضوئيًا. يوضح المثال التالي كيفية تحميل صورة واستخراج النص منها باستخدام سطرين فقط من التعليمات البرمجية. يتم استخدام وسيطة اللغة لتحديد بيانات اللغة المدربة لاستخدامها في معالجة الصور. يمكن لمطوري البرامج استخدام لغات متعددة هنا.

كيفية تحويل الصورة إلى نص باستخدام JavaScript API؟

Tesseract.recognize(
  image,language,
  { 
    logger: m => console.log(m) 
  }
)
.catch (err => {
  console.error(err);
})
.then(result => {
 console.log(result);
})
}

قراءة منطقة الصورة واستخراج النص عبر JS API

تتضمن مكتبة جافا سكريبت مفتوحة المصدر ميزات مفيدة جدًا لقراءة منطقة معينة داخل الصورة والتقاط بياناتها داخل تطبيقات جافا سكريبت. تدعم واجهة برمجة التطبيقات (API) التقاط منطقة الصورة وتحاول التعرف على النص داخل هذه المنطقة باستخدام محرك التعرف الضوئي على الحروف (OCR) الداخلي القوي. توضح الأمثلة التالية كيف يمكن لمطوري البرامج توفير عنوان URL للصورة ويمكن لواجهة برمجة التطبيقات (API) اكتشاف النص والتعرف عليه بسهولة في المنطقة المحددة.

قراءة النص والتعرف عليه في منطقة محددة من الصورة عبر JS API

const { createWorker } = require('tesseract.js');

const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };

(async () => {
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
  console.log(text);
  await worker.terminate();
})();