واجهة برمجة تطبيقات JavaScript مفتوحة المصدر لإضافة وإدارة التعرف الضوئي على الحروف إلى تطبيقات الويب
مكتبة جافا سكريبت مجانية رائدة لإضافة وظيفة التعرف البصري على الأحرف (OCR) إلى تطبيقات الويب JS وتحويل صور النص المطبوع أو المكتوب بخط اليد إلى نص يمكن قراءته آليًا مجانًا.
Tesseract.js هي مكتبة جافا سكريبت مفتوحة المصدر ومفيدة للغاية، حيث تمكن مطوري البرامج من دمج وظيفة التعرف الضوئي على الحروف (OCR) داخل تطبيقات الويب الخاصة بهم بأقل جهد وتكلفة. التعرف الضوئي على الحروف (OCR) هو عملية تحويل صور النص المطبوع أو المكتوب بخط اليد إلى نص يمكن قراءته آليًا. Tesseract.js هو منفذ لمحرك Tesseract OCR الشهير، والذي تم تطويره في الأصل بواسطة شركة Hewlett-Packard في الثمانينيات وتمت صيانته لاحقًا بواسطة Google. يمكن لـ Tesseract.js التعرف على أكثر من 100 لغة، مما يجعلها أداة قوية للمطورين الذين يتطلعون إلى إضافة وظيفة التعرف الضوئي على الحروف إلى تطبيقات الويب الخاصة بهم.
من السهل جدًا التعامل مع Tesseract.js ويمكن استخدامه لمجموعة متنوعة من المهام، مثل استخراج النص من المستندات الممسوحة ضوئيًا والإيصالات وبطاقات العمل، وأتمتة مهام إدخال البيانات بالإضافة إلى تحسين وظيفة البحث داخل تطبيقات الويب. إحدى المزايا الرئيسية لـ Tesseract.js هي قدرته على التعرف على النص حتى عندما تكون الصورة المدخلة ذات جودة أو دقة رديئة. تستخدم المكتبة خوارزميات التعلم الآلي لتحسين دقة نتائج التعرف الضوئي على الحروف. ويمكنه أيضًا إجراء تحليل تخطيط الصفحة واكتشاف المناطق محل الاهتمام داخل الصورة.
يحظى Tesseract.js بشعبية كبيرة نظرًا لسهولة استخدامه بالإضافة إلى إمكانات التعرف الضوئي على الحروف القوية ويمكن تشغيله بسلاسة إما في متصفح أو على خادم باستخدام NodeJS. فهو يوفر واجهة برمجة تطبيقات بسيطة تسمح لمطوري البرامج بتكوين خيارات التعرف الضوئي على الحروف مثل اللغة ووضع تجزئة الصفحة وأحرف القائمة البيضاء. إن قدرته على التعرف على النص من الصور ذات الجودة الرديئة ودعم لغات متعددة تجعله أداة قيمة لمجموعة واسعة من التطبيقات واختيارًا ممتازًا للمطورين الذين يتطلعون إلى إضافة التعرف الضوئي على الحروف إلى تطبيقات الويب الخاصة بهم.
البدء مع Tesseract.js
الطريقة الموصى بها لتثبيت Tesseract.js هي استخدام npm. الرجاء استخدام الأمر التالي للتثبيت السلس
قم بتثبيت Tesseract.jsvia npm
npm install tesseract.js
يمكنك أيضًا تثبيته يدويًا؛ قم بتنزيل أحدث ملفات الإصدار مباشرةً من مستودع GitHub.
تحويل الصورة إلى نص عبر JavaScript API
تسهل مكتبة JavaScript مفتوحة المصدر Tesseract.js على مطوري البرامج العمل مع أنواع مختلفة من الصور مثل BMP وJPG وPNG وPBM وWebP وغيرها. تدعم المكتبة استخراج النص من الصور لأتمتة معالجة النصوص على الصور وملفات PDF والمستندات الممسوحة ضوئيًا. يوضح المثال التالي كيفية تحميل صورة واستخراج النص منها باستخدام سطرين فقط من التعليمات البرمجية. يتم استخدام وسيطة اللغة لتحديد بيانات اللغة المدربة لاستخدامها في معالجة الصور. يمكن لمطوري البرامج استخدام لغات متعددة هنا.
كيفية تحويل الصورة إلى نص باستخدام JavaScript API؟
Tesseract.recognize(
image,language,
{
logger: m => console.log(m)
}
)
.catch (err => {
console.error(err);
})
.then(result => {
console.log(result);
})
}
قراءة منطقة الصورة واستخراج النص عبر JS API
تتضمن مكتبة جافا سكريبت مفتوحة المصدر ميزات مفيدة جدًا لقراءة منطقة معينة داخل الصورة والتقاط بياناتها داخل تطبيقات جافا سكريبت. تدعم واجهة برمجة التطبيقات (API) التقاط منطقة الصورة وتحاول التعرف على النص داخل هذه المنطقة باستخدام محرك التعرف الضوئي على الحروف (OCR) الداخلي القوي. توضح الأمثلة التالية كيف يمكن لمطوري البرامج توفير عنوان URL للصورة ويمكن لواجهة برمجة التطبيقات (API) اكتشاف النص والتعرف عليه بسهولة في المنطقة المحددة.
قراءة النص والتعرف عليه في منطقة محددة من الصورة عبر JS API
const { createWorker } = require('tesseract.js');
const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };
(async () => {
await worker.loadLanguage('eng');
await worker.initialize('eng');
const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
console.log(text);
await worker.terminate();
})();