SpeechPy
ספריית פייתון בקוד פתוח לזיהוי דיבור
Python API שתומך בעיבוד דיבור כמו גם בפעולות זיהוי. הוא תומך גם ב-MFCC ובאנרגיות של בנק מסנן לצד אנרגיית הלוג של בנק מסננים.
ספריית SpeechPy סיפקה קבוצה של טכניקות שימושיות לעיבוד דיבור, כמו גם זיהוי ופעולות חשובות לאחר עיבוד באמצעות פקודות Python. תכונות דיבור מתקדמות שונות כמו MFCCs ואנרגיות בנק סינון לצד אנרגיית הרישום של בנק מסננים נתמכות באופן מלא על ידי ספריית SpeechPy.
הספרייה שואפת גם לספק את כל הפונקציונליות הדרושה ליישומי למידה עמוקה כגון זיהוי דיבור (AS) או זיהוי דיבור אוטומטי (ASR). הוא סיפק מספר פונקציות חשובות לחישוב תכונות הדיבור העיקריות כגון חישוב תכונות MFCC מאות שמע, מחשוב אנרגיה של בנק מסנן מל, מחשוב יומן תכונות אנרגיה של בנק Mel-filter מאות שמע, חילוץ תכונות נגזרות זמניות, חילוץ מקדם cepstral תדר mel, ועוד רבים.
תחילת העבודה עם SpeechPy
הדרך הקלה ביותר להתקין את ספריית SpeechPy היא שימוש ב-Python Package Index (PyPI). אנא השתמש בפקודה הבאה להתקנה מלאה.
התקן את SpeechPy באמצעות PyPI
pip install speechpy
זיהוי דיבור באמצעות Python
זיהוי דיבור עוסק בעיקר בזיהוי ותרגום של שפה מדוברת לטקסט על ידי מחשבים. ספריית הקוד הפתוח Python SpeechPy מאפשרת למפתחי תוכנה ליצור יישומים התומכים בתכונות זיהוי דיבור. זה עוזר למשתמשים לחסוך זמן על ידי דיבור במקום הקלדה. ובכך לעזור למשתמשים לתקשר עם המכשירים שלהם בפחות מאמץ ולהפוך את המכשירים הטכנולוגיים לנגישים וקלים יותר לשימוש.
מחשב MFCC מאת אודיו
ספריית Python SpeechPy סיפקה תמיכה מלאה עבור מחשוב תכונות MFCC מאות שמע בתוך היישומים שלהם. הספרייה סיפקה תמיכה בכמה תכונות חשובות של MFCC כגון תדירות דגימה של האות, אורך כל פריים בשניות, מעבר בין פריימים עוקבים בשניות, החלת מסננים מבנק מסנן, מספר נקודות FFT, קצה הפס הנמוך ביותר של מסנני mel , קצה הרצועה הגבוהה ביותר של מסנני mel, מספר מקדמים cepstral ועוד.
חלץ אודיו באמצעות מקודדים אוטומטיים
ספריית הקוד הפתוח Python SpeechPy מאפשרת למתכנתי מחשבים לחלץ נתוני אודיו באמצעות קוד Python. Autoencoder הוא טכניקת למידה יעילה מאוד עבור רשתות עצביות הלומדת ייצוגי נתונים יעילים. רשתות מקודדות אוטומטיות לומדות אחת מהשנייה כיצד לדחוס נתונים משכבת הקלט לקוד קצר יותר, ולאחר מכן לבטל את הדחיסה של הקוד הזה לכל פורמט המתאים ביותר לקלט המקורי.