Librosa
Open Source Python knihovna pro zpracování zvuku
Python API, které umožňuje vývojářům načítat a přehrávat zvuk z disku, počítat různé reprezentace spektrogramů a mnoho dalšího.
Librosa je velmi užitečná knihovna Python pro analýzu hudby a zvuku, která pomáhá vývojářům softwaru vytvářet aplikace pro práci se zvukovými a hudebními formáty souborů pomocí Pythonu. Knihovna se velmi snadno používá a zvládne základní i pokročilé úkoly související se zpracováním zvuku a hudby. Knihovna je open source a je volně dostupná pod licencí ISC.
Knihovna poskytuje velkou flexibilitu pro zkušené uživatele a zároveň také pro začátečníky, kteří se více zajímají o zpracování zvukových souborů. Knihovna obsahuje podporu pro několik důležitých funkcí souvisejících se zpracováním a extrakcí zvukových souborů, jako je načtení zvuku z disku, výpočet různých reprezentací spektrogramu, separace harmonicko-perkusního zdroje, obecný rozklad spektrogramu, načtení a dekódování zvuku, zpracování zvuku v časové doméně, sekvenční modelování, integrující harmonicko-perkusní separaci, beat-synchronní a mnoho dalších.
Začínáme s Librosou
Nejjednodušší způsob instalace Librosa je pomocí Python Package Index (PyPI). Pro kompletní instalaci použijte prosím následující příkaz.
Nainstalujte Librosu pomocí PyPI
python -m pip install librosa
Načítání a vizualizace zvukových souborů přes Python
Knihovna Pythonu Librosa umožňuje softwarovým programátorům načítat a vizualizovat zvukové soubory uvnitř jejich vlastní aplikace Python. Nejprve musíte načíst zvukový soubor a přehrát jej pomocí příkazu Python v Jupyter Notebooku. Dále můžete snadno vizualizovat navzorkovaný signál a vykreslit jej. Můžete použít vizualizaci průběhu amplitudy vs. časové reprezentace signálu nebo můžete také použít vizualizaci spektrogramu nebo Log-frekvenční osu.
Vytvořte a uložte zvukový signál přes Python
Analogové a digitální signály jsou různé typy signálů, které mohou přenášet informace. Digitální audio signál je pole NumPy se specifikovanou frekvencí a vzorkovací frekvencí. Na druhou stranu analogový formát vlny audio signálu představuje funkci. Open source Python knihovna Librosa dává softwarovým vývojářům moc vytvořit audio signál a uložit jej na místo podle vlastního výběru pomocí Python kódu.
Extrahujte funkci zvuku pomocí Pythonu
Knihovna Librosa s otevřeným zdrojovým kódem poskytuje vývojářům softwaru možnost načítat a extrahovat zvukové funkce ve vlastních aplikacích pomocí příkazů Pythonu. Existují různé způsoby, jak extrahovat funkce ze zvukových dat, jako je rychlost průchodu nulou, spektrální frekvence roll-off, Mel-frekvenční kepstrální koeficienty (MFCC), Chroma Frequencies a mnoho dalších.