Librosa
Pustaka Python Sumber Terbuka untuk Pemrosesan Audio
Python API yang memungkinkan pengembang memuat dan memutar audio dari disk, menghitung berbagai representasi spektogram, dan banyak lagi.
Librosa adalah pustaka analisis audio dan musik Python yang sangat berguna yang membantu pengembang perangkat lunak membangun aplikasi untuk bekerja dengan format file audio dan musik menggunakan Python. Pustaka ini sangat mudah digunakan dan dapat menangani tugas-tugas dasar maupun lanjutan yang terkait dengan pemrosesan audio dan musik. Perpustakaan adalah open source dan tersedia secara bebas di bawah Lisensi ISC.
Perpustakaan menyediakan banyak fleksibilitas untuk pengguna ahli dan pada saat yang sama juga mengagumkan untuk pengguna pemula yang lebih tertarik untuk memproses file audio. Pustaka telah menyertakan dukungan untuk beberapa fitur penting yang terkait dengan pemrosesan dan ekstraksi file audio seperti memuat audio dari disk, menghitung berbagai representasi spektogram, pemisahan sumber harmonik-perkusi, dekomposisi spektogram generik, memuat dan mendekode audio, pemrosesan audio domain waktu, pemodelan sekuensial, mengintegrasikan pemisahan harmonik-perkusi, sinkron ketukan, dan banyak lagi.
Memulai dengan Librosa
Cara termudah untuk menginstal Librosa adalah dengan menggunakan Python Package Index (PyPI). Silakan gunakan perintah berikut untuk menyelesaikan instalasi.
Instal Librosa menggunakan PyPI
python -m pip install librosa
Memuat dan Memvisualisasikan File Audio melalui Python
Pustaka Python Librosa memungkinkan pemrogram perangkat lunak memuat dan memvisualisasikan file audio di dalam aplikasi Python mereka sendiri. Pertama-tama, Anda perlu memuat file audio dan memutarnya dengan menggunakan perintah Python di Jupyter Notebook. Selanjutnya, Anda dapat dengan mudah memvisualisasikan sinyal sampel dan memplotnya. Anda dapat menggunakan visualisasi bentuk gelombang dari amplitudo vs. representasi waktu dari sinyal atau dapat juga menggunakan visualisasi Spektogram atau sumbu frekuensi Log.
Buat dan Simpan Sinyal Audio melalui Python
Sinyal analog dan digital keduanya merupakan jenis sinyal yang berbeda yang dapat membawa informasi. Sinyal audio digital adalah array NumPy dengan frekuensi dan laju sampel yang ditentukan. Di sisi lain, format gelombang analog dari sinyal audio mewakili suatu fungsi. Pustaka Python sumber terbuka Librosa memberi pengembang perangkat lunak kekuatan untuk membuat sinyal audio dan menyimpannya ke tempat pilihan mereka menggunakan kode Python.
Ekstrak Fitur Audio menggunakan Python
Pustaka Python open source Librosa memberi pengembang perangkat lunak kemampuan untuk memuat dan mengekstrak fitur audio di dalam aplikasi mereka sendiri menggunakan perintah Python. Ada berbagai cara untuk mengekstrak fitur dari data audio, seperti zero-crossing rate, spectral roll-off frequency, Mel-frequency cepstral coefficients (MFCC), Chroma Frequencies, dan masih banyak lagi.