Librosa

Pustaka Python Sumber Terbuka untuk Pemrosesan Audio

Python API yang memungkinkan pengembang memuat dan memutar audio dari disk, menghitung berbagai representasi spektogram, dan banyak lagi.

Librosa adalah pustaka analisis audio dan musik Python yang sangat berguna yang membantu pengembang perangkat lunak membangun aplikasi untuk bekerja dengan format file audio dan musik menggunakan Python. Pustaka ini sangat mudah digunakan dan dapat menangani tugas-tugas dasar maupun lanjutan yang terkait dengan pemrosesan audio dan musik. Perpustakaan adalah open source dan tersedia secara bebas di bawah Lisensi ISC.

Perpustakaan menyediakan banyak fleksibilitas untuk pengguna ahli dan pada saat yang sama juga mengagumkan untuk pengguna pemula yang lebih tertarik untuk memproses file audio. Pustaka telah menyertakan dukungan untuk beberapa fitur penting yang terkait dengan pemrosesan dan ekstraksi file audio seperti memuat audio dari disk, menghitung berbagai representasi spektogram, pemisahan sumber harmonik-perkusi, dekomposisi spektogram generik, memuat dan mendekode audio, pemrosesan audio domain waktu, pemodelan sekuensial, mengintegrasikan pemisahan harmonik-perkusi, sinkron ketukan, dan banyak lagi.

Sekilas

Ikhtisar fitur Librosa.

Ikhtisar Fitur

Putar audio
Memvisualisasikan audio
Ekstrak fitur audio
Kelola audio
dukungan MP3
Sprite Audio
Caching otomatis
Menangani tepi
Mengkodekan audio
Decode audio
Pemodelan berurutan
Beat-sinkron

Librosa

Librosa mendukung format file Audio seperti yang tercantum di bawah.

Pembaca

MP3, WAV, WMA, WEBM

Penulis

MP3, WAV, WMA, WEBM

Librosa

Platform Kemerdekaan

Librosa hanya memerlukan waktu proses Python.

Python

Librosa

Memulai dengan Librosa

Cara termudah untuk menginstal Librosa adalah dengan menggunakan Python Package Index (PyPI). Silakan gunakan perintah berikut untuk menyelesaikan instalasi.

Instal Librosa menggunakan PyPI

 python -m pip install librosa

Memuat dan Memvisualisasikan File Audio melalui Python

Pustaka Python Librosa memungkinkan pemrogram perangkat lunak memuat dan memvisualisasikan file audio di dalam aplikasi Python mereka sendiri. Pertama-tama, Anda perlu memuat file audio dan memutarnya dengan menggunakan perintah Python di Jupyter Notebook. Selanjutnya, Anda dapat dengan mudah memvisualisasikan sinyal sampel dan memplotnya. Anda dapat menggunakan visualisasi bentuk gelombang dari amplitudo vs. representasi waktu dari sinyal atau dapat juga menggunakan visualisasi Spektogram atau sumbu frekuensi Log.

Buat dan Simpan Sinyal Audio melalui Python

Sinyal analog dan digital keduanya merupakan jenis sinyal yang berbeda yang dapat membawa informasi. Sinyal audio digital adalah array NumPy dengan frekuensi dan laju sampel yang ditentukan. Di sisi lain, format gelombang analog dari sinyal audio mewakili suatu fungsi. Pustaka Python sumber terbuka Librosa memberi pengembang perangkat lunak kekuatan untuk membuat sinyal audio dan menyimpannya ke tempat pilihan mereka menggunakan kode Python.

Ekstrak Fitur Audio menggunakan Python

Pustaka Python open source Librosa memberi pengembang perangkat lunak kemampuan untuk memuat dan mengekstrak fitur audio di dalam aplikasi mereka sendiri menggunakan perintah Python. Ada berbagai cara untuk mengekstrak fitur dari data audio, seperti zero-crossing rate, spectral roll-off frequency, Mel-frequency cepstral coefficients (MFCC), Chroma Frequencies, dan masih banyak lagi.