Librosa

Libreria Python open source per l'elaborazione audio

API Python che consente agli sviluppatori di caricare e riprodurre audio dal disco, calcolare varie rappresentazioni di spettrogrammi e molto altro.

Librosa è una libreria Python molto utile per l'analisi di musica e audio che aiuta gli sviluppatori di software a creare applicazioni per lavorare con formati di file audio e musicali usando Python. La libreria è molto facile da usare e può gestire attività di base e avanzate relative all'elaborazione audio e musicale. La libreria è open source ed è disponibile gratuitamente con licenza ISC.

La libreria offre una grande flessibilità agli utenti esperti e allo stesso tempo anche fantastica agli utenti principianti che sono più interessati all'elaborazione di file audio. La libreria include il supporto per diverse importanti funzionalità relative all'elaborazione e all'estrazione di file audio come caricamento dell'audio dal disco, calcolo di varie rappresentazioni di spettrogrammi, separazione della sorgente armonica-percussiva, decomposizione generica dello spettrogramma, caricamento e decodifica dell'audio, elaborazione audio nel dominio del tempo, modellazione sequenziale, integrazione della separazione armonico-percussiva, sincrona al battito e molti altri.

A prima vista

Una panoramica delle funzionalità di Librosa.

Panoramica delle caratteristiche

Riproduci l'audio
Visualizzazione dell'audio
Estrai le caratteristiche audio
Gestisci gli audio
Supporto MP3
Sprite audio
Memorizzazione automatica nella cache
Bordo della maniglia
Codifica gli audio
Decodifica gli audio
Modellazione sequenziale
Sincrono al battito

Librosa

Librosa supporta i formati di file audio elencati di seguito.

Lettore

MP3, WAV, WMA, WEBM

scrittore

MP3, WAV, WMA, WEBM

Librosa

Indipendenza dalla piattaforma

Librosa richiede solo il runtime Python.

Pitone

Librosa

Primi passi con Librosa

Il modo più semplice per installare Librosa è utilizzare Python Package Index (PyPI). Utilizzare il comando seguente per l'installazione completa.

Installa Librosa usando PyPI

 python -m pip install librosa

Caricamento e visualizzazione di file audio tramite Python

La libreria Python Librosa consente ai programmatori di software di caricare e visualizzare file audio all'interno della propria applicazione Python. Prima di tutto, devi caricare il file audio e riprodurlo usando un comando Python in Jupyter Notebook. Successivamente, puoi facilmente visualizzare il segnale campionato e tracciarlo. È possibile utilizzare la visualizzazione della forma d'onda dell'ampiezza rispetto alla rappresentazione temporale del segnale o anche la visualizzazione dello spettrogramma o l'asse della frequenza logaritmica.

Crea e salva il segnale audio tramite Python

I segnali analogici e digitali sono entrambi diversi tipi di segnali che possono trasportare informazioni. Un segnale audio digitale è un array NumPy con una frequenza e una frequenza di campionamento specificate. D'altra parte, il formato d'onda analogico del segnale audio rappresenta una funzione. La libreria Python open source Librosa offre agli sviluppatori di software il potere di creare un segnale audio e salvarlo nel luogo che preferiscono utilizzando il codice Python.

Estrai la funzione audio usando Python

La libreria Python open source Librosa offre agli sviluppatori di software la possibilità di caricare ed estrarre funzionalità audio all'interno delle proprie app utilizzando i comandi Python. Esistono vari modi per estrarre le caratteristiche dai dati audio, come la velocità di passaggio per lo zero, la frequenza di roll-off spettrale, i coefficienti cepstral della frequenza di Mel (MFCC), le frequenze di crominanza e molti altri.