1. 製品
  2.   オーディオ
  3.   Python
  4.   Librosa 

Librosa 

 
 

オーディオ処理用のオープンソース Python ライブラリ

開発者がディスクからオーディオを読み込んで再生したり、さまざまなスペクトログラム表現を計算したりできる Python API。

Librosa は、ソフトウェア開発者が Python を使用してオーディオおよび音楽ファイル形式を操作するためのアプリケーションを構築するのに役立つ、非常に便利な Python の音楽およびオーディオ分析ライブラリです。このライブラリは非常に使いやすく、オーディオおよび音楽処理に関連する基本的なタスクだけでなく、高度なタスクも処理できます。ライブラリはオープン ソースであり、ISC ライセンスの下で自由に利用できます。

このライブラリは、エキスパート ユーザーに大きな柔軟性を提供すると同時に、オーディオ ファイルの処理に関心のある初心者ユーザーにも素晴らしい機能を提供します。このライブラリには、ディスクからのオーディオのロード、さまざまなスペクトログラム表現の計算、ハーモニック-パーカッシブ ソース分離、一般的なスペクトログラム分解、オーディオのロードとデコード、時間領域オーディオ処理など、オーディオ ファイルの処理と抽出に関連するいくつかの重要な機能のサポートが含まれています。シーケンシャル モデリング、ハーモニック パーカッシブ分離、ビート同期などの統合。

Previous Next

Librosaを始める 

Librosa をインストールする最も簡単な方法は、Python Package Index (PyPI) を使用することです。インストールを完了するには、次のコマンドを使用してください。

PyPI を使用して Librosa をインストールする

 python -m pip install librosa 

Python によるオーディオ ファイルのロードと視覚化

Python ライブラリ Librosa を使用すると、ソフトウェア プログラマーは独自の Python アプリケーション内でオーディオ ファイルを読み込んで視覚化できます。まず、Jupyter Notebook で Python コマンドを使用して、オーディオ ファイルを読み込んで再生する必要があります。次に、サンプリングされた信号を簡単に可視化し、プロットできます。信号の振幅対時間表現の波形視覚化を使用するか、スペクトログラム視覚化または対数周波数軸を使用することもできます。

Python で音声信号を作成して保存する

アナログ信号とデジタル信号はどちらも、情報を伝達できる異なるタイプの信号です。デジタル オーディオ信号は、指定された周波数とサンプル レートを持つ NumPy 配列です。一方、オーディオ信号のアナログ波形は関数を表します。オープンソースの Python ライブラリ Librosa は、ソフトウェア開発者がオーディオ信号を作成し、Python コードを使用して選択した場所に保存する機能を提供します。

Python を使用してオーディオ機能を抽出する

オープン ソースの Python ライブラリ Librosa を使用すると、ソフトウェア開発者は、Python コマンドを使用して独自のアプリ内でオーディオ機能を読み込んで抽出することができます。オーディオ データから特徴を抽出するには、ゼロクロッシング レート、スペクトル ロールオフ周波数、メル周波数ケプストラム係数 (MFCC)、クロマ周波数など、さまざまな方法があります。

 日本