Librosa
用于音频处理的开源 Python 库
Python API,允许开发人员从磁盘加载和播放音频,计算各种频谱图表示,等等。
开始使用 Librosa
安装 Librosa 的最简单方法是使用 Python 包索引 (PyPI)。请使用以下命令进行完整安装。
使用 PyPI 安装 Librosa
python -m pip install librosa
通过 Python 加载和可视化音频文件
Python 库 Librosa 允许软件程序员在他们自己的 Python 应用程序中加载和可视化音频文件。首先,您需要在 Jupyter Notebook 中使用 Python 命令加载并播放音频文件。接下来,您可以轻松地可视化采样信号并绘制它。您可以使用信号的幅度与时间表示的波形可视化,也可以使用频谱图可视化或对数频率轴。
通过 Python 创建和保存音频信号
模拟信号和数字信号都是可以携带信息的不同类型的信号。数字音频信号是具有指定频率和采样率的 NumPy 数组。另一方面,音频信号的模拟波形表示函数。开源 Python 库 Librosa 使软件开发人员能够创建音频信号并使用 Python 代码将其保存到他们选择的位置。
使用 Python 提取音频特征
开源 Python 库 Librosa 使软件开发人员能够使用 Python 命令在他们自己的应用程序中加载和提取音频特征。有多种方法可以从音频数据中提取特征,例如过零率、频谱滚降频率、梅尔频率倒谱系数 (MFCC)、色度频率等等。