Librosa
Thư viện Python nguồn mở để xử lý âm thanh
API Python cho phép các nhà phát triển tải và phát âm thanh từ đĩa, tính toán các biểu diễn quang phổ khác nhau và hơn thế nữa.
Librosa là một thư viện phân tích âm thanh và nhạc Python rất hữu ích giúp các nhà phát triển phần mềm xây dựng các ứng dụng để làm việc với các định dạng tệp âm thanh và nhạc bằng Python. Thư viện rất dễ sử dụng và có thể xử lý các tác vụ cơ bản cũng như nâng cao liên quan đến xử lý âm thanh và âm nhạc. Thư viện là nguồn mở và được cung cấp miễn phí theo Giấy phép ISC.
Thư viện cung cấp rất nhiều tính linh hoạt cho người dùng chuyên nghiệp và đồng thời cũng tuyệt vời cho người dùng mới bắt đầu quan tâm hơn đến việc xử lý tệp âm thanh. Thư viện đã bao gồm hỗ trợ cho một số tính năng quan trọng liên quan đến xử lý và trích xuất tệp âm thanh như tải âm thanh từ đĩa, tính toán các biểu diễn quang phổ khác nhau, tách nguồn bộ gõ hài, phân tách quang phổ chung, tải và giải mã âm thanh, Xử lý âm thanh miền thời gian, mô hình hóa tuần tự, tích hợp tách sóng hài-bộ gõ, đồng bộ nhịp và nhiều hơn nữa.
Bắt đầu với Librosa
Cách dễ nhất để cài đặt Librosa là sử dụng Chỉ mục gói Python (PyPI). Vui lòng sử dụng lệnh sau để cài đặt hoàn chỉnh.
Cài đặt Librosa bằng PyPI
python -m pip install librosa
Tải và hiển thị tệp âm thanh qua Python
Thư viện Python Librosa cho phép các lập trình viên phần mềm tải và trực quan hóa các tệp âm thanh bên trong ứng dụng Python của riêng họ. Trước hết, bạn cần tải tệp âm thanh và phát tệp đó bằng cách sử dụng lệnh Python trong Máy tính xách tay Jupyter. Tiếp theo, bạn có thể dễ dàng hình dung tín hiệu được lấy mẫu và vẽ biểu đồ của nó. Bạn có thể sử dụng hình ảnh hóa dạng sóng của biên độ so với biểu diễn thời gian của tín hiệu hoặc cũng có thể sử dụng hình ảnh hóa Quang phổ hoặc trục tần số Log.
Tạo và lưu tín hiệu âm thanh qua Python
Tín hiệu tương tự và tín hiệu kỹ thuật số là cả hai loại tín hiệu khác nhau có thể mang thông tin. Tín hiệu âm thanh kỹ thuật số là một mảng NumPy với tần số và tỷ lệ mẫu được chỉ định. Mặt khác, định dạng sóng tương tự của tín hiệu âm thanh thể hiện một chức năng. Thư viện Python nguồn mở Librosa cung cấp cho các nhà phát triển phần mềm sức mạnh để tạo tín hiệu âm thanh và lưu nó vào nơi họ chọn bằng cách sử dụng mã Python.
Trích xuất tính năng âm thanh bằng Python
Thư viện Python nguồn mở Librosa cung cấp cho các nhà phát triển phần mềm khả năng tải và trích xuất các tính năng âm thanh bên trong ứng dụng của riêng họ bằng các lệnh Python. Có nhiều cách khác nhau để trích xuất các tính năng từ dữ liệu âm thanh, chẳng hạn như tỷ lệ xuyên không, tần số cuộn quang phổ, hệ số cepstral tần số Mel (MFCC), Tần số Chroma, v.v.