まず、mp3の音声ファイルを用意します。
ubuntuにlibrosaをinstall
$ pip3 install librosa
$ sudo apt-get install libsndfile1
$ sudo apt install ffmpeg
import librosa
import numpy as np
import matplotlib.pyplot as plt
file_name = "./test.mp3"
y, sr = librosa.load(str(file_name))
time = np.arange(0, len(y)) / sr
plt.plot(time, y)
plt.xlabel("Time(s)")
plt.ylabel("Sound Amplitude")
plt.savefig('image.jpg',dpi=100)

うおおおおおおおお、なるほど