而且通过我们的观察文字转WAV音频