毕竟根据我们的分析文字转WAV音频