更应该采取引导的方式文字转WAV音频