但是确实最接近的描述了文字转WAV音频