他们的提议是有效的文字转WAV音频