这是个假设性的问题文字转WAV音频