这么简单就能够解释得通的文字转WAV音频