既然他们不愿意讲文字转WAV音频