我们的计划只能是初定文字转WAV音频