将其间可能发生的变数都预作分析了好多次文字转WAV音频