同时也把一切可能会出现的不利因素考虑了数遍文字转WAV音频