再训练出一些多变的战术文字转WAV音频