自己所预测设定不过是许多种可能性中的一种文字转WAV音频