就是一个概率性的问题文字转WAV音频