这是个几率性的描述文字转WAV音频