就是用外界的条件来催化文字转WAV音频