就是要通过接触而不断推演后面的过程文字转WAV音频