他们还要在脑里回放一遍文字转WAV音频