就不用反馈信息了――他只需要知道文字转WAV音频