他最终给出的回应是文字转WAV音频