所得的不过是从惜夕口中听到的文字转WAV音频