可是根据他刚才的话推断文字转WAV音频