以及有没有表达清楚自己脑袋里的画面感文字转WAV音频