就只能在电话里用语言描述问题文字转WAV音频