回应的多半是敷衍口气文字转WAV音频