那是因为你主动认输文字转WAV音频