显然是不认为他们会说出去文字转WAV音频