那是因为他们都明白文字转WAV音频