那是因为他已经计算过了文字转WAV音频