是因为他已经认出了文字转WAV音频