最后小声把推断告诉了他们文字转WAV音频