他只会独立完成文字转WAV音频