不过这时的他只能做出一些面部表情文字转WAV音频