所以在演艺空间里只能模拟出一些很模糊的人形来对戏文字转WAV音频