同样是通过角色的构建和塑造来完成表演文字转WAV音频