角色试镜是按照从小到大的顺序来的文字转WAV音频