多数时间只会指定一位代表文字转WAV音频