前期只能够对单个目标使用文字转WAV音频