并把目标和背景分割开来文字转WAV音频