大约是把你当成了待选目标文字转WAV音频