只要确定了他们的大概位置文字转WAV音频