他们的人能够确定前面有人文字转WAV音频