不过最后还是重新在收集文字转WAV音频