但这一万多人几乎都是在前面的文字转WAV音频