导致了那部分数据在重组时没能正确排列文字转WAV音频