其重组过程类似于数据拼图文字转WAV音频