但只要最终沉淀出的结果是两层就可以了文字转WAV音频