最核心的就是当初传承所得文字转WAV音频