主要的组成部分是灵体文字转WAV音频