他们主要还是根据宫廷的需求量为基础文字转WAV音频