这些人必须要从一大堆玉牒中区分出来文字转WAV音频