大部分修士还是维持着自己的之前的判断文字转WAV音频