本身在阵中的时候已经有过一些基础文字转WAV音频