他这么做的主要原因也是为了自己省掉麻烦文字转WAV音频