此时可以说是已经掌握了全局文字转WAV音频