但是在言语上也还是需要斟酌一下文字转WAV音频