虽然这个逻辑用在几位身上也是正确的文字转WAV音频