这个时候已经经过了处理文字转WAV音频