所以他们只有本能性的检查并没有做仔细的研究文字转WAV音频