就必须先让他们相信文字转WAV音频