至少从视频上面开始反馈出来的讯息是这样的文字转WAV音频