却没法捕捉到关键点文字转WAV音频