他其实是要从右侧内切文字转WAV音频