在将视角从下路切回来的同时文字转WAV音频