其实也是听从上面人的命令文字转WAV音频