可以通过他的动作看得出来文字转WAV音频