要求她对每一个界面上的每一串指令都进行解释文字转WAV音频