需要进行一系列的模式切换和人员准备工作文字转WAV音频