实际上他早就想好了每一个问题的应答方式文字转WAV音频