为什么不按照口令回答文字转WAV音频