他其实也没有太多选择的条件文字转WAV音频