最后仍旧会按照他的文字转WAV音频