自然也不可能给他们灌输这点常识文字转WAV音频