而是采取潜移默化的进行灌输文字转WAV音频