然后大脑会不自主地预期寻找一个目标文字转WAV音频