然后通过言语试探文字转WAV音频