他可以大致确定文字转WAV音频