可是他怎么判断的文字转WAV音频