但是他能根据感觉判断出来文字转WAV音频