只要有稍微的差距他都能看出来文字转WAV音频