就可以很容易的分辨出两个人的身份文字转WAV音频