这样我们就能够更好的辨识彼此文字转WAV音频