因为他本身就是一个真实的人文字转WAV音频