无非是基于人类的偏执和自大所作出的判断文字转WAV音频