完全不能用人族的标准来看待文字转WAV音频