也许这个数字量化不见得准确文字转WAV音频