这玩意不能用外面的思维来衡量文字转WAV音频