而且大部分连普通人也不如文字转WAV音频