我刚才拿我们人类的标准去对比那个古仙人文字转WAV音频