我们代表的是两个不同的家族文字转WAV音频