估计最起码有三万人族文字转WAV音频