更多的是两个家族势力的某种整合文字转WAV音频