因为她们俩几乎一个模子出来的文字转WAV音频