很大程度上他们的责任是重叠的文字转WAV音频