很快就发现了两个人的节奏并不是完全一致文字转WAV音频