本质上其实是两条时间线的一下交错文字转WAV音频