则表示两者共同出现的时段文字转WAV音频