如果时间够……这里的前提就是时间文字转WAV音频