所以就要用时间来区分开……文字转WAV音频