所以系统会默认有一个静默判断时间文字转WAV音频