却是在半分钟内就完成最后检测文字转WAV音频