这样的清晰标签有助于避免发生误判文字转WAV音频