更是不能用单一的标准来判断文字转WAV音频