那是我们把历史各类数据进行了比对之后得到的结果文字转WAV音频