首先是数据收集和统计文字转WAV音频