甚至都没法做一个详细的统计文字转WAV音频