因为我们这边也在统计分数了文字转WAV音频