才是最后真正判断成绩的根据文字转WAV音频