其中一部分还必须消耗在研究上面文字转WAV音频