我一直在估算核心提供的能源文字转WAV音频