暂时只是很简单的架构文字转WAV音频