这个理论现在正流行文字转WAV音频