世界观和人物设定基本保留文字转WAV音频