每个中忍管理一个由三四十名文字转WAV音频