而且我也觉得如果在资本构成上多元化一些文字转WAV音频