他认为带二十多人已经足够了文字转WAV音频