更多还是单纯的把这些看成工作中的物件文字转WAV音频