但这些设备最大的问题就是笨重文字转WAV音频