他们也压根儿不想仿造出最纯粹的文字转WAV音频