但他只是说了一个大体的所在文字转WAV音频