他们两个人算是最早交代的文字转WAV音频