最初都是一些模糊的雏形文字转WAV音频