它们的目标也是美国文字转WAV音频