ലോകത്തിലെ ആദ്യ Human -powered Speech-to-Text മോഡൽ ; ATLAS 1 അവതരിപ്പിച്ചു.
AI അധിഷ്ഠിത സ്പീച്ച്-ടു-ടെക്സ്റ്റ് (Speech-to-Text) മോഡൽ ‘അറ്റ്ലസ് 1’ (Atlas 1) പുറത്തിറങ്ങി. പ്രമുഖ AIകമ്പനിയായ വില്ലോ (Willow) ആണ് ഈ അത്യാധുനിക മോഡൽ അവതരിപ്പിച്ചത്. നിലവിൽ ഈ മേഖലയിലെ വമ്പൻമാരായ ElevenLabs, Deepgram, OpenAI എന്നിവയേക്കാൾ ബഹുദൂരം മുന്നിലാണ് അറ്റ്ലസ് 1 എന്ന് കമ്പനി അവകാശപ്പെടുന്നു.
മിക്ക എഐ മോഡലുകളും മറ്റ് എഐകൾ നിർമ്മിച്ച ഡാറ്റ ഉപയോഗിച്ചാണ് പരിശീലനം നേടുന്നത്. എന്നാൽ അറ്റ്ലസ് 1 പരിശീലിപ്പിച്ചിരിക്കുന്നത് ലക്ഷക്കണക്കിന് മണിക്കൂർ നീളുന്ന, മനുഷ്യർ നേരിട്ട് എഴുതി തയ്യാറാക്കിയ (Human-transcribed) ഡാറ്റ ഉപയോഗിച്ചാണ്. സംസാരത്തിലെ പ്രാദേശിക ശൈലികൾ (Accents), ബാക്ക്ഗ്രൗണ്ട് നോയ്സ് എന്നിവയ്ക്കിടയിലും കൃത്യമായി വാക്കുകൾ തിരിച്ചറിയാൻ ഇതിന് സാധിക്കും.
ലേറ്റൻസി ഇല്ലാതെ നിങ്ങൾ സംസാരിക്കുന്ന അതേ നിമിഷം തന്നെ (Real-time) പിഴവുകളില്ലാതെ ടെസ്റ്റുകളായി സ്ക്രീനിൽ തെളിയും. മണിക്കൂറുകൾ നീളുന്ന ഇന്റർവ്യൂകളോ ഡോക്യുമെന്ററികളോ മിനിറ്റുകൾക്കുള്ളിൽ ടെക്സ്റ്റ് രൂപത്തിലാക്കാൻ Atlas 1 ഏറെ സഹായകമാകും.
Summary: Willow has launched Atlas 1, an advanced AI speech-to-text model that reportedly outperforms competitors like OpenAI, Deepgram, and ElevenLabs.The model is trained on vast amounts of human-transcribed data, enabling it to accurately recognize speech even with accents and background noise. Atlas 1 delivers real-time, low-latency transcription, making it ideal for converting long interviews and audio content into text quickly and efficiently.