AI Filmmaking News Weekly Roundup

Seedance 2.0, GPT Image 2, Magnific Upscaler V2 തുടങ്ങിയ അത്യാധുനിക മോഡലുകൾ ഇനി ഒരൊറ്റ പ്ലാറ്റ്ഫോമിൽ

 റൺവേ എപിഐയിലൂടെ ലോകോത്തര നിലവാരമുള്ള വിവിധ എഐ മോഡലുകൾ ഇനി ഒരൊറ്റ വിൻഡോയിൽ ലഭ്യമാകും. Seedance 2.0, GPT Image 2, HappyHorse 1.0, Nano Banana Pro, Magnific Precision Upscaler V2 തുടങ്ങിയ മോഡലുകളെല്ലാം ഇതിൽ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. വ്യത്യസ്ത ആവശ്യങ്ങൾക്കായി പല പ്ലാറ്റ്‌ഫോമുകളിലേക്ക് മാറേണ്ടതില്ല എന്നതാണ് ഇതിന്റെ പ്രധാന നേട്ടം. 

എല്ലാ എഐ ടൂളുകളും ഇനി ഒരൊറ്റ കാൻവാസിൽ; ‘Flows’ ഫീച്ചറുമായി ElevenCreative

ഡിജിറ്റൽ കണ്ടന്റ് ക്രീയേഷൻ കൂടുതൽ എളുപ്പമാക്കാൻ സഹായിക്കുന്ന ‘നോഡ് അധിഷ്ഠിത കാൻവാസ്’ (Node-based canvas) സംവിധാനവുമായാണ് ഇലവൻക്രിയേറ്റീവ് രംഗത്തെത്തിയിരിക്കുന്നത്. കച്ച ഇമേജ്, വീഡിയോ, ശബ്ദ രൂപീകരണ മോഡലുകൾ ഇനി മുതൽ ഒരു ഫ്ലോ ചാർട്ട് പോലെ പരസ്പരം കണക്ട് ചെയ്ത് ഉപയോക്താക്കൾക്ക് ഉപയോഗിക്കാൻ സാധിക്കും.

ഭാഷ മാറിയാലും ശബ്ദത്തിലെ ഭാവം മാറില്ല;’Dubbing v2′ മോഡലുമായി ElevenLabs

യഥാർത്ഥ വീഡിയോയിലെ കഥാപാത്രങ്ങളുടെ അതേ വികാരങ്ങളും അഭിനയ മികവും ഒട്ടും ചോർന്നുപോകാതെ ഏത് ഭാഷയിലേക്കും മാറ്റാൻ സാധിക്കും എന്നതാണ് ഇതിന്റെ ഏറ്റവും വലിയ പ്രത്യേകത. മലയാളം ഉൾപ്പെടെയുള്ള ലോകത്തിലെ പ്രമുഖ ഭാഷകളിലെല്ലാം അതീവ കൃത്യതയോടെയും സ്വാഭാവികതയോടെയും വീഡിയോകൾ ഡബ്ബ് ചെയ്യാൻ Dubbing v2 വഴി സാധിക്കുമെന്നാണ് കമ്പനി വ്യക്തമാക്കുന്നത്.

ചാറ്റ്ജിപിടിയിലും ക്ലോഡിലും ഇനി വീഡിയോകൾ ചെയ്യാം; ‘Runway MCP’ പുറത്തിറങ്ങി.

നിങ്ങൾ നിലവിൽ കോഡിംഗിനോ എഴുത്തുകൾക്കോ ഉപയോഗിക്കുന്ന ചാറ്റ്ജിപിടിയിലോ ക്ലോഡിലോ ഇരുന്നുകൊണ്ട് തന്നെ റൺവേയുടെ അത്യാധുനിക എഐ മോഡലുകൾ ഇനി പ്രവർത്തിപ്പിക്കാം. ആന്ത്രാപിക് (Anthropic) വികസിപ്പിച്ച ഓപ്പൺ സോഴ്സ് പ്രോട്ടോക്കോൾ ആയ MCP (Model Context Protocol) ഉപയോഗിച്ചാണ് റൺവേ ഈ കണക്ടർ സെർവർ തയ്യാറാക്കിയിരിക്കുന്നത്.

കോപ്പിറൈറ്റ് ഭയമില്ലാതെ എഐ പാട്ടുകൾ നിർമ്മിക്കാം; പ്രൊഫഷണൽ ക്വാളിറ്റിയോടെ ഇലവൻലാബ്‌സ് ‘Music v2’ മോഡൽ പുറത്തിറക്കി

ഒരു വരി കവിതയോ പ്രോംപ്റ്റോ നൽകിയാൽ നിമിഷങ്ങൾക്കുള്ളിൽ സിനിമ നിലവാരത്തിലുള്ള പാട്ടുകൾ നിർമ്മിച്ച് നൽകുന്ന ‘Music v2’ മോഡൽ പുറത്തിറക്കി ഇലവൻലാബ്‌സ്. വോക്കൽസ്, ഇൻസ്ട്രുമെന്റേഷൻ എന്നിവയിൽ അതീവ സങ്കീർണ്ണമായ സംഗീത ഘടനകൾ (Compositional complexity) നിർമ്മിക്കാൻ ഈ മോഡലിന് സാധിക്കും.

കൂടുതൽ കൃത്യത, ദീർഘനേരത്തെ സ്വതന്ത്ര പ്രവർത്തനം; ‘Claude Opus 4.8’ അവതരിപ്പിച്ചു

ഒരു പ്ലാൻ കൃത്യമല്ലെങ്കിലോ തെറ്റുകൾ സംഭവിച്ചാലോ അത് തുറന്നുപറയാനും, സ്വന്തം പുരോഗതിയെക്കുറിച്ച് (Progress) കൂടുതൽ വ്യക്തതയോടെ ഉപയോക്താവിനോട് ആശയവിനിമയം നടത്താനും ഓപ്പസ് 4.8-ന് സാധിക്കും.കൂടുതൽ സമയം മനുഷ്യന്റെ മേൽനോട്ടമില്ലാതെ വലിയ ടാസ്കുകൾ സ്വതന്ത്രമായി ചെയ്യാൻ ഇതിന് കഴിയും.

“തിയേറ്റർ ക്വാളിറ്റിയിൽ ഇനി എഐ ശബ്ദങ്ങൾ; മോസ്-സൗണ്ട്ഇഫക്റ്റ് വി2.0 പുറത്തിറങ്ങി.”

ഇതിന്റെ വലിയ പ്രത്യേകത നൽകുന്ന ശബ്ദത്തിന്റെ ഉയർന്ന ക്വാളിറ്റിയാണ്. സ്റ്റെബിലിറ്റി എഐയുടെ (Stability AI) പ്രശസ്തമായ സ്റ്റേബിൾ ഓഡിയോ 3 (Stable Audio 3) പോലുള്ള മുൻനിര മോഡലുകൾ പോലും 44.1 kHz ക്വാളിറ്റിയിലാണ് ഓഡിയോ നൽകുന്നത്. എന്നാൽ ‘മോസ്-സൗണ്ട്ഇഫക്റ്റ് വി2.0’ ഔട്ട്പുട്ട് നൽകുന്നത് 48 kHz ക്വാളിറ്റിയിലാണ്.

“ഹോളിവുഡ് തള്ളിയ സ്ക്രിപ്റ്റ് ഒരു മാസം കൊണ്ട് സിനിമയായി;”റിയലിസ്റ്റിക് വിഷ്വലുകളുമായി ‘The Rogue’ ശ്രദ്ധേയമാകുന്നു.

AI ടെക്നോളജി ഉപയോഗിച്ച് നിർമ്മിക്കുന്ന വിഷ്വലുകൾ യാഥാർത്ഥ്യത്തോട് എത്രത്തോളം അടുത്തുനിൽക്കുന്നു എന്ന് തെളിയിക്കുന്ന ‘പ്രോജക്റ്റ് ലക്സോ’ (Project Luxo) യുടെ ഭാഗമായി റൺവേ പുറത്തുവിട്ട ശ്രദ്ധേയമായ ചിത്രമാണ് ‘ദി റോഗ്’ (The Rogue). പൂർണ്ണമായും എഐ ഉപയോഗിച്ച് നിർമ്മിച്ച 10 മിനിറ്റ് ദൈർഘ്യമുള്ള ഒരു ഹ്രസ്വചിത്രമാണിത്.