ടെക് ഭീമനായ മൈക്രോസോഫ്റ്റ് മൂന്ന് പുതിയ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകൾ പുറത്തിറക്കി. ചിത്രങ്ങൾ, ശബ്ദം, ട്രാൻസ്ക്രിപ്ഷൻ എന്നിവയ്ക്കായി വികസിപ്പിച്ച ഈ മോഡലുകൾ ഗൂഗിൾ, ഓപ്പൺഎഐ എന്നിവയെക്കാൾ മികച്ച പ്രകടനം കാഴ്ചവെക്കുമെന്ന് കമ്പനി അവകാശപ്പെടുന്നു. ഈ സാങ്കേതികവിദ്യ കോ പൈലറ്റ് പോലുള്ള സേവനങ്ങളിലേക്ക് വ്യാപിപ്പിക്കുകയാണ്.
കാലിഫോര്ണിയ: റെഡ്മണ്ട് ആസ്ഥാനമായ ടെക് ഭീമനായ മൈക്രോസോഫ്റ്റ് മൂന്ന് പുതിയ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് (AI) മോഡലുകൾ പുറത്തിറക്കി. ചിത്രങ്ങൾ സൃഷ്ടിക്കൽ, ശബ്ദം നിർമ്മിക്കൽ, ശബ്ദം ടെക്സ്റ്റിലേക്ക് മാറ്റൽ എന്നീ പ്രക്രിയകള്ക്കായാണ് ഈ പ്രത്യേക എഐ മോഡലുകൾ വികസിപ്പിച്ചിരിക്കുന്നത്. ഗൂഗിൾ, ഓപ്പൺഎഐ പോലുള്ള പ്രമുഖ എതിരാളികളുടെ മോഡലുകളെക്കാൾ മികച്ച പ്രകടനമാണ് ഇവ കാഴ്ചവയ്ക്കുന്നതെന്ന് കമ്പനി അവകാശപ്പെട്ടു.
മൈക്രോസോഫ്റ്റിന്റെ എഐ മോഡലുകള്
എംഎഐ-ട്രാൻസ്ക്രൈബ്-1, എംഎഐ-വോയിസ്-1, എംഎഐ-ഇമേജ്-2 എന്നീ പേരുകളിലാണ് പുതിയ മോഡലുകൾ പുറത്തിറക്കിയത്. ഇവ ഇപ്പോൾ മൈക്രോസോഫ്റ്റ് ഫൗണ്ടറി പ്ലാറ്റ്ഫോമിലും എംഎഐ പ്ലേ ഗ്രൗണ്ടിലും ലഭ്യമാണ്. കൂടാതെ, വിവിധ ഉപഭോക്തൃ ഉൽപ്പന്നങ്ങളിലേക്കും ഈ സാങ്കേതികവിദ്യ ഘട്ടംഘട്ടമായി വ്യാപിപ്പിക്കുകയാണ്.
ഇവയിൽ പ്രധാന ശ്രദ്ധ നേടിയിരിക്കുന്നത് എംഎഐ-ട്രാൻസ്ക്രൈബ്-1 മോഡലാണ്. 25 പ്രമുഖ ഭാഷകളിൽ മികച്ച നിലവാരത്തിലുള്ള സ്പീച്ച്-ടു-ടെക്സ്റ്റ് ട്രാൻസ്ക്രിപ്ഷൻ നൽകാൻ ഇതിന് കഴിയുമെന്ന് മൈക്രോസോഫ്റ്റ് വ്യക്തമാക്കി. FLEURS ബെഞ്ച്മാർക്കിൽ നടത്തിയ ആഭ്യന്തര പരിശോധനകളിൽ, ഇത് ജെമിനി 3.1 ഫ്ളാഷ്, ജിപിടി ട്രാൻസ്ക്രൈബ് എന്നിവയെ അപേക്ഷിച്ച് കുറവ് പിശക് നിരക്ക് പ്രകടിപ്പിച്ചതായി കമ്പനി പറയുന്നു. കൂടാതെ, വില-പെർഫോമൻസ് അനുപാതത്തിലും ഇത് മുന്നിലാണ് എന്നാണ് കമ്പനിയുടെ അവകാശവാദം.
എംഎഐ-വോയിസ്-1 മോഡൽ സ്വാഭാവികവും വികാരസമ്പന്നവുമായ ശബ്ദം സൃഷ്ടിക്കാൻ കഴിവുള്ളതാണ്. ദൈർഘ്യമേറിയ ഉള്ളടക്കങ്ങളിലും ശബ്ദത്തിന്റെ സ്ഥിരത നിലനിർത്താൻ ഇതിന് സാധിക്കും. വെറും ചില സെക്കൻഡ് ഓഡിയോ ഉപയോഗിച്ച് വ്യക്തിഗത ശബ്ദം സൃഷ്ടിക്കാനുള്ള സൗകര്യവും ഇതിൽ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. സുരക്ഷയും വേഗതയും മുൻനിർത്തി വികസിപ്പിച്ച ഈ മോഡൽ ഒരു സെക്കൻഡിൽ 60 സെക്കൻഡ് ദൈർഘ്യമുള്ള ഓഡിയോ സൃഷ്ടിക്കാൻ കഴിവുള്ളതാണ്.
അതേസമയം, എംഎഐ- ഇമേജ്-2 മോഡൽ കൂടുതൽ ഗുണമേന്മയുള്ള ചിത്രങ്ങൾ വേഗത്തിൽ സൃഷ്ടിക്കാൻ രൂപകൽപ്പന ചെയ്തതാണ്. ഫോട്ടോഗ്രാഫർമാരുടെയും ഡിസൈനർമാരുടെയും സഹകരണത്തോടെ വികസിപ്പിച്ച ഈ മോഡൽ സ്വാഭാവിക ലൈറ്റിംഗ്, കൃത്യമായ ടെക്സ്ചറുകൾ, വ്യക്തമായ ടെക്സ്റ്റ് എന്നിവയിൽ കൂടുതൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു. WPP പോലുള്ള എന്റര് ർപ്രൈസ് പങ്കാളികൾ ഇതിനകം തന്നെ ഇത് സ്വീകരിച്ചു കഴിഞ്ഞു.
ഈ മൂന്ന് മോഡലുകളും കോ പൈലറ്റ്, ബിൻഗ്, പവർപോയിന്റ് തുടങ്ങിയ സേവനങ്ങളിലേക്കും വ്യാപിപ്പിക്കപ്പെടുന്നതായി മൈക്രോസോഫ്റ്റ് അറിയിച്ചു. എഐ മേഖലയിലെ മത്സരത്തിൽ പുതിയ മാനദണ്ഡങ്ങൾ സൃഷ്ടിക്കാൻ ഇവയ്ക്ക് കഴിയും എന്നാണ് വിലയിരുത്തൽ.



