പ്രസ് റിലീസ്

എന്തുകൊണ്ടാണ് വൻകിട നിക്ഷേപകർ വോയ്സ് എഐ സ്റ്റാർട്ടപ്പുകൾക്കുള്ള എല്ലാ ചെവികളും

കൃത്രിമബുദ്ധി ഇന്നത്തെ ടെക്കലിന്റെ ഏറ്റവും ചൂടേറിയ പ്രദേശമാണ്, അഭൂതപൂർവമായ തലത്തിലുള്ള ബഹിരാകാശത്തെ സ്റ്റാർട്ടപ്പുകളിലേക്ക് ഒഴുകുന്ന വെൻചർ മൂലധന ഡോളർ.

വിശാലമായ സ്ഥലത്ത്, എഐ സ്റ്റാർട്ടപ്പുകൾ ഒരു സ്റ്റാൻ out ട്ട് ആയി ഉയർന്നുവന്നു, ആഗോളതലത്തിൽ നിക്ഷേപകരുടെ ശ്രദ്ധ ആകർഷിക്കുന്നു, ക്രഞ്ച്ബേസ് ഡാറ്റ ഷോകൾ. കഴിഞ്ഞ 12-18 മാസങ്ങളിൽ, നിരവധി ശബ്ദം എഐ കമ്പനികൾ അവരുടെ മൂല്യനിർണ്ണയ ട്രിപ്പിൾ കണ്ടു – വിപണി ആവശ്യകതയും ദീർഘകാല മൂല്യവും ത്വരിതപ്പെടുത്തിയ ഒരു സിഗ്നൽ.

ഈ വർഷം വൻതോതിൽ മൂല്യനിർണ്ണയ ജമ്പ് കണ്ട ഒരു വോയ്സ് എ കമ്പനിയുടെ ഒരു ഉദാഹരണം എലൻലാബുകളാണ്, അത് ഡസൻ ഭാഷകളിൽ ശബ്ദമുള്ള ശബ്ദങ്ങൾ ആവർത്തിക്കാൻ എഐ സോഫ്റ്റ്വെയർ ഉപയോഗിക്കുന്നു. ന്യൂയോർക്ക് അടിസ്ഥാനമാക്കിയുള്ള സ്റ്റാർട്ടപ്പ് 2024 ജനുവരിയിൽ 80 മില്യൺ ഡോളർ സീരീസ് ബി റൈറ്റ് നേടുന്നതിൽ നിന്ന് ഒരു വർഷത്തിനുശേഷം ഏകദേശം 3.3 ബില്യൺ ഡോളർ ഉയർത്തിക്കാനാണ്. സീക്വോയ ക്യാപിറ്റൽ, വലൂയർ ഇക്വിറ്റി പങ്കാളികൾ, പുതിയ എന്റർപ്രൈസ് അസോസിയേറ്റ്സ്, എൻട്രവർ കാറ്റലിസ്റ്റ് എന്നിവയാണ് മറ്റ് സ്തംഭങ്ങളിൽ.

സെപ്റ്റംബർ 8 ന്, കമ്പനിയുടെ മൂല്യനിർണ്ണയം 6.6 ബില്യൺ ഡോളറായി ഇരട്ടിയായ ഒരു ടെൻഡർ ഓഫർ വഴി ജീവനക്കാർക്ക് ദ്രവ്യത ഓപ്ഷനുകൾ നൽകുന്നതിന് ദ്വിതീയ ഓഹരികൾ വിൽക്കുമെന്ന് എൻഡൻലാബ്സ് പ്രഖ്യാപിച്ചു. ഒരു ലിങ്ക്ഡ്ഇൻ പോസ്റ്റിൽ, എലൻലാബുകളുടെ കാർൽസുചെയ്തത് elaverbers 2.5 വർഷത്തിനുള്ളിൽ 200 മീറ്റർ വിറപ്പിച്ചുവെന്ന് വെളിപ്പെടുത്തി. “

ഏറ്റെടുക്കലുകളുടെ വിശപ്പ്

ശബ്ദം നേടിയെടുക്കുന്നവർക്ക് ആകർഷകമായ ഒരു വിഭാഗവും നിലനിൽക്കുന്നു. ജൂലൈയിൽ, അതേ തീരത്തുള്ള ശബ്ദമുണ്ടാക്കാൻ AI ഉപയോഗിക്കുന്ന ഒരു സ്റ്റാർട്ടേജ്, ഒരു സ്റ്റാർട്ട്-ബോധം സൃഷ്ടിക്കാൻ സഹായിച്ച ആരംഭത്തിൽ. 2023-ൽ സ്ഥാപിതമായ പ്ലായയ്ക്ക് 5.1 മില്യൺ ഡോളർ ക്രഞ്ചേസ് ഡാറ്റയ്ക്ക് നൽകിയിട്ടുണ്ട്.

പ്ലൂംബെർഗ് കാണുന്ന ആന്തരിക മെമ്മോയ്ക്കുള്ളിൽ ഐഎഎ പ്രതീകങ്ങൾ, റോഡ് മാപ്പ് എന്നിവയ്ക്കുള്ള ഒരു മികച്ച മത്സരമാണ് പ്ലാ ഫസ്റ്റൂസുകൾ സൃഷ്ടിക്കുന്നതിനുള്ള ജോലി.

ജിവിയിലെ ടോം ഹൽമെ, ജിവിയിലെ മാനേജിംഗ് പങ്കാളിയും തലവന്മാരും വിശ്വസിക്കുന്നു, കാരണം കമ്പനികൾക്ക് പ്രസംഗം, വാചകം-സ്പീച്ച്, ഉദ്യാന തിരിച്ചറിയൽ, സംഭാഷണമിടുന്ന,

“As CEOs realize that natural language and voice are essential to deliver the best product experience at the largest possible scale in the biggest markets, they'll often conclude that it's much faster to acquire proven technology and teams, so one could expect acquisition opportunities to arise,” Hulme told Crunchbase News.

നിയന്ത്രിത വളർച്ച

കോളിലെ വർദ്ധിച്ചുവരുന്ന നിക്ഷേപം – പ്രാഥമികമായി ഫാസ്റ്റ് ഡിപ്സിംഗ് ടെക്നോളജീസിന്റെ ദ്രുതഗതിയിലുള്ള സംഗമസ്ഥാനം – പ്രധാനമായും llms, realite ശബ്ദ തിരിച്ചറിയൽ എന്നിവ നോക്കുന്നു.

“സംഭാഷണ തിരിച്ചറിയൽ ഒടുവിൽ മനുഷ്യന്റെ തലത്തിലുള്ള കൃത്യത കൈവരിക്കുന്നത്, സന്ദർഭവും ഉദ്ദേശ്യവും മനസ്സിലാക്കുന്നതിൽ ലില്ലുകൾ മികച്ചതാണ്, അതേസമയം മൈക്രോഫോണുകൾ അക്ഷരാർത്ഥത്തിൽ ഓരോ ഉപകരണത്തിലും ഉപയോഗിക്കുന്ന പ്ലാറ്റ്ഫോമിലും,” അദ്ദേഹം പറഞ്ഞു.

ന്യൂരീലിങ്ക്, വോകോഡ്, സിന്തേസിയ എന്നിവരുൾപ്പെടെ വോയ്സ് എഐ വിഭാഗത്തിൽ വന്നാലുള്ള നിരവധി കമ്പനികളിൽ ജിവി നിക്ഷേപിച്ചു.

“ഈ കമ്പനികളിലേക്ക് ഞങ്ങളെ ആകർഷിക്കുന്ന ഒരു കാര്യം … ഫൗണ്ടറുകളുടെ 'സ്വാഭാവിക ഭാഷയിലും ശബ്ദത്തിലും ഒരു ഉപയോക്തൃ ഇന്റർഫേസായി, ശബ്ദത്തിലെ അടിസ്ഥാന വിശ്വാസം,” ഹുൽമെ കൂട്ടിച്ചേർത്തു. “ഈ കമ്പനികൾ സംഭാഷണ കമ്പ്യൂട്ടിംഗ് പസിലിന്റെ വ്യത്യസ്ത ഭാഗങ്ങൾ കൈകാര്യം ചെയ്യുന്നു, എന്നാൽ അവർ മനുഷ്യരുടെ ഇടപെടലുകളെ മെഷീനുകളുമായി യഥാർത്ഥത്തിൽ സ്വാഭാവികമായും കഴിയുന്നത്രയും പ്രകൃതിദുരഷ്ടമായും ഏറ്റവും കുറഞ്ഞ സംഘടിപ്പിക്കുന്നതും ആലപിച്ചു.”

സ്വാഭാവിക ഭാഷ മനുഷ്യരുടെ പ്രധാന API ആയി കണക്കാക്കാമെന്നതാണ് ശബ്ദം ai startups നിർമ്മിക്കുന്ന മറ്റൊരു ഘടകം, പ്രകൃതി ഭാഷയായ ഹുൽം. അതിൽ ഞങ്ങൾക്ക് ചുറ്റുമുള്ള ലോകത്തെയും ആശയവിനിമയത്തെയും മനസ്സിലാക്കുന്നു.

“വാട്ട്സ്ആപ്പ് ഉപയോക്താക്കൾ എല്ലാ ദിവസവും ദശലക്ഷക്കണക്കിന് വോയ്സ് സന്ദേശങ്ങൾ അയയ്ക്കുന്നു – ഉപദ്രവിക്കാത്ത രീതിയിൽ സാങ്കേതികവിദ്യയുമായി അവർ എങ്ങനെ ആശയവിനിമയം നടത്താൻ ആഗ്രഹിക്കുന്നുവെന്ന് പറയുന്നു,” അദ്ദേഹം പറഞ്ഞു. പ്രധാനമായും സ്വാഭാവിക ഭാഷയായതിനാൽ ലുക്കുകളെ ഇൻറർനെറ്റിൽ പരിശീലനം നേടിയിട്ടുണ്ട്, അതിനാൽ പ്രകൃതിദത്ത ഭാഷയും ശബ്ദവും അവരുമായി സംവദിക്കാനുള്ള മാർഗമാണ്.

ഗോവറോർക്കുകളുമായുള്ള പങ്കാളിയായ ജോർദാൻ വക്രമായ കോപലുകൾ, മിഡിൽവെയർ, ആപ്ലിക്കേഷൻ, ഏജന്റുകൾ, ഹാർഡ്വെയർ എന്നിവയിൽ നിക്ഷേപിച്ചതിനാൽ അത് നിക്ഷേപവുമായി ബന്ധപ്പെട്ടതിനാൽ പറഞ്ഞു. നിങ്ങളുടെ ഉപകരണത്തിൽ നിന്നുള്ള മീറ്റിംഗുകൾ പകർത്തി സംഗ്രഹിക്കുന്ന ഒരു എയ് നോട്ട്പാഡ്, ഇത് ഗ്രാനോളയെ പിന്തുണച്ചു.

“ഞങ്ങളുടെ പോർട്ട്ഫോളിയോയുടെ ഒരു ഉപസെറ്റ് എന്ന നിലയിൽ, ആ കമ്പനികളിൽ പലരും ഉപയോഗത്തിലും കഴിവിലും ടെൽവിൻഡ്സ് അനുഭവിക്കുന്നു,” അവൾ ഇമെയിൽ വഴി എഴുതി. “അതിനാൽ ടിടിഎസ് / സ്റ്റിക്ക് (ടെക്സ്റ്റ്-ടു-സ്പീച്ച് / സ്പീച്ച്-ടു-വാചകം) ലഭ്യമായ ഒരു ദശകത്തിനുശേഷം, ഓഡിയോ-അവബോധമുള്ള മോഡലുകളുടെ നിലവിലെ വിള യഥാർത്ഥ യൂട്ടിലിറ്റിയും മുഖ്യധാരയും ഒരു ഇന്റർഫേസായി അൺലോക്കുചെയ്തു.”

ഉപഭോക്തൃ സംഭാഷണങ്ങൾ

എല്ലാ വലുപ്പത്തിലുമുള്ള വോയ്സ് AI സ്റ്റാർട്ടപ്പുകൾ സംരംഭ ധനസഹായം വർദ്ധിപ്പിക്കുന്നത് തുടരുന്നു. ഉപഭോക്തൃ പിന്തുണ പ്രത്യേകിച്ചും വർദ്ധിച്ചുവരുന്ന പ്രദേശമാണ്.

റെസ്റ്റോറന്റുകളിലെ ടെക്സസ് അടിസ്ഥാനമാക്കിയുള്ള 24/7 എഐപി പവർ സിസ്റ്റം എഐ-പവർ സിസ്റ്റം സംവിധാനം ലോഹൻ ഐ, അടുത്ത കോസ്റ്റ് സംരംഭങ്ങളുടെ നേതൃത്വത്തിൽ 3.5 മില്യൺ ഡോളർ സഞ്ചരിച്ചതായി അറിയിച്ചു.

2024 ലോഞ്ച് മുതൽ “ടെൻസ് ദശലക്ഷക്കണക്കിന് ദശലക്ഷക്കണക്കിന്” ഓർഡർ നൽകിയിട്ടുണ്ടെന്ന് കമ്പനി പറയുന്നു. ലോൺ ഏജന്റിന് “എഐഇ ഫോൺ ഏജന്റിന്” ഉത്തരം നൽകുന്നു, “എല്ലാ കോളിനും” ഉത്തരം നൽകുന്നു, പുസ്തകങ്ങളുടെ റിസർവേഷനുകൾ, അതിഥി ചോദ്യങ്ങൾ, റിസർവേഷൻ സിസ്റ്റങ്ങൾ എന്നിവ ഉപയോഗിച്ച് നേരിട്ട് നേരിട്ട്. റിസ്റ്റോറന്റുകൾ തിരിച്ചുപിടിച്ച കോളുകളിൽ നിന്നും “സ്മാർട്ട് അപ്സെൽസ്” എന്നയും ഉയർന്ന വരുമാനം കാണുമ്പോൾ തൊഴിൽ ചെലവ് കുറയ്ക്കുന്നതിനിടയിലും റെസ്റ്റോറന്റുകൾ കാണുന്നു എന്നതാണ് അവകാശപ്പെടുന്ന ഇത് അവകാശപ്പെടുന്നു.

ജൂണിൽ മാവെൻജി, ഉപഭോക്തൃ പിന്തുണയ്ക്കായി എന്റർപ്രൈസ് എഐ ഏജന്റുമാർ നിർമ്മിക്കുന്ന സ്റ്റാർട്ടപ്പിൽ, ഡെൽ ടെക്നോളജീസ് തലസ്ഥാനത്തിന്റെ നേതൃത്വത്തിൽ 50 മില്യൺ ഡോളർ സീരീസ് ബി ഉയർത്തി. 2023 ൽ സ്ഥാപിതമായ ബോസ്റ്റൺ ആസ്ഥാനമായുള്ള കമ്പനി മൊത്തം 78 മില്യൺ ഡോളർ ഫണ്ടിംഗ് നടത്തി. അടുത്തിടെയുള്ള ഒരു ബ്ലോഗ് പോസ്റ്റിൽ, സ്ഥാപകൻ, സി.ഒ. സമി ശാലബി എന്നിവ എഴുതി.

അതിനെത്തി: “സ്വരം-ടു-വോയ്സ് എഐഐയെ യഥാർത്ഥ ലോക ഉൽപാദനത്തിലേക്ക് കൊണ്ടുവന്നത്, കൂടുതൽ സ്വാഭാവിക ഇടപെടലുകൾ, കേടുകൂടാതെ നിൽക്കുന്ന ടോൺ എന്നിവയിലേക്ക് വൺ-വോയ്സ് എ.ഐ.എ.

ഡിജിറ്റൽ ലോകത്തിന് ഒരു 'യൂണിവേഴ്സൽ റിമോട്ട്'

മറ്റ് AI കമ്പനികളെ അവരുടെ വഴിപാടുകൾ വളർത്താൻ സഹാനുഭൂതികൾ പിന്നിൽ പ്രവർത്തിക്കുന്ന കമ്പനികളുണ്ട്. ഒരു ഉദാഹരണം അസംബന്ധിതനായി സ്ഥിതിചെയ്യുന്നു, ഇത് ഒരു പ്രയോഗിച്ച AI സ്റ്റാർട്ടറാണ്, അത് വിപുലമായ സംഭാഷണ-വാചകവും ഓഡിയോ ഇന്റലിജൻസ് മോഡലുകളും നിർമ്മിക്കുന്നു. ട്രാൻസ്ക്രിപ്ഷനും ശബ്ദ തിരിച്ചറിയലും പോലുള്ള ശബ്ദ സവിശേഷതകൾ അവരുടെ അപ്ലിക്കേഷനുകളിലേക്ക് ആകർഷിക്കാൻ എളുപ്പമാക്കാൻ ഇത് ലക്ഷ്യമിടുന്നു. ഉദാഹരണത്തിന്, ശബ്ദ, ഫയർഫ്ലൈസ് തുടങ്ങിയ വോയ്സ് എഐപികൾ. അവരുടെ സവിശേഷതകൾ അധികാരപ്പെടുത്തുന്നതിന് അസംബ്ലിയുടെ സാങ്കേതികവിദ്യ ഉപയോഗിക്കുക.

2017 ൽ സ്ഥാപിതമായത്, ഇത് ഏകദേശം 160 മില്യൺ ഡോളർ തീയതി, ഒരു ക്രഞ്ചേസ് ഡാറ്റയിലേക്ക് ഉയർത്തി. നിങ്ങളുടെ കോമ്പിനേറ്റർ, ആപ്ലിക്കേഷൻ, ഉൾക്കാഴ്ച, സ്മിത്ത് പോയിന്റ് മൂലധനം എന്നിവ ബാക്കറുകളിൽ ഉൾപ്പെടുന്നു.

അസംബ്ലിയുടെ സാങ്കേതികവിദ്യയിൽ പലതരം ഉപയോഗ കേസുകളുണ്ട്, സിഇഒയും സ്ഥാപകനായ ഡയുക്സും. ഉപഭോക്തൃ കോളുകൾ ട്രാൻസ്ക്രിംഗ് ചെയ്യാനും വിശകലനം ചെയ്യാനും സംഭാഷണങ്ങൾ സംഗ്രഹിക്കാനും പരിശോധനാ നിമിഷങ്ങൾ കണ്ടെത്താനും കോൺടാക്റ്റ് സെന്ററുകളും സെയിൽസ് ടീമുകളും ഉപയോഗിച്ചു. മുകളിൽ സൂചിപ്പിച്ചതുപോലെ, അതിന്റെ സാങ്കേതിക ശക്തികൾ, ഗ്രാനോള, വുദ്, സൂം തുടങ്ങിയ കമ്പനികൾക്കുള്ള തത്സമയ സബ്ടൈറ്റിലുകൾ, വോയ്സ് അസിസ്റ്റന്റുകൾ, തിരയാവുന്ന ട്രാൻസ്ക്രീപ്റ്റുകൾ എന്നിവ സവിശേഷതകളും സവിശേഷതകൾ. ആരോഗ്യ സംരക്ഷണ സ്ഥലത്ത്, ഇത് റെക്കോർഡുചെയ്ത സംഭാഷണങ്ങളിൽ നിന്ന് ക്ഷമ കുറിപ്പുകൾ യാന്ത്രികമായി സൃഷ്ടിക്കുന്നു. വീഡിയോകൾ, പോഡ്കാസ്റ്റുകൾ, മീറ്റിംഗുകൾ എന്നിവയ്ക്കായി ഇത് അടിക്കുറിപ്പുകളും പകർപ്പുകളും സൃഷ്ടിക്കുന്നു.

“ഞങ്ങൾ ചെയ്യുന്ന കാര്യങ്ങളിൽ ഒരു വലിയ മാർക്കറ്റ് അവസരമുണ്ടെന്ന് വളരെ വ്യക്തമാണ്,” കുറുക്കൻ ഒരു അഭിമുഖത്തിൽ ഒരു അഭിമുഖത്തിൽ പറഞ്ഞു. “ആദ്യ രണ്ട് വർഷങ്ങളായി ടെക് മോശമായിരുന്നു, വിപണി ചെറുതായിരുന്നു, അത് വളരെ ക്ലിക്കുചെയ്ത് ഒത്തുചേർന്ന് തുടരുന്നതിന് സമയമെടുത്തു.

“പര്യവേക്ഷണം ചെയ്യാത്തതും ഉപയോഗിക്കാത്തതുമായ ഒരു വലിയ ഉപരിതല മേഖലയുണ്ട്, കാരണം വാചകം ഇപ്പോഴും ധാരാളം സാധനങ്ങൾക്ക് പര്യാപ്തമല്ലെന്നും അദ്ദേഹം പറഞ്ഞു. “അതിനാൽ ഇനിയും വളരാൻ വളരെയധികം ഉണ്ട്.”

അസംബ്ലിയുടെ API- നുള്ള ഉപയോഗം വർഷത്തിൽ 250% വരും, ഇത് സാധാരണഗതിയിൽ അതിന്റെ പ്ലാറ്റ്ഫോമിൽ ആയിരക്കണക്കിന് ഉപഭോക്താക്കളും അര ദശലക്ഷത്തിലധികം ഡവലപ്പർമാരുമുണ്ടെന്ന് നോക്കുക.

ആളുകൾക്ക് മറ്റൊരു വലിയ ഉപയോഗ കേസ് എന്ന് നോക്കുമ്പോൾ, ആളുകൾക്ക് ഫോണിലൂടെ സംസാരിക്കാനും ഹാർഡ്വെയർ പ്ലഗ് ചെയ്യാനും കഴിയും.

“ഞങ്ങൾ ലോവ്കിറ്റ് പോലുള്ള കമ്പനികളുമായി അടുത്ത് പ്രവർത്തിക്കുന്നു, ആ സ്ഥലത്ത് ധാരാളം ഉണ്ട്, അത് മാത്രം എടുക്കുന്നു,” അദ്ദേഹം പറഞ്ഞു

ജിവിയുടെ ഹുൽമിനായി, ശബ്ദത്തിന്റെ വളർച്ചയിൽ അദ്ദേഹം വിശ്വസിക്കുന്ന ഏറ്റവും ആവേശകരമായ പ്രവണതകളിലൊന്നായതിനാൽ “ഞങ്ങൾ മനുഷ്യരാശിയുടെ ഏറ്റവും സ്വാഭാവിക ആശയവിനിമയത്തിലേക്ക് മടങ്ങുകയാണ്” എന്നതാണ്.

സാങ്കേതികവിദ്യയുമായി പൊരുത്തപ്പെടുന്ന പതിറ്റാണ്ടുകൾക്ക് ശേഷം, “സാങ്കേതികവിദ്യ ഒടുവിൽ ഞങ്ങളോട് പൊരുത്തപ്പെടുന്നു,” അദ്ദേഹം പറഞ്ഞു.

“ശബ്ദവും സ്വാഭാവിക ഭാഷ ആത്യന്തിക പ്രവേശനക്ഷമത ഹാക്കിനെ പ്രതിനിധീകരിക്കുന്നു, ചിന്തിക്കാനും ആശയവിനിമയം നടത്താനും കഴിയുന്ന എല്ലാവർക്കും ജനാധിപത്യവൽക്കരണം നടത്തുന്നത്, കാരണം ഡിജിറ്റൽ ലോകത്തിന് ശബ്ദം ഒരുതരം സാർവത്രിക വിദൂര വാർത്തയായി മാറുന്നതിനാണ്. ഹുൽമെ സുൽം പറഞ്ഞു. “ഇത് വലിയ സാങ്കേതിക കമ്പനികളോ പുതിയ സ്റ്റാർട്ടപ്പുകളോ ആണെങ്കിലും, സംഭാഷണ പാളിയിൽ ധാരാളം കളിക്കാർ ധാരാളം കളിക്കാർ ഉണ്ട്.”

അനുബന്ധ വായന:

ചിത്രീകരണം: ഡോം ഗുസ്മാൻ

സമീപകാല ധനസഹായമായ റൗണ്ടുകൾ, ഏറ്റെടുക്കൽ, ദിവസവും ക്രഞ്ചേസ് എന്നിവയുമായി കൂടുതൽ കാലികമായി തുടരുക.

(ഇത് ഒരു സിൻഡിക്കേറ്റഡ് ന്യൂസ് ഫീഡിൽ നിന്ന് എഡിറ്റ് ചെയ്യാത്തതും സ്വയമേവ ജനറേറ്റ് ചെയ്തതുമായ ഒരു ലേഖനമാണ്. The NRI News ജീവനക്കാർ ഉള്ളടക്കത്തിൽ മാറ്റം വരുത്തുകയോ എഡിറ്റ് ചെയ്യുകയോ ചെയ്തിട്ടുണ്ടാകില്ല.)

Related Articles

Back to top button