Жакында, сиз компьютер менен сүйлөшүп жатканыңызды билбей калышыңыз мүмкүн

Мазмуну:

Жакында, сиз компьютер менен сүйлөшүп жатканыңызды билбей калышыңыз мүмкүн
Жакында, сиз компьютер менен сүйлөшүп жатканыңызды билбей калышыңыз мүмкүн
Anonim

Негизги алып салуулар

  • Компьютерде жасалган кепти чыныгы нерседен ажырата албай кала турган күн тездик менен жакындап келе жатат.
  • Google жакында LaMDA моделин көрсөттү, ал табигый сүйлөшүүгө мүмкүндүк берет.
  • Адамга окшош кеп жасоо да чоң көлөмдөгү иштетүү күчүн талап кылат.
Image
Image

Учурда компьютер менен сүйлөшүп жатканыңызды билүү оңой, бирок AIдагы акыркы жетишкендиктердин аркасында бул жакында өзгөрүшү мүмкүн.

Google жакында LaMDA, эксперименталдык моделин көрсөттү, ал компания өзүнүн AI жардамчыларынын сүйлөшүү жөндөмдүүлүгүн жогорулатып, табигый сүйлөшүүгө мүмкүндүк берет деп ырастады. LaMDA алдын ала эч кандай машыгуусуз дээрлик бардык нерсе жөнүндө кадимкидей сүйлөшүүнү максат кылат.

Бул адам менен сүйлөшүп жатасызбы деген ойду калтыра турган AI долбоорлорунун саны көбөйүп баратат.

"Менин болжолум боюнча, келерки 12 айдын ичинде колдонуучулар бул жаңы, эмоционалдуу үндөргө дуушар болуп, көнүп калышат," Жеймс Каплан, MeetKai компаниясынын башкы директору, сүйлөшүүчү AI виртуалдык үн жардамчысы жана издөө кыймылдаткыч, деп билдирди электрондук почта менен болгон маегинде.

"Мындай болгондон кийин, бүгүнкү синтезделген сөз колдонуучуларга 2000-жылдардын башындагы сөз бизге бүгүнкүдөй угулат."

Мүнөзү бар үн жардамчылары

Google'дун LaMDA'сы Google Research тарабынан ойлоп табылган нейрондук тармак архитектурасы болгон Transformerдин негизинде курулган. Башка тил моделдеринен айырмаланып, Google'дун LaMDA'сы чыныгы диалогго үйрөтүлгөн.

Табигый үндүү AI сүйлөө кыйынчылыгынын бир бөлүгү - баарлашуулардын ачык мүнөзү, деп жазган Google'дун Эли Коллинз блогунда.

Image
Image

"Досуңуз менен телешоу жөнүндө баарлашуу ошол өлкөнүн эң мыкты аймактык ашканасы тууралуу талаш-тартыштан мурун шоу тартылган өлкө тууралуу талкууга айланып кетиши мүмкүн", - деп кошумчалады ал.

Роботтун сүйлөгөнү менен нерселер ылдам жүрүп жатат. Сүйлөшүүчү AI тармагына инвестиция салган Tsingyuan Ventures компаниясынын башкаруучу өнөктөшү Эрик Розенблюм компьютердик сүйлөөдөгү эң негизги көйгөйлөрдүн айрымдары дээрлик чечилгенин айтты.

Мисалы, Otter.ai программасы тарабынан аткарылган транскрипциялар же DeepScribe тарабынан алынган медициналык эскертүүлөр сыяктуу кызматтарда кепти түшүнүүдөгү тактыктын деңгээли өтө жогору.

Кийинки чек ара алда канча татаал, - деп кошумчалады ал.

"Табигый тилди иштетүүдөн алыс турган көйгөй болгон контекстти түшүнүү жана эмпатия, мисалы, адамдар менен иштешкен компьютерлер нааразычылыкты, ачууланууну, чыдамсыздыкты ж.б. түшүнүшү керек. Бул эки маселенин тең үстүндө иштеп жатат, бирок экөө тең канааттандырарлык эмес."

Нейрондук тармактар ачкыч

Турмушка окшош үндөрдү жаратуу үчүн компаниялар терең нейрон тармактары сыяктуу технологияны, маалыматтарды катмарлар аркылуу классификациялоочу машинаны үйрөнүүнүн бир түрүн колдонушат, Мэтт Мулдун, ReadSpeaker компаниясынын Түндүк Америкадагы президенти, тексттен кепке программалык камсыздоону иштеп чыгуучу компания, мындай деди электрондук почта маегинде.

"Бул катмарлар сигналды тактап, аны татаал классификацияларга бөлөт", - деп кошумчалады ал. "Натыйжада адамдыкындай укмуштуудай угулат синтетикалык сүйлөө."

Иштелип жаткан дагы бир технология бул Prosody Transfer, ал бир тексттен кепке үнүн башкасынын сүйлөө стили менен айкалыштырат, дейт Мулдун. Жаңы нейрондук текстти кепке үн чыгаруу үчүн зарыл болгон машыгуу берилиштеринин көлөмүн азайтуучу которуу үйрөнүү да бар.

Капландын айтымында, адамга окшош сөздү жасоо да эбегейсиз чоң көлөмдөгү иштетүү күчүн талап кылат. Компаниялар кадимки процессорлор менен бирге иштеген ыңгайлаштырылган модулдар болгон нейрондук акселератор микросхемаларын иштеп чыгууда.

"Мында кийинки этап бул чиптерди кичирээк жабдыктарга салуу болот, анткени азыркы учурда көрүү үчүн AI талап кылынган камералар үчүн жасалган", - деп кошумчалады ал. "Эсептөө жөндөмдүүлүгүнүн бул түрү кулакчындардын өзүндө жеткиликтүү боло электе көп өтпөй калат."

AI менен башкарылган кепти өнүктүрүүдөгү кыйынчылыктардын бири – ар ким ар кандай сүйлөйт, андыктан компьютерлер бизди түшүнө албай калышат.

"Джорджия vs. Бостон vs. Түндүк Дакота акценттери жана англис тили сиздин негизги тилиңизби же жокпу деп ойлоңуз", - деди MDincте үн менен издөө аналитикасы боюнча иштеген Моника Дема электрондук катында. "Дүйнөлүк деңгээлде ойлоно турган болсок, Германиянын, Кытайдын жана Индиянын бардык аймактарында муну жасоо кымбатка турат, бирок бул андай эмес же мүмкүн эмес дегенди билдирбейт."

Сунушталууда: