Галлюцинациялар AI сизди жакшыраак түшүнүүгө кантип жардам берет

Мазмуну:

Галлюцинациялар AI сизди жакшыраак түшүнүүгө кантип жардам берет
Галлюцинациялар AI сизди жакшыраак түшүнүүгө кантип жардам берет
Anonim

Негизги алып салуулар

  • Машинаны үйрөнүүнүн жаңы модели котормого жардам берүү үчүн сүйлөмдүн көрүнүшүнүн сүрөтүн галлюцинациялайт.
  • VALHALLA деп аталган AI системасы адамдардын тилди кабылдоо ыкмасын туураш үчүн иштелип чыккан.
  • Жаңы система тилди түшүнүү үчүн AI колдонуу боюнча өсүп жаткан кыймылдын бир бөлүгү.
Image
Image

Сөздөрдү которуп жатканда сүрөттөрдү визуалдаштыруунун адамдык ыкмасы жасалма интеллектке (AI) сизди жакшыраак түшүнүүгө жардам берет.

Машинаны үйрөнүүнүн жаңы модели сүйлөмдүн тилдеги көрүнүшүн галлюцинациялайт. Акыркы илимий эмгекке ылайык, техника андан кийин которууга жардам берүү үчүн визуализацияны жана башка көрсөтмөлөрдү колдонот. Бул тилди түшүнүү үчүн AI колдонуу боюнча өсүп жаткан кыймылдын бир бөлүгү.

"Адамдардын сүйлөгөнү жана жазганы уникалдуу, анткени баарыбыздын тондорубуз жана стилибиз бир аз башкача", - деди Мэривилл университетинин маалымат аналитикасынын профессору, изилдөөгө катышпаган Бет Кадни Lifewire менен болгон маегинде.. "Контекстти түшүнүү кыйын, анткени бул структураланбаган маалыматтар менен иштөө сыяктуу. Бул жерде табигый тилди иштетүү (NLP) пайдалуу. NLP - бул AIнин бир бутагы, ал биз машина менен окууну түшүнүү аркылуу баарлашканыбыздагы айырмачылыктарды карайт. NLPдеги негизги айырма, AI тармагы катары биз сүйлөп жаткан же жазган сөздөрдүн түз маанисине эле көңүл бурбайт. Ал маанисине карайт."

Барып Алисадан сура

MIT, IBM жана Сан-Диегодогу Калифорния университетинин изилдөөчүлөрү тарабынан түзүлгөн VALHALLA деп аталган жаңы AI системасы адамдардын тилди кабылдоо ыкмасын туураш үчүн иштелип чыккан. Окумуштуулардын айтымында, мультимедиа сыяктуу сенсордук маалыматты, сүрөттөрү бар флешкарталар сыяктуу жаңы жана бейтааныш сөздөр менен жупташтыруу тилди өздөштүрүү жана сактоону жакшыртат.

Бул тутумдар учурда гана үйрөтүлгөн жана белгилүү бир сүйлөшүүгө жөндөмдүү чатботтордун күчүн жогорулатууда…

Команда алардын ыкмасы тексттик которууга караганда машиналык котормонун тактыгын жакшыртат деп ырастоодо. Окумуштуулар эки трансформатору бар кодер-декодер архитектурасын колдонушкан, нейрондук тармак моделинин тил сыяктуу ырааттуулукка көз каранды маалыматтарга ылайыктуу түрү, ал сүйлөмдүн ачкыч сөздөрүнө жана семантикасына көңүл бура алат. Бир трансформатор визуалдык галлюцинацияны жаратса, экинчиси биринчи трансформатордун чыгышы аркылуу мультимодалдык которууну аткарат.

"Чыныгы сценарийлерде сизде булак сүйлөмүнө карата сүрөт жок болушу мүмкүн", - деди изилдөө тобунун мүчөлөрүнүн бири Рамесвар Панда пресс-релизинде. "Демек, биздин мотивациябыз негизи эле: Киргизүү катары корутундулоо учурунда тышкы сүрөттү колдонуунун ордуна, биз визуалдык галлюцинацияны - визуалдык көрүнүштөрдү элестетүү жөндөмүн - машина которуу системаларын жакшыртуу үчүн колдоно алабызбы?"

AI түшүнүү

Колутуу изилдөөлөр NLPди өнүктүрүүгө багытталган, деп белгиледи Кадни. Мисалы, Элон Маск Open AIди негиздеген, ал GPT-3, адам менен баарлаша ала турган жана Python жана Java тилдеринде программалык кодду түзө ала турган үлгүдө иштеп жатат.

Google жана Meta да LAMDA деп аталган системасы менен баарлашуучу AIди иштеп чыгуунун үстүндө иштеп жатышат. "Бул системалар чатботтордун күчүн көбөйтөт, алар учурда гана үйрөтүлгөн жана конкреттүү сүйлөшүүгө жөндөмдүү, бул кардарларды колдоо жана жардам столунун жүзүн өзгөртүшү мүмкүн", - деди Кудни.

Аарон Сломан, AI технологиялык компаниясынын негиздөөчүлөрүнүн бири CLIPr, GPT-3 сыяктуу чоң тил моделдери адамдын пикири боюнча тексттин кыскача мазмунун жакшыртуу үчүн өтө аз окутуу мисалдарынан үйрөнө аларын электрондук катта билдирди. Мисалы, ал чоң тил моделине математикалык маселени берип, AIдан кадам сайын ойлонушун суранса болот деди.

"Биз чоң тил моделдеринин мүмкүнчүлүктөрү жана чектөөлөрү жөнүндө көбүрөөк билгендиктен, алардан көбүрөөк түшүнүктөр жана ой жүгүртүүлөр алынат деп күтсөк болот", - деп кошумчалады Сломан. "Ошондой эле бул тил моделдери адамга окшош процесстерди жаратат деп күтөм, анткени моделдер кызыккан конкреттүү тапшырмалар үчүн моделдерди тактоо үчүн жакшыраак жолдорду иштеп чыгышат."

Georgia Tech компьютердик профессору Дийи Янг электрондук почта менен болгон маегинде биз күнүмдүк жашообузда NLP негизиндеги жекелештирилген жардамчылардан баштап электрондук каттарды жана телефон чалууларга жардам берүү үчүн табигый тилди иштетүү (NLP) тутумдарын көбүрөөк колдонобуз деп болжолдогон. саякатта же саламаттыкты сактоодо маалымат издөө үчүн билимдүү диалог системаларына."Ошондой эле милдеттерди аткарып, адамдарга жоопкерчиликтүү жана бир жактуу түрдө жардам бере турган адилеттүү AI системалары", - деп кошумчалады Ян.

GPT-3 жана DeepText сыяктуу триллиондогон параметрлерди колдонгон эбегейсиз AI моделдери бардык тил колдонмолору үчүн бирдиктүү моделдин үстүндө иштөөнү улантат, деп болжолдогон Dialexa компаниясынын машина үйрөнүү инженери Стивен Хейдж электрондук почта менен болгон маегинде. Ал ошондой эле үн буйругу менен онлайн сатып алуу сыяктуу белгилүү бир колдонуу үчүн жаратылган моделдердин жаңы түрлөрү пайда болорун айтты.

"Мисалы, сатып алуучу адамдын көзүнө ал көлөкөнү анын кандайча колдонулганын бир аз көзөмөлдөп көрсөтүү үчүн "Мага түн ортосу көк түстөгү бул өңдү көбүрөөк гало менен көрсөт" деп айтуусу мүмкүн", - деп кошумчалады Хейдж.

Сунушталууда: