Оптикалык белгилерди таануу (OCR) деген эмне?

Мазмуну:

Оптикалык белгилерди таануу (OCR) деген эмне?
Оптикалык белгилерди таануу (OCR) деген эмне?
Anonim

Символдорду оптикалык таануу (OCR) текстти кол менен терүүнүн же киргизүүнүн зарылдыгы жок компьютерлер окуй ала турган басылган, терилген же кол менен жазылган документтин санариптик версиясын түзгөн программалык камсыздоону билдирет. OCR көбүнчө PDF форматындагы сканерленген документтерде колдонулат, бирок сүрөт файлынын ичиндеги тексттин компьютер окуй турган версиясын да түзө алат.

OCR деген эмне

OCR, ошондой эле текстти таануу деп аталат, бул басылган же жазылган документтердеги сандар, тамгалар жана тыныш белгилери (ошондой эле глифтер деп аталат) сыяктуу символдорду компьютерлер жана компьютерлер жана башка программалык камсыздоо программалары. Кээ бир OCR программалары муну документ сканирленгенде же санарип камера менен сүрөткө тартып жатканда жасайт, ал эми башкалары бул процессти мурда сканерленген же OCRсиз сүрөткө тартылган документтерге колдоно алышат. OCR колдонуучуларга PDF документтеринен издөө, текстти түзөтүү жана документтерди кайра форматтоо мүмкүнчүлүгүн берет.

Image
Image
Тарыхый гезит OCR программасы менен скандоодо.

Getty Images

OCR эмне үчүн колдонулат?

Тез, күнүмдүк скандоо муктаждыктары үчүн OCR чоң маселе болбошу мүмкүн. Эгер сиз көп көлөмдө сканерлесеңиз, PDF файлдарынын ичинен керектүүсүн табуу үчүн издөө бир аз убакытты үнөмдөп, сканер программаңыздагы OCR функциясын маанилүүрөөк кылат. Бул жерде OCR башка нерселерге жардам берет:

  • Маалыматтарды автоматташтырылган иштетүү жана маалыматтарды киргизүү (Мисалы: Резюмелер үчүн жумушка талапкерге көз салуу системалары).
  • Сканерленген китептерди издөөгө болот.
  • Колжазма скандоолорду компьютер окуй турган текстке айландыруу.
  • Документтерди көрүүсү начар колдонуучуларга жардам берүүчү окуу программалары үчүн колдонууга ыңгайлуу кылуу.
  • Тарыхый документтерди жана гезиттерди сактоо, ошону менен бирге аларды издөөгө болот.
  • Маалыматтарды алуу жана эсепке алуу программаларына өткөрүү (Мисалы: Квитанциялар жана эсеп-фактуралар).
  • Издөө системалары үчүн документтерди индекстөө.
  • Айдоочунун күбөлүгүн ылдамдык камерасы жана кызыл жарык камерасы программасы аркылуу таануу.
  • Суйлой албаган адамдар үчүн кеп синтезаторлору – теориялык физик Стивен Хокинг, балким, кеп синтезатор программасынын эң белгилүү колдонуучусу.

Төмөнкү сап

Эмне үчүн жөн эле сүрөткө тартпайсыз, туурабы? Анткени сиз эч нерсени түзөтө албайсыз же текстти издей албайсыз, анткени ал жөн эле сүрөт болмок. Документти сканерлөө жана OCR программасын иштетүү ал файлды сиз түзөтө турган нерсеге айлантып, издей аласыз.

OCR тарыхы

Текст таануунун эң алгачкы колдонулушу 1914-жылга туура келсе, OCR менен байланышкан технологиялардын кеңири таралган өнүгүшү жана колдонулушу 1950-жылдары, өзгөчө санарипке айландыруу оңой болгон өтө жөнөкөйлөштүрүлгөн шрифттерди түзүү менен башталган. окула турган текст. Бул жөнөкөйлөтүлгөн шрифттердин биринчиси Дэвид Шепард тарабынан түзүлгөн жана көбүнчө OCR-7B катары белгилүү. OCR-7B бүгүнкү күндө каржы тармагында кредиттик карталарда жана дебеттик карталарда колдонулган стандарттык шрифт үчүн колдонулууда. 1960-жылдары бир нече өлкөлөрдө почта кызматтары OCR технологиясын, анын ичинде Америка Кошмо Штаттарын, Улуу Британияны, Канаданы жана Германияны каттарды сорттоону тездетүү үчүн колдоно башташты. OCR дагы эле дүйнө жүзү боюнча почта кызматтары үчүн почтаны сорттоо үчүн колдонулган негизги технология болуп саналат. 2000-жылы OCR технологиясынын чектөөлөрү жана мүмкүнчүлүктөрү жөнүндө негизги билим ботторду жана спам жасоочуларды токтотуу үчүн колдонулган CAPTCHA программаларын иштеп чыгуу үчүн колдонулган.

Ондогон жылдар бою, OCR жасалма интеллект, машина үйрөнүү жана компьютердик көрүнүш сыяктуу технологиялык чөйрөлөрдөгү жетишкендиктерден улам так жана татаалыраак өстү. Бүгүнкү күндө OCR программасы документтерди мурдагыдан да тез жана так өзгөртүү үчүн үлгү таанууну, өзгөчөлүктү аныктоону жана текстти иштетүүнү колдонот.

КБС

    Телефон же планшет менен документтерди кантип сканерлейм?

    IOS'то Notes колдонмосун ачып, жаңы эскертүү түзүңүз. Камераны ачып, Документтерди сканерлөө таптаңыз. Androidде Google Drive'ды ачып, Plus (+) тандаңыз, андан соң скандоо үчүн Скандоо таптаңыз. телефонуңуз менен документ.

    Adobe Acrobat'та OCRди кантип колдоном?

    Сканерленген сүрөттү камтыган PDF файлын ачып, андан кийин Tools > PDF түзөтүү тандаңыз. Acrobat сиз текстти түзөтүү үчүн OCRди автоматтык түрдө колдонот. Жөн гана оңдоолорду киргизгиңиз келген жерди тандап, терип баштаңыз.

    OCR менен OMRдин ортосунда кандай айырма бар?

    Белгилерди оптикалык таануу (OMR) – кагаздагы белгилерди, адатта, көбүк барагын аныктоочу программа. OMR экзамендердин, сурамжылоонун, анкеталардын, жада калса шайлоолордун жыйынтыктарын иштеп чыгуу үчүн колдонулат. OCRден айырмаланып, OMR беттеги белгилерди чечмелей албайт, бирок белгилер бар экенин гана текшерет.

Сунушталууда: