Эмнени билүү керек
- Google Books Ngram Viewer'ге сөз айкашын териңиз, даталар диапазонун жана корпусту тандап, жылмакай деъгээлин коюп, Көптөгөн китептерди издөө баскычын басыңыз.
- Дайындарды тереңдете аласыз. Мисалы, балык деген этиштин формасын издөө үчүн балык зат атоочтун ордуна тегди колдонуңуз: fish_VERB. үчүн издөө
- Ngram Viewer фразанын убакыт боюнча колдонулушун чагылдырган графикти чыгарат. Бир нече фразалар үчүн ар бири түс менен коддолгон сызык менен көрсөтүлөт.
Бул макалада Google Китептердеги Ngram Viewer куралын изилдөө жана күчтүү издөө үчүн кантип колдонуу керектиги түшүндүрүлөт.
Ngram Viewer кантип иштейт
Ngram, N-gram деп да аталат, бул тексттин же кептин мазмунунун статистикалык анализи, бул тексттеги кандайдыр бир нерсенин n (санын) табуу.
Издөө элементи ар кандай нерселер, анын ичинде фонемалар, префикстер, фразалар жана тамгалар болушу мүмкүн. Ngram изилдөө коомчулугунун сыртында бүдөмүк болгону менен, ал ар түрдүү тармактарда колдонулат жана табигый сүйлөө тилин түшүнгөн жана ага жооп берген компьютердик программаларды коддогон иштеп чыгуучулар үчүн көп кесепеттерге ээ.
Google Books Ngram Viewer учурда, талдануучу текст Google өзүнүн Google Books издөө системасын толтуруу үчүн сканерлеген коомдук домендеги китептердин көп санынан келип чыгат. Google Books Ngram Viewer үчүн Google сиз издей турган тексттин корпусун билдирет. Ngram Viewer тил боюнча топтойт, бирок сиз британ жана америкалык англис тилдерин өз-өзүнчө талдап же аларды бириктире аласыз.
- books.google.com/grams дарегинен Google Китептердин Ngram Көрүүчүсүнө өтүңүз.
-
Талдоо үчүн каалаган фразаны же фразаларды териңиз. Ар бир сөз айкашын үтүр менен бөлүңүз. Баштоо үчүн Google "Альберт Эйнштейн, Шерлок Холмс, Франкенштейн" деп сунуштайт.
NGram Viewer издөөлөрүндө, Google веб издөөлөрүндөгү нерселерден айырмаланып, чоң-кичине тамгалар айырмаланат.
- Күн аралыгын тандаңыз. Демейки 1800дөн 2000гө чейин.
- Корпусту тандаңыз. Сиз чет тилдеги тексттерди же англисче тексттерди издей аласыз жана стандарттык тандоолордон тышкары, тизменин ылдый жагында "Англис (2009)" же "Америкалык англисче (2009)" сыяктуу жазууларды байкай аласыз. Булар Google жаңырткан эски корпустар, бирок сизде эски маалымат топтомдору менен салыштыруу үчүн кандайдыр бир себеп болушу мүмкүн. Көпчүлүк колдонуучулар аларга көңүл бурбай, эң акыркы корпуска көңүл бура алышат.
-
Текшерүү деңгээлин коюңуз. Текшерүү графиктин аягында канчалык жылмакай экендигин билдирет. Эң так көрсөтүү 0 тегиздөө деңгээлин чагылдырат, бирок бул жөндөө окуу кыйын болушу мүмкүн. Демейки 3 деп коюлган. Көпчүлүк учурларда, аны тууралоонун кереги жок.
- Басма Көп китептерди издөө.
Google'дун Ngram Viewer программасын колдонуп, сиз дайындарды тереңдете аласыз. Эгерде сиз fish зат атоочтун ордуна балык этишин издегиңиз келсе, тегдерди колдонуу менен кылсаңыз болот. Бул учурда, сиз fish_VERB деп издейсиз.
Google өзүнүн веб-сайтында Ngram Viewer менен колдонуу үчүн буйруктардын толук тизмесин берет.
Төмөнкү сап
Google Books Ngram Viewer китептерде белгилүү бир фразанын убакыттын өтүшү менен колдонулушун чагылдырган графикти чыгарат. Эгер сиз бирден ашык сөздү же сөз айкашын киргизсеңиз, алардын ар бири башка издөө сөздөрүнөн айырмаланып, түстүү коддуу сызык менен көрсөтүлөт. Бул Google Тренддерине окшош, издөө гана узак мөөнөттү камтыйт.
Кайстык изилдөө
Уксус пирогунун мисалын карап көрөлү. Алар Лаура Ингаллс Уайлдердин "Прейридеги кичинекей үй" сериясында айтылган. Уксус пирогдору жөнүндө көбүрөөк билүү үчүн Google'дун веб-издөөсүн изилдөө, алар Американын түштүк ашканасынын бир бөлүгү болуп саналаарын жана чындап эле уксус менен жасалганын көрсөтөт. Алар жылдын бардык мезгилдеринде ар бир адам жаңы түшүмдү ала албаган учурларды угушат, бирок бүт окуя ушулбу?
Google Ngram Viewer'ден уксус пирогун издеңиз, ошондо 1800-жылдардын башында да, аягында да пирог жөнүндө бир нече айтылгандарды, 1940-жылдары көп айтылгандарды жана акыркы убакта айтылгандардын саны көбөйүп баратканын көрөсүз. Бирок, 3 тегиздөө деңгээли менен, сиз 1800-жылдары айтылгандардын үстүнөн плато көрөсүз. Анткени ал убакта көп китептер жарык көргөн эмес жана маалыматтар жылмакайга коюлгандыктан, сүрөт бурмаланган. Кыязы, бир гана китепте уксус пирогунда айтылган жана чокусу болбош үчүн орточо алынган. Текшерүүнү 0гө коюу менен, бул так ушундай экенин көрө аласыз. Чоң 1869-жылы борборлойт, ал эми 1897 жана 1900-жылдары дагы бир өсүү бар.
Калган убакта эч ким уксус пирогдору жөнүндө сүйлөшпөгөнү күмөн: Рецепттер бардык жерде калкып жүрсө керек, бирок адамдар алар жөнүндө китептерде жазган эмес жана бул Ngram издөөлөрүнүн маанилүү чектөөсү.