Hvernig á að nota 'Ngram Viewer' tólið í Google Bækur

A Ngram, sem einnig er almennt nefnt N-gramm, er tölfræðileg greining á texta- eða talnefni til að finna n (fjölda) einhvers konar hlutar í textanum. Það gæti verið alls konar hluti, eins og hljóðrit, forskeyti, orðasambönd eða stafi. Þrátt fyrir að N-málið sé nokkuð hulið utan rannsóknaraðila, er það notað í ýmsum sviðum og það hefur mikla þýðingu fyrir fólk sem gerir tölvuforrit sem skilja og bregðast við náttúrulegu talað tungumáli. Það, í hnotskurn, væri áhugi Google í hugmyndinni.

Þegar um er að ræða Google Bækur Ngram Viewer er textinn sem á að greina greindur af miklum fjölda bóka sem Google hefur skannað í frá opinberum bókasöfnum til að byggja upp leitarvélina í Google Bækur . Fyrir Google Bækur Ngram Viewer, vísa þeim til textans sem þú ert að fara að leita sem "corpus". Korporal í Ngram Viewer er skipt upp eftir tungumáli, þótt þú getir greint sérstaklega frá breskum og amerískum ensku eða klárað þau saman. Það endar að vera frábær áhugavert að skipta frá breskum til amerískra nota á skilmálum og sjá töflurnar breytast.

Hvernig Ngram Works

  1. Farðu í Ngram Viewer á Google Bækur á books.google.com/ngrams.
  2. Atriði eru málmæmir, ólíkt Google Web leitum, svo vertu viss um að nýta sér rétt nafnorð.
  3. Sláðu inn hvaða orðasambönd eða orðasambönd sem þú vilt greina. Vertu viss um að skilja hvert orðasamband með kommu. Google bendir á, "Albert Einstein, Sherlock Holmes, Frankenstein" til að hefjast handa.
  4. Næst skaltu slá inn dagsetningarsvið. Sjálfgefið er 1800 til 2000, en það eru nýjustu bækur (2011 var nýjasta skráð í skjölum Google, en það kann að hafa breyst.)
  5. Veldu korpus. Þú getur leitað erlendra tungumála eða ensku og auk staðlaðra val geturðu tekið eftir hlutum eins og "Enska (2009) eða American English (2009)" neðst. Þetta eru eldri fyrirtæki sem Google hefur uppfært síðan, en þú gætir haft nokkrar ástæður til að gera samanburð þinn gagnvart gömlum gagnasöfnum. Flestir notendur geta hunsað þau og lagt áherslu á nýjustu fyrirtækin.
  6. Stilltu sléttunarstig þitt. Sléttun vísar til þess hversu slétt grafið er í lokin. Nákvæmasta framsetningin væri jöfnunarstig 0, en það getur verið erfitt að lesa. Sjálfgefið er stillt á 3. Í flestum tilfellum þarftu ekki að breyta þessu.
  1. Ýttu á hnappinn Leita hellingur af bókum . (Þú getur líka smellt á Enter á leitarniðurstöðum.)

Hvað er Ngram Sýna?

Google Books Ngram Viewer mun framleiða línurit sem táknar notkun tiltekins orðs í bókum í gegnum tíðina. Ef þú hefur slegið inn fleiri en eitt orð eða setningu muntu sjá litadóða línur til að andstæða mismunandi leitarskilyrði. Þetta er nokkuð svipað og Google Trends , aðeins leitin nær til lengri tíma.

Hér er dæmi um raunveruleikann. Við vorum forvitinn um pönnukökur af edikum undanfarið. Þeir eru nefndar í Laura Ingalls Wilder's Little House á Prairie röð, en við höfðum aldrei heyrt um slíkt. Við notuðum fyrst vefleit Google til að læra meira um edikapar. Apparently, þeir eru talin hluti af American Southern matargerð og eru raunverulega úr ediki. Þeir hlusta aftur á tímum þegar ekki allir höfðu aðgang að fersku mati á öllum tímum ársins. Er þetta allt sagan?

Við leitum að Google Ngram Viewer og það eru nokkrar umræður um baka bæði í byrjun og seint á 1800, mikið af nefnum á 1940 og aukin fjöldi tilnefningar á undanförnum tímum (kannski nokkrar baka nostalgíu.) Jæja, það er einhver vandamál með gögnin á sléttu stigi 3. Það er hálendi yfir minnst á 1800s. Vissulega voru ekki jafnmargar neinar sérstakar baka á hverju ári í fimm ár? Það sem er að gerast er það vegna þess að ekki eru mikið af bækur sem birtar eru á þeim tíma og vegna þess að gögnin okkar eru slétt, snýst það um myndina. Sennilega var einn bók sem nefndi edikakaka, og það var bara að meðaltali til að koma í veg fyrir spike. Með því að setja sléttuna á 0, getum við séð að þetta er einmitt raunin. Spike miðstöðvar á 1869, og það er annar hækkun árið 1897 og 1900.

Talaði enginn um edik pies restina af tíma? Þeir sögðu líklega um þær pies. Það voru líklega uppskriftir fljótandi alls staðar. Þeir skrifuðu bara ekki um þau í bókum, og það er takmörkun á þessum Ngram leitum.

Advanced Ngram leitir

Mundu hvernig við sögðum að Ngrams gæti samanstaðið af alls konar mismunandi texta leitum? Google gerir þér kleift að borða nokkuð með Ngram Viewer eins og heilbrigður. Ef þú vilt leita að fiski er sögnin í stað þess að veiða nafnið, þú getur gert það með því að nota merki. Í þessu tilfelli vilt þú leita að "fish_VERB"

Google veitir heill lista yfir skipanir sem þú getur notað og aðrar háþróaðar heimildir á vefsíðunni sinni.