Hvað nákvæmlega er 'stór gögn'?

Og hvers vegna er það stórt mál?

'Big gögn' er ný vísindi til að skilja og spá fyrir um mannlegan hegðun með því að rannsaka mikið magn óreglulegra gagna. Stór gögn eru einnig þekkt sem "sjálfvirk greining".

Greining á Twitter innlegg, Facebook straumar, eBay leitir, GPS rekja spor einhvers og ATM vélar eru nokkur stór gögn dæmi. Að læra öryggisvideo, umferðargögn, veðurmynstur, flugafkomendur, tónleikar fyrir farsíma turn og hjartsláttartæki eru annars konar. Stór gögn eru sóðaleg ný vísindi sem breytast vikulega og aðeins fáir sérfræðingar skilja það allt.

Hvað eru nokkur dæmi um stór gögn í reglulegu lífi?

skjámynd http://project.wnyc.org/transit-time

Þó að flestir stóra gagnaverkefni séu mjög hyljandi, eru vel dæmi um stór gögn sem hafa áhrif á daglegt líf einstaklinga, fyrirtækja og ríkisstjórna:

Spá fyrir veirupróf: með því að rannsaka félags-pólitísk gögn, veður- og loftslagsgögn og sjúkrahús / klínískar upplýsingar, eru þessar vísindamenn nú að spá fyrir um hnúgusýki með 4 vikum fyrirvara.

Múslímaráhorf: þetta stóra gagnaverkefni snið morð fórnarlömb, grunaðir og glæpamenn í Washington, DC. Bæði sem leið til að heiðra hinn látna og sem vitundarsveit fyrir fólk, þetta stóra gagnaverkefni er heillandi.

Transit Travel Planning, NYC: WNYC útvarpstæki forritari Steve Melendez sameina áætlunina á netinu neðanjarðarlestinni með ferðaáætluninni. Sköpun hans leyfir New Yorkers að smella á staðsetningu þeirra á kortinu og spá um ferðatíma fyrir lest og neðanjarðarlest mun birtast.

Xerox dregur úr vinnuafli sínu: Símakennsla er tilfinningalega þreytandi. Xerox hefur rannsakað reim af gögnum með hjálp faglegra sérfræðinga, og nú geta þeir sagt til um hvaða símafyrirtæki hýsa líklega að vera hjá fyrirtækinu lengst.

Stuðningur gegn hryðjuverkum: með því að læra félagsleg fjölmiðla, fjárhagslegar færslur, flugbókanir og öryggisupplýsingar, getur löggæslu spáð og staðsetið hryðjuverkamenn áður en þeir gera óguðlega verk sín.

Aðlaga vörumerki markaðssetningu á grundvelli umfjöllunar um félagslega fjölmiðla : Fólk skiptir skyndilega og fljótt hugmyndum sínum á krá, veitingastað eða líkamsræktarstöð. Það er hægt að læra þessar milljónir félagslegra fjölmiðla og veita endurgjöf til félagsins um hvað fólk hugsar um þjónustu sína.

Hver notar stóra gagna? Hvað gera þeir með því?

Margir monolithic fyrirtæki nota stór gögn til að stilla tilboð þeirra og verð til að hámarka ánægju viðskiptavina.

Af hverju er stór gögn svo stórt samkomulag?

4 hlutir gera stór gögn veruleg:

1. Gögnin eru gríðarleg. Það passar ekki á einum disknum , miklu minna en USB-stafur . Gögnin eru langt umfram það sem mannleg hugur getur skynjað (hugsaðu um milljarð milljarða megabæti og fjölgaðu síðan með fleiri milljörðum).

2. Gögnin eru sóðaleg og óbyggð. 50% til 80% af stóru gagnavinnu er að breyta og þrífa upplýsingarnar þannig að hægt sé að leita og flokka. Aðeins nokkur þúsund sérfræðingar á plánetunni okkar vita að fullu hvernig á að gera þessa gagnahreinsun. Þessir sérfræðingar þurfa einnig mjög sérhæfða verkfæri, eins og HPE og Hadoop, til að gera iðn sína. Kannski í 10 ár munu stóru gagnagagnarfræðingar verða dime a tugi, en nú eru þeir mjög sjaldgæfar tegundir sérfræðingur og verk þeirra eru enn mjög hylja og leiðinlegur.

3. Gögnin verða orðin ** sem hægt er að selja og kaupa. Gögn markaðarins eru þar sem fyrirtæki og einstaklingar geta keypt terabytes af félagslegum fjölmiðlum og öðrum gögnum. Flest gögnin eru skýjabundin, þar sem það er of stórt til að passa á einhvern einn harður diskur. Kaup á gögnum felst venjulega áskriftargjald þar sem þú stinga inn í skýþjónnabýli.

** Leiðtogar stórra gagnatækja og hugmynda eru Amazon, Google, Facebook og Yahoo. Vegna þess að þessi fyrirtæki þjóna svo mörgum milljónum manna með þjónustu sína á netinu, er það vit í að þau séu safnpunktur og sýnendur á bak við stóra gagnagreiningu.

4. Möguleikarnir á stórum gögnum eru endalausar. Kannski munu læknar einn daginn spá fyrir hjartaáfall og heilablóðfall fyrir einstaklinga vikur áður en þau gerast. Hætta á flugvélum og bifreiðum gæti minnkað með fyrirsjáanlegri greiningu á vélrænni gögnum og umferð og veðurmynstri. Online Dating gæti verið bætt með því að hafa stór gögn spá um hver eru samhæfðar persónuleika fyrir þig. Tónlistarmenn gætu fengið innsýn í hvaða tónlistarsamsetningu er mest ánægjulegt að breyta smekk markhópsins. Næringarfræðingar kunna að geta sagt til um hvaða samsetning matvæla sem verslað er með matvæla auki eða hjálpar læknisfræðilegum aðstæðum einstaklingsins. Yfirborðið hefur aðeins verið klóra og uppgötvanir í stórum gögnum gerast í hverri viku.

Stór gögn eru sóðaleg

Monty Rakusen / Getty

Stór gögn eru sjálfvirk greining: umbreyting gríðarlegs óbyggðra gagna í eitthvað sem hægt er að leita og flokka. Þetta er sóðalegt og óskipt pláss sem krefst sérstakrar tegundar þekkingar og þolinmæði.

Taka til dæmis monolithic UPS afhendingu þjónustu. Forritarar í UPS rannsaka gögn frá GPS og snjallsímum ökumanna til að greina skilvirka leiðin til að laga sig að umferðarþrengslum. Þessar upplýsingar um GPS og snjallsímann eru gargantuan og ekki sjálfkrafa tilbúin til greiningar. Þessar upplýsingar eru gefin út úr ýmsum GPS- og kortagagnagrunni með mismunandi tækjum fyrir smartphone vélbúnað. UPS sérfræðingar hafa eytt mánuðum til að umbreyta öllum þeim gögnum í snið sem auðvelt er að leita og flokka. Átakið hefur þó verið þess virði. Í dag hefur UPS sparað meira en 8 milljón lítra af eldsneyti frá því að þeir byrjuðu að nota þessar stóru gagnagreiningar.

Vegna þess að stórar upplýsingar eru sóðalegir og þurfa svo mikla vinnu við að hreinsa upp og undirbúa sig fyrir notkun, hafa gögn vísindamenn orðið kallaðir "gögn umsjónarmenn" fyrir allt leiðinlegt verk sem þeir gera. To

Vísindin um stór gögn og sjálfvirk greining er þó að bæta í hverri viku. Búast við að stór gögn verði aðgengileg öllum fyrir árið 2025.

Er ekki stór gögn í hættu á persónuvernd?

Feingersh / Getty

Já, ef lög okkar og persónuverndarvörn er ekki vandlega stjórnað, þá grípur stórar upplýsingar inn í persónuvernd. Eins og það stendur hafa Google og YouTube og Facebook fylgst með daglegu netnotkun þinni . Snjallsíminn þinn og computing lífið skilur stafrænar fótspor á hverjum degi, og háþróuð fyrirtæki eru að læra þessar fótspor.

Lögin um stórar upplýsingar eru að þróast. Persónuvernd er ástand þess að vera að þú verður nú að taka persónulega ábyrgð á því eins og þú getur ekki lengur búist við því sem sjálfgefið rétt.

Það sem þú getur gert til að vernda friðhelgi þína:

Stærsta einasta skrefið sem þú getur tekið er að hylja dagleg venja þína með VPN-nettengingu . VPN þjónusta mun kramma merkiið þitt þannig að auðkenni þitt og staðsetning sé að minnsta kosti að hluta til hylja frá rekja spor einhvers. Þetta mun ekki gera þig 100% nafnlaus, en VPN mun verulega draga úr hversu mikið heimurinn getur fylgst með venjum þínum á netinu.

Hvar get ég lært meira um stóra gagna?

Monty Raskusen / Getty

Stór gögn eru heillandi hlutur fyrir fólk með greinandi huga og ást í tækni. Ef það er þú, þá heimsækja örugglega þessa síðu af áhugaverðum stórum gagnaverkefnum.