欧美日韩精品在线,国内精品久久久久久久久,一级毛片恃级毛片直播,清纯唯美亚洲综合欧美色

劉德寰:大數(shù)據(jù)的五點(diǎn)思考_網(wǎng)站推廣教程

編輯Tag賺U幣

推薦:利用新浪微博微盤 做擴(kuò)散式的長效營銷
很多人都覺得現(xiàn)在微博營銷很難做,而且活躍用戶受廣告泛濫影響也大幅下降,導(dǎo)致想多幾個真實(shí)的用戶轉(zhuǎn)發(fā)也很困難,其實(shí)不然,只是大部分人覺得微博推廣方法就是要做大量的假

1

本文作者劉德寰系北京大學(xué)傳播學(xué)系教授。

大數(shù)據(jù)不在乎體量有多少,而是背后用它的那個大腦。實(shí)則大眾對大數(shù)據(jù)依然存在不少誤解。劉得寰教授在微博上發(fā)表了其對大數(shù)據(jù)的五點(diǎn)思考(后續(xù)可能還有更新),對近期大數(shù)據(jù)被大眾捧為瑰寶的做法提出了自己不同觀點(diǎn):

任何一個網(wǎng)站的數(shù)據(jù)都是人們互聯(lián)網(wǎng)行為數(shù)據(jù)的很小的一個子集,無論這個子集多么全面,分析多么深入,都是子集,不是全集。對于企業(yè)來講,競爭對手的數(shù)據(jù)價值遠(yuǎn)遠(yuǎn)超過自己網(wǎng)站數(shù)據(jù)的價值,從量級上,對于所有公司都一樣,自己擁有的數(shù)據(jù)遠(yuǎn)遠(yuǎn)小于全集數(shù)據(jù)。看起來的全數(shù)據(jù)恰恰是殘缺數(shù)據(jù)。

數(shù)據(jù)量的大幅增加會造成結(jié)果的不準(zhǔn)確,來源不同的信息混雜會加大數(shù)據(jù)的混亂程度。研究發(fā)現(xiàn):巨量數(shù)據(jù)集和細(xì)顆粒度的測量會導(dǎo)致出現(xiàn)“錯誤發(fā)現(xiàn)”的風(fēng)險(xiǎn)增加。那種認(rèn)為“假設(shè)、檢驗(yàn)、驗(yàn)證的科學(xué)方法已經(jīng)過時”的論調(diào),正是大數(shù)據(jù)時代的混亂與迷茫,人們索性擁抱凱文凱利所稱的混亂。

互聯(lián)網(wǎng)用戶的基本特征、消費(fèi)行為、上網(wǎng)行為、渠道偏好、行為喜好、生活軌跡與位置等,反映用戶的基本行為規(guī)律。體系完整是所有分析性工作的第一步,完整的框架甚至勝過高深的模型。人類的認(rèn)識最大的危險(xiǎn)是不顧后果的運(yùn)用局部知識。如果只關(guān)心自己網(wǎng)站數(shù)據(jù),其分析基礎(chǔ)必然是斷裂數(shù)據(jù)。

現(xiàn)在談到大數(shù)據(jù),基本有四個混亂觀念:第一,大數(shù)據(jù)是全數(shù)據(jù),忽視甚至蔑視抽樣;第二,連續(xù)數(shù)據(jù)就是大數(shù)據(jù);第三,數(shù)據(jù)量級大是大數(shù)據(jù);第四,數(shù)據(jù)量大好于量小。對應(yīng)的是:抽樣數(shù)據(jù)只要抽樣合理,結(jié)論準(zhǔn)確;連續(xù)只是一個數(shù)據(jù)結(jié)構(gòu);大量級的噪音會得出錯誤結(jié)論;大小與價值關(guān)系不大。

大數(shù)據(jù)不是新事物,天氣、地震、量子物理、基因、醫(yī)學(xué)等都是,借鑒他們的方法有益。他們用抽樣調(diào)查。互聯(lián)網(wǎng)數(shù)據(jù)挖掘方法論也如此,不同的是更難,因?yàn)槿说膹?fù)雜性。既然是關(guān)于人的研究就需應(yīng)用所有研究人的方法梳理大數(shù)據(jù)。只要懂編程、懂調(diào)動數(shù)據(jù)的人就可以做大數(shù)據(jù)挖掘的說法是謬誤。

分享:淺談百度知道推廣的側(cè)重點(diǎn)
百度知道作為百度旗下的明星產(chǎn)品,重要性不言而喻,那么百度知道適合于何種形式的推廣呢,百度知道推廣的側(cè)重點(diǎn)在哪里呢?請聽筆者為您細(xì)細(xì)道來。

來源:模板無憂//所屬分類:網(wǎng)站推廣教程/更新時間:2013-05-17
相關(guān)網(wǎng)站推廣教程