人在失眠的時候都愛看些什么?
哪個地方最盛產“吃貨”?
男人與女人的閱讀興趣有什么差別?
貓和狗誰是寵物之王?
關心馬云的人還在關心什么?
你可能不會想到,這些問題可以通過一個新聞客戶端找到答案。
今日頭條在過去兩年多時間里,積累了2.2億用戶的使用習慣。通過算法和大數(shù)據的結合,將收集到的數(shù)據再反饋應用到平時的“個性化新聞推薦”中——這樣,就產生了你點開今日頭條客戶端后看到的自己感興趣的新聞。
每天超過200萬用戶在今日頭條上閱讀自己感興趣的文章,這些用戶的每一次刷新、點擊對今日頭條而言就意味著海量數(shù)據。
用戶在手機上的每一次觸摸、刷新,都轉換成了數(shù)據存儲在服務器里。這些數(shù)據不僅記錄了用戶的顯性喜好,其背后也常常蘊藏許多有趣的結論。
而在大數(shù)據的基礎上,基于數(shù)據挖掘的推薦引擎產品,加之一定的算法,今日頭條可以通過轉發(fā)、評論和好友關系,將你歸類為其中某個人群。通過對數(shù)據的深度挖掘,今日頭條不僅能夠為每一個人按興趣推薦信息,還能夠從宏觀的角度得到大眾群體的閱讀趨勢。
在你每天打開各種新聞客戶端的時候,你可能不會意識到,這一次次的點擊已經無形中影響到了你以后的生活。
之后你會無意中發(fā)現(xiàn),與你興趣點相關的新聞會出現(xiàn)的越來越多,而含有你不太關注閱讀標簽的文章出現(xiàn)的次數(shù)則越來越少。
從這一點上說,機器可以比你更懂你自己。
今日頭條CEO張一鳴也認同這樣的看法,他想象中的下一個5年,物理世界中產生的信息會越來越多的投映到虛擬世界中,越來越多的數(shù)據會被記錄下來,計算機也會越來越懂我們。
“今日頭條的后臺系統(tǒng)每天觀察2000萬用戶的使用行為,每天觀察100億條日志,能夠知道最新資訊在不同人群中受歡迎的程度。從獲取數(shù)據的角度來說,機器更像整個世界共享一個大腦,視角并不是觀察你個人。”張一鳴說。
北京大學新聞與傳播學院的教授陳剛認為,在海量數(shù)據基礎上的發(fā)展的今日頭條,現(xiàn)階段主要為用戶提供基于信息的服務,而將來,它將從信息服務走向移動生活服務。
張一鳴也表示,未來5年,今日頭條會將更多種類信息以更豐富的形式呈現(xiàn)給用戶,在更多場景下給用戶更好的推薦。與不同族群的用戶產生更多交流跟互動,也是重要的嘗試方向。未來的今日頭條可能會變成能夠連接更多O2O的服務“今日生活”。
當人們討論“技術改變生活”的時候,可能沒有進一步理解其中的深意。技術將人的行為轉化為數(shù)據并記錄人的生活習慣,之后可以進一步理解人。
“在不遠的未來,機器和技術的進步也必定會在越來越多的領域解放人腦,便利人們生活的每個角落。這會帶來一個更加美好的世界?!边@是張一鳴定義的未來。
但是機器學習能帶來更加美好的世界還是更加可怕的世界?這個問題還有待驗證。