中國數據產量占全球10.5%,巨量信息催生“算法創新”
網絡“大數據”,不只“數據大”(“融”觀中國)
——透視“算法”系列報道之一
本報記者 盧澤華
在各類網絡平臺上,“算法”成為一項廣泛應用的技術。通過數據分析和精準推薦,它改變了過去“人找信息”的搜索模式,逐步實現“信息找人”。
關于“算法”,人們觀點不一。有人認為,它方便了用戶,提供了更精準的網絡服務;有人認為,它在“算計”用戶,造成“信息偏食”等問題;還有人認為,作為一項技術,它并無好壞之分,關鍵在于如何用正確價值和規范去駕馭。
自今日起,本版推出“透視‘算法’”系列報道,解讀“算法”帶來的變化與影響。系列報道第一篇,關注大數據時代網民獲取信息習慣的變遷。
現狀
內容更豐富,平臺更多元
“以前遇到問題,第一反應是打開瀏覽器搜一下。現在除了搜索網頁,也會去微信或短視頻平臺找答案。”北京市民王瑛向記者展示了一段短視頻:“你看,前兩天下廚,想做一道魚香肉絲,抖音一找,教學視頻就出來了。”
王瑛今年36歲,從2000年左右開始接觸互聯網。最初10多年,她獲取信息的方式主要有兩種,一是在搜索引擎上檢索,二是瀏覽門戶網站。但最近幾年,這種習慣開始改變。“現在網上信息太多,讓人眼花繚亂,甄別起來比較費力。有時需要特定信息時,在手機軟件中更容易找到結果。”她邊介紹,邊打開手機界面:“比如,想找購物信息,就去淘寶逛逛;想看電影,就去貓眼找找;想了解明星動態,就去微博看看;想獲取專業知識,就去知乎搜搜……”
在王瑛看來,這種改變是不知不覺形成的。每天頻繁使用各類手機軟件,“順手搜一下”并不費力。久而久之,就形成了用多個平臺搜索信息的習慣。最重要的是,“搜”完之后,手機應用會記住自己的需求,主動推薦感興趣的信息,省時省力。
王瑛的用網經歷具有一定代表性。記者針對120名用戶的搜索行為作了一項小型調研,結果顯示:所有人均有使用搜索引擎的習慣,但將其作為唯一選擇的僅占15%。多數人表示,自己會在各類手機應用中檢索信息,并時常瀏覽各平臺推薦的信息。比如,獲取生活經驗類信息,很多人都會選擇刷短視頻,“遇事不決,視頻來學”。
行業數據也印證了這一點。截至2023年6月,中國搜索引擎用戶規模已達8.41億人。但近七成用戶也會通過短視頻完成搜索,微信“搜一搜”月活躍用戶也已超過8億,幾乎與搜索引擎用戶總量相當。另一項調查也顯示,用戶平均每天會在 3.8個平臺上搜索信息。
挑戰
信息雜蕪與“平臺壁壘”
雖然網上信息量更大了,獲取信息的渠道更多了,但不少用戶仍表示“存在使用體驗不佳的情況”。
信息雜蕪是原因之一。“現在網上營銷信息較多,雖然大多標注了‘廣告’字樣,但畢竟需要甄別,影響使用效率。”王輝是一名金融分析師,經常需要在網上檢索信息,且對信息質量要求較高。但他發現,現在找到一張“純凈的網頁”非常困難,這在一定程度上拖慢了他的工作節奏。
王輝的情況并非個例。記者調查發現,在網上檢索信息時,顯示結果中很多都是廣告鏈接。比如,搜索“培訓”二字,排名最靠前的兩個結果均為商業培訓機構廣告。
據了解,各大搜索網站也都注意到這個問題,但如何改變行之有年的商業模式,還是個尚待破解的命題。“廣告是網站主要盈利來源,目前業界只能盡量優化廣告信息,提升用戶體驗,但要徹底轉型,還需一定時間探索。”一家互聯網公司的銷售經理告訴記者。
除了信息雜蕪,互聯網界還不同程度存在“平臺壁壘”現象。
據了解,過去,綜合類搜索網站是各類網絡平臺獲取流量的主要入口,通過一個搜索框、一個關鍵詞,用戶可以搜到全網各個平臺的信息。而隨著移動互聯時代來臨,美食、家居、旅游、短視頻等垂直平臺用戶規模越來越大,每個平臺都形成了自己獨有的“大數據庫”,這個“大數據庫”不僅包含海量優質信息,還囊括了用戶使用習慣等數據。動輒坐擁上億用戶的網絡平臺不再需要其他平臺“引流”,這些數據便被視為獨家資源,不再對外開放。這導致用戶很難通過綜合類平臺搜到所有需要的信息。
趨勢
向智能化與精準化發展
如今,中國已經成為數據量最大、數據類型最豐富的國家之一。國家數據局日前發布的信息顯示:我國數據產量已占全球數據總量的10.5%。更有研究機構預測,到2025年,中國數據總量或占全球近30%。
“數據作為新型生產要素,已快速融入生產、分配、流通、消費和社會服務管理等各環節,但目前在發展過程中也存在數據應用潛力釋放不夠、數據供給質量不高、流通機制不暢等問題。”國家數據局副局長沈竹林表示。
在這一背景下,僅僅“數據大”已經無法滿足社會需要,還要進一步實現“數據精”“數據準”,從而有效降低用戶獲取信息成本,提供更加個性化、精細化的內容服務。在這種需求驅動下,“算法”技術應運而生。
“算法”是人工智能技術與大數據技術的關聯節點。中國科學院科技戰略咨詢研究院院長潘教峰認為,人工智能正在科研、貿易、交通、醫療等諸多場景中改變人們溝通的方式。其“活字典”、移動的“大百科全書”的特性,加上越來越接近人類水平的語言理解和生產能力,讓其“答復”既有常識性,又呈現出集成創新性。
因此,在互聯網海量數據基礎上,“算法”可以通過人工智能技術對用戶興趣偏好和需求進行分析歸納,描繪出用戶畫像,打上特性“標簽”,進而以此為依據,進行精準化、個性化的定制推薦。
在“算法”技術的調配下,用戶每次打開手機應用,都可以收到針對個人需求的信息推送。同時,平臺通過不間斷收集信息,會變得越來越“懂”用戶——打開購物網站,近期想要購買的產品已被推薦到首頁;進入短視頻平臺,接踵而至的都是自己喜歡的視頻內容;瀏覽旅游軟件,想去的地方一一列在眼前,連機票購買鏈接都放好了……這一切,正是憑借日漸成熟的算法技術才得以實現。
然而,有人擔心,“算法”在大數據時代精準調配網絡信息、提升服務水準的同時,也帶來了“信息偏食”、網絡沉迷、數據泄露、技術濫用等隱患。這些問題多大程度存在?又有哪些破解之道?我們將在“透視‘算法’”系列報道第二篇進行解讀,請大家持續關注。(人民日報海外版)
請輸入驗證碼