亚洲av日韩综合一区二区三区 _亚洲福利一区二区_精品国产一区二区三区不卡在线 _日韩精品一区二区三区视频

不信謠不傳謠 講文明樹新風 網絡安全
首頁 經濟 通信科技

數據挖掘大戰 機器怎么做到“見信如面”

2018-04-09 15:39 來源: 科技日報 責任編輯:fl
發送短信 zmdsjb 10658300 即可訂閱《駐馬店手機報》,每天1毛錢,無GPRS流量費。

摘要:原標題:數據挖掘大戰 機器怎么做到“見信如面”大數據殺熟?隱私換便捷?一度被熱捧的大數據挖掘,近日站在了輿論的風口浪尖:一些商家利用大數據挖掘技術&ldqu

原標題:數據挖掘大戰 機器怎么做到“見信如面”

大數據殺熟?隱私換便捷?一度被熱捧的大數據挖掘,近日站在了輿論的風口浪尖:一些商家利用大數據挖掘技術“殺熟”被網友親測證實;百度董事長兼CEO李彥宏一句“中國人對隱私問題沒有那么敏感”,更是讓它的處境雪上加霜。大數據挖掘技術就像一位有了負面新聞的明星,霎時間光彩暗淡,似乎變成了偷人隱私的小賊。

《大數據時代》一書暢銷之后的幾年,大數據雖不再那么當紅,但并未隱退,它的持續發展已成為人工智能得以實現的基礎之一。

那么,大數據挖掘究竟是怎樣的技術?從誕生發展至今,那些埋頭苦干的技術人員又讓它長了哪些本領?面對大數據難以管理的問題,有沒有技術手段加以控制?

用戶畫像:機器給人類貼標簽

“通過打標簽的方式建立用戶畫像,是數據挖掘常用的一種技術。”北京大學計算機科學技術研究所多媒體信息處理研究室主任彭宇新教授解釋,建立用戶畫像就是利用社交網絡的信息,根據用戶社會屬性、生活習慣和消費行為等信息,抽象出一個標簽化的用戶模型,目標是使機器實現類似于人的“見信如面”的能力。社交網絡數據是實現這一目標的基礎,機器對人的“初相見”多是源自于對社交網絡數據的挖掘。

標簽,通常是通過對用戶信息進行分析得到的高度精煉的特征標識,使得機器方便做信息提取、聚合分析等處理。標簽本身無需再做過多文本分析等處理工作,這為利用機器提取標準化信息提供了便利。

“有了標簽,計算機就能夠自動處理與人相關的信息,能夠通過算法、模型逐步‘理解’ 人。”彭宇新介紹,多個標簽共同完成畫像,整個過程可分三步走:一是采集數據,即基于文本的信息抓取,口語稱為“爬數據”;二是用戶行為建模,通過機器學習技術,形成算法模型,判斷用戶可能的一些行為;三是可視化展現,把機器運算出來的結果,通過能讓人類理解的方式展現出來。這三步是多輪調整的,在實際應用中,根據結果的反饋,以及業務需求,可能進行二次建模等調整。

整個過程的影響參數是相對多元的,不同的行為類型,對于標簽信息的權重影響也不同。以應用最廣的商品營銷為例,比如網售紅酒,如果“購買”權重計為5,僅“瀏覽”計為1,加上瀏覽間隔、駐留時長、生活習慣等,通過復雜的算法最終呈現出一個標簽的權重,再形成畫像。

基于用戶畫像技術,大數據挖掘進行分類和關聯規則計算等分析:例如喜歡紅酒的用戶有多少,喜歡紅酒的人群中,男、女比例是多少,喜歡紅酒的人通常喜歡什么運動品牌等等。

跨媒體智能識別:為計算機裝上慧眼

“以前文本信息占主流,現在圖像、視頻等多媒體數據鋪天蓋地而來。”彭宇新說,后者目前占據大數據的80%以上。

數據類型發生的巨大變化,使得智能識別的任務更加艱巨。“管不住”和“用不好”的問題日益凸顯。“機器只能讀懂自己的語言。”彭宇新說,人類世界的所有語言都要轉化為機器理解的語言才能被識別,以前只處理文本相對簡單,而現在要加上復雜的圖像、視頻等數據。

“例如,世界上有數千種鳥類,很多種的差異非常細微,即使是有專業知識的人類也很難準確辨認,計算機自動識別的難度就更大了。”彭宇新說,圖像、視頻內容理解的難點在于如何進行語義自動識別,這也是他們團隊多年攻關的課題之一,為此團隊發明了基于注意力模型和深度增量學習的識別方法。

注意力模型,顧名思義是讓計算機自動定位圖像的顯著性區域,以此提高檢測精度;深度增量學習,是指計算機能夠利用已經學到的知識加速對新知識的學習,同時通過動態擴容以支持新概念的檢測。

新模型新算法的發力,幫助機器快速識別圖像、視頻的語義信息。彭宇新團隊近年來六次參加國際權威評測TRECVID的視頻樣例搜索比賽均獲第一名,并在與卡內基梅隆大學、牛津大學、IBM Watson研究中心等參賽隊伍的較量中勝出。其中一個題目就是在464個小時的視頻中快速準確地找出所有的倫敦地鐵標志,彭宇新團隊僅用了不到1秒就成功勝出,獲得第一名。

單媒體信息的分析與識別之上,如何進一步讓機器像人類一樣能看、能理解呢?

為達到跨媒體信息融合與一體化分析識別的目的,項目團隊首先把數據按照不同媒體類型自動分發到對應的分析與識別模塊。例如,對視頻鏡頭進行分割、對關鍵幀進行提取,然后分發到鏡頭檢索、片斷檢索、視頻字幕識別等模塊中,對單媒體分析結果進行跨媒體語義關聯分析,實現跨媒體信息的語義協同。“一種常用的方法是構建第三方空間進行跨媒體關聯。”彭宇新說,“計算機根據我們教它的模型分別為圖像、視頻、文本、音頻抽取表征,再共同投射到一個第三方空間中,這樣不同媒體的信息就可以對話了。”

技術的“抽絲剝繭”,讓圖像、視頻中的信息可以如文本一般精確透明。“我們是瞄著應用去的,準確率、處理速度都經過多年的優化,已經可以進行實際應用了。”彭宇新介紹,這項技術不僅幫助新聞媒體等行業進行數據管理和檢索,還在助力互聯網管理部門對大數據進行分析與監測。

延伸閱讀

匿名處理:可預期的隱私保護對策

打破信息控制權幾乎不可能,但隱私保護卻有個很便捷的方法。北京郵電大學教授楊義先的《安全簡史》中有個形象的比喻,如果數據在網上“裸奔”,為了不被溯源,最便捷的安全手段是“把臉捂住”。這就是所謂的“匿名化處理機制”。

“用戶隱私保護的相關規定要求,數據公司在售賣數據時,需要對數據進行匿名化處理。”北京大學計算機科學技術研究所研究員趙東巖說。但為了精準定位、推送服務,匿名化處理可能被忽視。“精準意味著目標客戶群的ID指向,而不是向群體發送,因此,個性化推送和匿名化處理在目前的技術中是相互沖突的。”

針對上面的沖突,業界的先行者提出一種區塊鏈的解決思路。“我稱它為OF ID。”北京領主科技公司研究人員劉偉泰說,“大數據的本質是群體研究,但是群體粒度可以細一些,此外,區塊鏈技術可以授予用戶授權的方法。”

不難想象,隨著新技術的不斷創新,會有更多用于信息安全的技術突破,不是一門心思用于大數據挖掘,而是也能用于制衡“信息控制權”。

 

責任編輯:fl

(原標題:科技日報)

查看心情排行你看到此篇文章的感受是:


  • 點贊

  • 高興

  • 羨慕

  • 憤怒

  • 震驚

  • 難過

  • 流淚

  • 無奈

  • 槍稿

  • 標題黨

版權聲明:

1.凡本網注明“來源:駐馬店網”的所有作品,均為本網合法擁有版權或有權使用的作品,未經本網書面授權不得轉載、摘編或利用其他方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:駐馬店網”。任何組織、平臺和個人,不得侵犯本網應有權益,否則,一經發現,本網將授權常年法律顧問予以追究侵權者的法律責任。

駐馬店日報報業集團法律顧問單位:上海市匯業(武漢)律師事務所

首席法律顧問:馮程斌律師

2.凡本網注明“來源:XXX(非駐馬店網)”的作品,均轉載自其他媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。如其他個人、媒體、網站、團體從本網下載使用,必須保留本網站注明的“稿件來源”,并自負相關法律責任,否則本網將追究其相關法律責任。

3.如果您發現本網站上有侵犯您的知識產權的作品,請與我們取得聯系,我們會及時修改或刪除。

返回首頁
相關新聞
返回頂部
亚洲av日韩综合一区二区三区 _亚洲福利一区二区_精品国产一区二区三区不卡在线 _日韩精品一区二区三区视频

              欧美揉bbbbb揉bbbbb| 欧美电影免费| 久久蜜桃av一区精品变态类天堂| 欧美大片在线影院| 国产精品永久入口久久久| 中文欧美字幕免费| 久久综合色播五月| 国产精品蜜臀在线观看| 亚洲影院高清在线| 欧美大片在线观看| 国产一区二区在线观看免费播放 | 午夜精品久久久久久久| 欧美高清影院| 国产一二精品视频| 久久精品国产一区二区三区| 欧美日韩免费一区二区三区| 在线观看av一区| 久久婷婷蜜乳一本欲蜜臀| 国产精品黄视频| 午夜视频在线观看一区二区| 欧美人成在线| 亚洲视频在线一区| 欧美激情自拍| 亚洲视频你懂的| 欧美日韩mp4| 亚洲宅男天堂在线观看无病毒| 欧美福利在线| 在线日韩中文字幕| 欧美日韩黄视频| 亚洲一区二区三区免费视频| 欧美激情一区二区三区高清视频| 影音先锋成人资源站| 欧美国产日本韩| 亚洲午夜久久久久久久久电影网| 欧美激情 亚洲a∨综合| 在线观看日韩国产| 欧美日韩高清区| 小黄鸭视频精品导航| 国产精品国产三级国产aⅴ无密码| 欧美一区二区成人| 国产伦精品一区| 乱码第一页成人| 在线国产日韩| 欧美三级电影一区| 欧美在线视频免费播放| 国产欧美精品久久| 欧美成熟视频| 亚洲综合首页| 午夜精品999| 久久天天躁狠狠躁夜夜爽蜜月| 国产精品一区二区视频| 久久久人成影片一区二区三区| 国产三级精品三级| 欧美电影免费观看网站| 亚洲图片欧美午夜| 国产精品久久久久永久免费观看| 久久精品国产99国产精品澳门| 国产午夜精品理论片a级探花| 欧美va天堂在线| 亚洲淫性视频| 国产精品一区免费观看| 欧美α欧美αv大片| 亚洲综合二区| 国产欧亚日韩视频| 欧美不卡一区| 欧美一区二区三区在线观看视频| 国产日韩精品电影| 欧美屁股在线| 久久免费观看视频| 亚洲一区国产视频| 国产日韩精品一区二区浪潮av| 欧美14一18处毛片| 欧美一区二区三区在线观看| 国产亚洲aⅴaaaaaa毛片| 欧美久久久久久久久| 久久精品欧美日韩| 亚洲深夜福利在线| 国产欧美日韩亚洲| 欧美精品一区二区三区很污很色的| 欧美在线一二三| 黄色一区三区| 国产精品日韩在线观看| 欧美成年人视频| 久久国产欧美日韩精品| 亚洲一区二区三区乱码aⅴ| 国产伦理一区| 欧美午夜理伦三级在线观看| 欧美成人福利视频| 久久久欧美一区二区| 亚洲在线视频观看| 黄色日韩网站视频| 国产欧美日韩免费| 欧美午夜影院| 欧美精品在线视频| 免费久久精品视频| 久久久久这里只有精品| 性欧美激情精品| 亚洲一区观看| 在线免费观看欧美| 国语自产精品视频在线看8查询8| 国产精品久久综合| 欧美视频亚洲视频| 欧美精品一区二区三区高清aⅴ| 久久婷婷麻豆| 久久久久久久综合日本| 小黄鸭精品aⅴ导航网站入口| 亚洲视频第一页| 伊人久久亚洲热| 国外视频精品毛片| 国产视频久久久久| 国产乱码精品一区二区三区不卡| 国产精品成人在线| 欧美天天视频| 欧美日韩影院| 欧美视频中文字幕在线| 欧美日韩精品一区二区在线播放 | 1024亚洲| 韩国欧美一区| 国产亚洲精久久久久久| 国产精品私拍pans大尺度在线| 欧美四级在线观看| 欧美视频免费在线观看| 欧美午夜免费电影| 国产精品www| 国产精品美女一区二区| 国产精品美女主播| 国产精品一区二区久久久| 国产精品久久久久久久电影| 国产精品高清在线观看| 国产精品美女久久久久久免费 | 一区二区三区在线免费观看| 国产一区日韩欧美| 国内精品久久久久久影视8| 国内精品伊人久久久久av影院| 国内精品久久久久久久97牛牛| 韩国精品在线观看| 中文国产一区| 午夜宅男欧美| 久久久精品国产99久久精品芒果| 久久久久久久97| 老司机久久99久久精品播放免费| 美女脱光内衣内裤视频久久网站| 欧美成人xxx| 欧美日韩一区二区三区在线视频| 欧美亚一区二区| 国产女优一区| 伊人久久婷婷| 亚洲欧美日韩一区二区| 欧美一区二区三区四区在线观看地址 | 国产精品久久999| 国产嫩草一区二区三区在线观看 | 国产精品99久久久久久白浆小说| 伊人色综合久久天天| 亚洲午夜久久久久久久久电影院 | 韩国亚洲精品| 在线视频观看日韩| 亚洲欧美综合精品久久成人| 久久福利电影| 欧美福利在线| 国产精品国产亚洲精品看不卡15| 国产欧美日韩麻豆91| 在线观看成人网| 亚洲欧美一区二区激情| 久久久久看片| 欧美日韩网站| 国产亚洲精品aa午夜观看| 宅男噜噜噜66一区二区| 欧美亚洲在线| 免费在线日韩av| 欧美日韩伦理在线| 国产欧美视频一区二区三区| 一区二区视频欧美| 香蕉免费一区二区三区在线观看 | 欧美韩日一区| 国产精品视频免费观看www| 好男人免费精品视频| 亚洲一区视频在线| 久久综合电影一区| 欧美视频亚洲视频| 国内精品久久久久国产盗摄免费观看完整版| 中文在线一区| 久久蜜桃资源一区二区老牛| 欧美日韩精品欧美日韩精品一| 国产午夜精品在线观看| 午夜欧美大片免费观看| 欧美高清视频一区二区| 国产精品资源| 亚洲已满18点击进入久久| 狼人社综合社区| 国产精品国产三级国产aⅴ无密码| 国产一区深夜福利| 久久成人综合视频| 欧美日韩亚洲在线| 伊伊综合在线| 久热爱精品视频线路一| 国产精品拍天天在线| 亚洲一区亚洲| 欧美黄色大片网站| 国产一区视频观看| 久久蜜臀精品av|